Intervalli di confidenza 2

  • Upload
    edomrg

  • View
    212

  • Download
    0

Embed Size (px)

Citation preview

  • 8/14/2019 Intervalli di confidenza 2

    1/15

    Intervalli di confidenza

    Francesco Lagona

    1 Introduzione

    Questa dispensa riassume schematicamente i principali risultati discussi alezione sulla costruzione di intervalli di confidenza.

    2 Intervalli di confidenza per la media di unapopolazione

    Supponiamo di aver a che fare con una variabile statistica quantitativa X chesi distribuisce nella popolazione di riferimento con media e varianza 2. Sidesidera costruire un intervallo di confidenza per al livello 1 sulla basedi un campione casuale semplice

    (x1 . . . xn)

    di dimensione n. E necessario distinguere il caso in cui la varianza dellapopolazione 2 e nota da quello in cui tale varianza e incognita.

    2.1 Varianza nota

    Si tratta di un caso abbastanza raro nelle applicazioni, ma in certe circostanzee possibile che indagini precedenti a quella effettuata rendano possibile unaconoscenza esatta della varianza 2. La costruzione di un intervallo di confi-

    denza per sotto lassunzione di varianza nota, si basa sul seguente risultato:la media campionaria

    x =1

    n

    ni=1

    xi

    e una variabile aleatoria che si distribuisce approssimativamente come unanormale

    N(,2

    n)

    1

  • 8/14/2019 Intervalli di confidenza 2

    2/15

    e tale approssimazione migliora allaumentare della dimensione campionaria

    n.Se dunque usiamo la media campionaria come stimatore della media della

    popolazione, il fatto che la sua distribuzione sia centrata sul valore vero delparametro indica che x e uno stimatore non distorto. Inoltre, il rapporto2

    n misura la precisione dello stimatore: come ci si potrebbe aspettare, taleprecisione e tanto minore quanto piu elevata e la varianza 2 e tanto maggiorequanto piu elevata e la dimensione campionaria n.

    In taluni casi, la variabile X si distribuisce esattamente come una nor-male: solo in queste circostanze x si distribuisce esattamente secondo lanormale N(, 2/n). In tutti gli altri casi, la distribuzione della mediacoampionaria e solo approssimata e dunque i risultati che seguono valgo-no in modo approssimato, sebbene e importante ricordare che la qualitadellapprossimazione migliora al crescere di n.

    Dal fatto che x N(, 2/n), si deduce che

    x 2

    n

    N(0, 1).

    Per ogni valore di probabilita 1 , possiamo allora scrivere che

    P(z/2 x

    2n z/2) = 1

    dove z/2 e il quantile della normale di ordine 1 /2, ovvero il punto chesi lascia a sinistra unarea sotto la normale pari a 1 /2. Ad esempio, se1 = 0.95, allora z/2 = 1.96 (il calcolo del quantile z/2 corrispondenteal livello di probabilita 1 va compiuto usando le opportune tavole o unPC).

    Un intervallo di confidenza puo allora essere costruito sulla base dellaseguente catena di uguaglianze:

    1 = P(z/2 x

    2n

    z/2) = 1

    = P(z/2

    2

    n x z/2

    2

    n)

    = P(x z/2

    2

    n x + z/2

    2

    n)

    = P(x z/2

    2

    n x + z/2

    2

    n)

    2

  • 8/14/2019 Intervalli di confidenza 2

    3/15

    In altre parole, e approssimativamente uguale a 1 la probabilita che i due

    estremi dellintervallo x z/2

    2

    n, x + z/2

    2

    n

    contengano il valore vero della media della popolazione.Quello appena costruito e un intervallo di confidenza per la media al

    livello 1. Il valore 1 indica il livello di copertura fornito dallintervallo:esiste sempre una probabilita pari ad che i dati campionari provengano dauna popolazione con una media che si trova al di fuori dellintervallo.

    Si osservi che lintervallo che abbiamo costruito e centrato sulla stima

    puntuale della media x e ha un raggio pari a

    z/2

    2

    n

    la cui lunghezza dipende sia dal livello di copertura desiderato (da cui dipendeil quantile z/2), sia dal grado di precisione dello stimatore misurato dallaquantita

    2

    nmeglio nota come errore standard della stima.

    Come applicazione numerica, consideriamo il seguente esempio.Esempio Da informazioni derivanti da una precedente analisi, si sa che ladurata delle telefonate che arrivano ad un call center si distribuisce con unavarianza pari a 2 = 16 minuti quadrati. Si vuole calcolare un intervallo diconfidenza al livello 1 = 0.95 per la durata media delle telefonate. Atale scopo, si estrae un campione di n = 10 telefonate che fornisce le seguentidurate:

    7.36, 11.91, 12.91, 9.77, 5.99, 10.91, 9.57, 11.01, 6.11, 12.12

    Il calcolo dellintervallo desiderato e a questo punto piuttosto semplice: sicalcola dapprima la media campionaria ed il suo errore standard

    x = 9.7662

    n=

    16

    10=1.265

    Se inoltre 1 = 0.95, il quantile desiderato e dato da

    z0.025 = 1.96

    3

  • 8/14/2019 Intervalli di confidenza 2

    4/15

    per cui il raggio dellintervallo e dato da

    z0.025

    16

    10= 2.479

    e lintervallo e dunque dato da

    (9.766 2.479, 9.766 + 2.479) = (7.287, 12.245).

    2.2 Varianza incognita

    Nella maggior parte delle applicazioni, e difficile avere una stima attendibiledella varianza 2 della popolazione e si preferisce in genere stimarla sulla

    base del campione estratto. Una stima non distorta della varianza dellapopolazione e data da

    2 =1

    n 1

    ni=1

    (xi x)2 =

    n

    n 1

    1

    n

    ni=1

    x2i x2

    che non e altro che la varianza campionaria corretta dal fattore nn1 . Talecorrezione dipende dal fatto che, per piccoli campioni, la varianza campionar-ia e uno stimatore distorto della varianza della popolazione, cioe la sua dis-tribuzione campionaria non ha come valore atteso il valore vero del parametro2. Per grandi campioni, il fattore di correzione nn1 1 e dunque lu-

    so della varianza campionaria fornisce stime attendibili della varianza dellapopolazione.

    In questo caso, per costruire un intervallo di confidenza della media della popolazione, occorre utilizzare il fatto che la distribuzione della variabilealeatoria

    x 2

    n

    segue approssimativamente quella di una t di Student con n 1 gradi diliberta, dove n e la dimensione del campione estratto e che tale approssi-mazione migliora allaumentare di n. La distribuzione t di Student e molto

    simile a quella di una normale standardizzata. Essa e infatti centrata sullo0 e simmetrica rispetto ad esso. Si differenzia dalla distribuzione normalein quanto ha delle code piu pesanti, ovvero valori lontani dallo 0 hannouna probabilita di essere estratti piu elevata di quella che avrebbero avuto sefossero stati estratti da una normale standardizzata. Tali differenze si atten-uano sempre piu allaumentare della numerosita campionaria, per cui quandon e molto elevato, si puo utilizzare la distribuzione normale standardizzatain luogo della t.

    4

  • 8/14/2019 Intervalli di confidenza 2

    5/15

    La costruzione dellintervallo di confidenza segue linee analoghe a quelle

    mostrate nella sezione precedente. Si indichi pertanto con tn1,/2 il quantiledi ordine 1 /2 di una t di Student di n 1 gradi di liberta, ovvero ilpunto che si lascia a sinistra unarea sotto la t pari a 1 /2. Ad esempio,se 1 = 0.95 e il campione ha numerosita n = 10, allora tn1,/2 = 2.262(il calcolo del quantile tn1,/2 corrispondente al livello di probabilita 1 va compiuto usando le opportune tavole o un PC).

    Un intervallo di confidenza puo allora essere costruito sulla base dellaseguente catena di uguaglianze:

    1 = P(tn1,/2 x

    2n

    tn1,/2) = 1

    = P(tn1,/2

    2

    n x tn1,/2

    2

    n)

    = P(x tn1,/2

    2

    n x + tn1,/2

    2

    n)

    = P(x tn1,/2

    2

    n x + tn1,/2

    2

    n)

    In altre parole, e approssimativamente uguale a 1 la probabilita che i dueestremi dellintervallo

    x tn1,/2

    2

    n, x + tn1,/2

    2

    n

    contengano il valore vero della media della popolazione.Considerando lesempio precedente sulle durate delle telefonate, un in-

    tervallo di confidenza costruito stimando la varianza della popolazione allivello 1 = 0.95 puo essere costruito stimando dapprima la varianza dellapopolazione

    2 =n

    n 1

    n

    i=1

    (xi x)2

    =

    10

    95.633 = 6.259

    calcolando poi lerrore standard della stima2

    n=

    6.259

    10= 0.791

    e infine il raggio dellintervallo dato da:

    t9,0.025

    2

    n= 2.262 0.791 = 1.789.

    5

  • 8/14/2019 Intervalli di confidenza 2

    6/15

    Si osservi come il raggio di questo intervallo di confidenza e minore di quello

    trovato nella sezione precedente: la ragione risiede nel fatto che il campioneha fornito una stima della varianza inferiore alla varianza vera della popo-lazione (la dimensione campionaria deve essere sufficientemente elevata perdare stime affidabili della varianza della popolazione). Ne segue un intervallodi confidenza piu stretto di quello trovato in precedenza:

    (9.766 1.789, 9.766 + 1.789) = (7.977, 11.555).

    3 Calcolare la numerosita campionaria

    Lampiezza dellintervallo di confidenza per la media di una popolazione edata dad = 2z/2

    2/n

    nel caso di varianza nota. E facile osservare che, a parita del livello 1 scel-to per lintervallo di confidenza e della varianza nella popolazione, lampiezzadellintervalo dipende dalla dimensione campionaria n, al crescere della qualelampiezza si riduce.

    In molti casi applicativi, la dimensione campionaria n e fissata in parten-za e dipende dal budget a disposizione per lestrazione del campione. In altricasi (ad esempio in test clinici o in controllo della qualita) e piu importante

    fissare lampiezza d

    che lintervallo non puo superare e determinare la di-mensione campionaria minima n che garantisce tale requisito, cioe tale percui quando n < n si ottiene un intervallo con ampiezza d > d (ovviamente,per tutti gli n > n si ottiene un intervallo con ampiezza d < d).

    Per effettuare il calcolo di n e sufficiente osservare che se deve essere

    2z/2

    2

    n d

    allora

    2

    n

    d

    2z/2ovvero

    2

    n

    d

    2z/2

    2o infine

    2z/2d

    2 n (1)

    6

  • 8/14/2019 Intervalli di confidenza 2

    7/15

    In altre parole, per ottenere un intervallo di confidenza di unampiezza non

    superiore a d

    , e necessario considerare il minimo intero n che verifica la (1),ovvero

    n =

    2z/2

    d

    2

    dove con x indichiamo il piu piccolo intero superiore ad x (ad esem-pio: 4.1 = 5; la funzione x si chiama cielo di x). Come applicazionenumerica, consideriamo il seguente esempio.Esempio Da informazioni derivanti da una precedente analisi, si sa che ladurata delle telefonate che arrivano ad un call center si distribuisce in modoapprossimativamente normale con media incognita e varianza 2 = 16

    minuti quadrati. Si desidera calcolare la dimensione campionaria minimanecessaria per costruire un intervallo della durata media delle chiamate allivello 95% che abbia unampiezza massima di 5 minuti. La dimensionerichiesta e data da

    n =

    2z/2

    d

    2=

    2 4 1.96

    5

    2= 9.83 = 10

    Si osservi che la conoscenza di 2 e cruciale per la determinazione delladimensione campionaria ottimale. Quando la varianza della popolazione eincognita, si usa considerare un valore cautelativo per 2, ponendo paria 4 o 6 volte il campo di variazione atteso per la variabile di interesse. Adesempio, se pensiamo che le telefonate al call center possano durare da unminimo di 0 minuti ad un massimo di 30 minuti, utilizzeremo 2 = (4 30)2

    o 2 = (6 30)2. Naturalmente ci si aspetta che la varianza abbia valori piubassi, ma e meglio utilizzare una dimensione campionaria troppo elevata cheuna troppo bassa.

    4 Intervalli di confidenza per proporzioni

    Supponiamo di aver a che fare con una variabile statistica dicotomica X chesi distribuisce nella popolazione di riferimento secondo la tabella di frequenzerelative

    x0 1 1

    1

    7

  • 8/14/2019 Intervalli di confidenza 2

    8/15

    dove indica la proporzione (incognita) degli individui che posseggono la

    modalita 1.Si desidera costruire un intervallo di confidenza per al livello 1 sulla

    base di un campione casuale semplice

    (x1 . . . xn)

    di dimensione n. Come vedremo, non e qui necessario distinguere casi diversi,poiche la precisione dello stimatore che utilizzeremo per dipende comunquedal valore incognito assunto da .

    La costruzione dellintervallo si basa sul seguente risultato: la frequenzarelativa campionaria

    = x = 1n

    ni=1

    xi

    e una variabile aleatoria che si distribuisce approssimativamente come unanormale

    N(,(1 )

    n)

    e tale approssimazione migliora allaumentare della dimensione campionarian. La frequenza relativa campionaria non e altro che una media cam-pionaria, essendo le osservazioni dicotomiche. Continueremo tuttavia a farriferimento a invece che a x per tenere ben distinto il caso di stima di medie

    da quello di stima di proporzioni (per la verita non si tratta di casi distinti,ma queste sono questioni da risolvere in eventuali futuri corsi di statisticasuccessivi a questo).

    Se dunque usiamo come stimatore di , il fatto che la sua distribuzionesia centrata sul valore vero del parametro indica che e uno stimatore

    non distorto. Inoltre, il rapporto (1)n

    e una stima della precisione dellostimatore: come sempre, tale precisione e tanto maggiore quanto piu elevatae la dimensione campionaria n. Ce tuttavia unimportante differenza daosservare qui rispetto a quanto discusso nel caso della stima di medie. Mentreinfatti la precisione dello stimatore di una media non dipende dal valore

    vero assunto dal parametro di interesse, qui la precisione varia al variare delvalore assunto da . In particolare, ci si accorge che la funzione (1 ) euna funzione concava che vale 0 quando = 0, 1 e raggiunge il suo massimoquando = 0.5. Se ne deduce che a parita di dimensione campionaria e dilivello di copertura otteremo intervalli di confidenza generalmente piu strettiquando si trova vicino agli estremi 0 e 1, e piu larghi quando si trova inun intorno di 0.5.

    8

  • 8/14/2019 Intervalli di confidenza 2

    9/15

    Dal fatto che N(, (1 )/n), si deduce che

    (1)

    n

    N(0, 1).

    Per ogni valore di probabilita 1 , possiamo allora scrivere che

    P(z/2 (1)

    n

    z/2) = 1

    dove z/2 e al solito il quantile della normale di ordine 1 /2.

    Un intervallo di confidenza puo allora essere costruito sulla base dellaseguente catena di uguaglianze:

    1 = P(z/2 (1)

    n

    z/2) = 1

    = P(z/2

    (1 )

    n z/2

    (1 )

    n)

    = P( z/2(1 )

    n + z

    /2(1 )

    n)

    = P( z/2

    (1 )

    n + z/2

    (1 )

    n)

    In altre parole, e approssimativamente uguale a 1 la probabilita che i dueestremi dellintervallo

    z/2

    (1 )

    n, + z/2

    (1 )

    n

    contengano il valore vero della proporzione della popolazione.

    5 Ancora sulla determinazione della dimen-

    sione campionaria

    Il calcolo della dimensione campionaria ottimale puo essere compiuto anchequando lintervallo di confidenza e calcolato per una proporzione incognita .

    9

  • 8/14/2019 Intervalli di confidenza 2

    10/15

    Naturalmente, in questo caso la precisione dello stimatore (e quindi lampiez-

    za dellintervallo) dipende dal valore assunto da , che e incognito. E dunquenecessario usare come misura cautelativa la quantita

    (1 ) = 0.52 = 0.25

    e procedere sulle linee della sezione dedicata alla dimensione campionaria nelcalcolo di intervalli di confidenza per medie.

    Piu precisamente, per ogni dimensione n lampiezza dellintervallo (ad unprefissato livello 1 ) raggiungera al piu il valore

    d = 2z/20.25n

    .

    Se dunque desideriamo calcolare la dimensione minima richiesta per avere unintervallo per che non superi lampiezza massima d, dobbiamo cercare ilminimo valore di n tale che

    2z/2

    0.25

    n d

    ovvero tale che

    4z2/20.25

    n (d)2

    o ancora tale chen 4z2/2

    0.25

    (d)2=z/2

    d

    2La dimensione ottimale n e dunque data da

    n =

    z/2(d

    2

    Secondo tale formula, se ad esempio programmiamo unindagine dopin-ione per stimare la proporzione degli elettori di un collegio elettorale chevoteranno per un certo partito politico e desideriamo un intervallo di confi-

    denza che al livello 1 = 0.95 non superi lampiezza di 2 punti percentuali(d = 0.02), avremo bisogno di un minimo di

    n =

    1.96

    0.02

    2 = 9604

    elettori da intervistare.

    10

  • 8/14/2019 Intervalli di confidenza 2

    11/15

    6 Inferenza sulla differenza tra medie

    Supponiamo di aver a che fare con due campioni di osservazioni, diciamo(x1...xn1) e (y1...yn2), estratti indipendentemente da due popolazioni dove lastessa variabile quantitativa si distribuisce rispettivamente con medie 1 e2 e con varianze

    21 e

    22. Indichiamo inoltre, rispettivamente, con x e y

    le due medie aritmetiche campionarie. Si desidera costruire un intervallo diconfidenza al livello 1 per la differenza tra le medie 1 2.

    Si pensi allinterpretazione di un intervallo di confidenza di questo tipo: seesso contiene lo 0, diremo che le due medie non sono significativamentediverse tra loro al livello 1, poiche non possiamo escludere che il valorevero del parametro dinteresse sia pari a 1 2 = 0.

    Per la costruzione dellintervallo in questione (e sotto lipotesi che i duecampioni siano stati estratti indipendentemente luno dallaltro) possiamodistinguere i seguenti casi:

    varianze uguali e note: (21 = 22 =

    2) in questo caso, la variabile aleato-ria

    (x y) (1 2)2

    n1+

    2

    n2

    si distribuisce come una normale standardizzata e lintervallo di confi-denza desiderato e dato da:

    x y z/2

    1n1

    +1

    n2

    varianze diverse e note: (21 = 22) in questo caso la variabile aleatoria

    x y (1 2)21

    n1+

    22

    n2

    si distribuisce come una normale standardizzata e lintervallo di confi-denza desiderato e dato da:

    x y z/2

    21n1

    +22n2

    varianze uguali ma incognite: (21 = 22 =

    2) in questo caso, una stimadella varianza comune 2 e data dalla cosiddetta varianza campionariapooled

    2 =

    n1i=1(xi x)

    2 +n2

    i=1(yi y)2

    n1 + n2 2

    11

  • 8/14/2019 Intervalli di confidenza 2

    12/15

    e si ha che la variabile aleatoria

    x y (1 2)2

    1n1

    + 1n2

    si distribuisce come una t di Student con n1 + n2 2 gradi di libertae lintervallo di confidenza desiderato e dato da:

    x y tn1+n22,/2

    1

    n1+

    1

    n2

    Si osservi che non e stato considerato il caso di varianze diverse e incog-

    nite: la soluzione di questo problema esula dal programma del corso. Percomprendere luso delle formule introdotte, consideriamo il seguente esempionumerico.

    Esempio Supponiamo che siano stati estratti due campioni di studen-ti universitari, iscritti al secondo anno in due universita italiane, e di ognistudente e stata registrata la media dei voti conseguiti agli esami. Il primocampione e costituito da n1 = 50 studenti e ha fornito una media campi-onaria pari a x = 23.5, mentre il secondo e costituito da n2 = 100 studentied ha fornito una media campionaria pari a y = 25.2. Si desidera costruireun intervallo di confidenza al livello 1 = 0.95 per la differenza 1 2tra i voti medi riportati dagli studenti nelle due universita. Le tre proce-

    dure piu semplici che possiamo seguire fanno riferimento alle formule vistein precedenza.

    Varianze note e uguali Lipotesi piu semplice (ma anche la piu rischiosa)consiste nellassumere che il voto medio si distribuisca nelle due univer-sita con la stessa varianza che assumiamo nota: tale varianza potrebbeessere ad esempio quella pubblicata dallufficio statistico del MIUR conriferimento al voto medio degli studenti iscritti al secondo anno in tuttigli atenei italiani. Supponiamo che tale varianza 2 sia uguale a 16.Formalmente, stiamo assumendo che il voto medio degli studenti dellaprima universita sia una variabile aleatoria che si distribuisce seguendo

    la normale N(1, 2), mentre il voto relativo agli iscritti nella secondauniversita segua la normale Y N(2, 2). Lintervallo di confidenzacercato e dato allora da

    xyz/2

    1

    n1+

    1

    n2= 23.525.21.964

    1

    50+

    1

    100= 1.71.36

    ovvero (3.06,0.34). Sulla base di questo risultato possiamo affer-mare (con un livello di fiducia del 95%) che gli studenti della prima

    12

  • 8/14/2019 Intervalli di confidenza 2

    13/15

    universita hanno conseguito in media un voto medio al secondo anno

    inferiore a quello conseguito dagli iscritti alla seconda universita. Si os-servi che, sulla base di tale intervallo che non comprende lo zero, si puoaffermare che i voti medi nelle due universita sono significativamentedifferenti, al livello 1 .

    Varianze note e diverse Se invece gli uffici statistici delle due universitahanno pubblicato recentemente (rispetto alla nostra analisi) delle tabelleda cui si evince che le due popolazioni hanno varianze diverse, possi-amo decidere di considerare queste come note. Supponendo di avere21 = 16 e

    22 = 4, lintervallo di confidenza desiderato sara dato da

    x y z/2

    21n1

    + 22n2

    = 23.5 25.2 1.96

    16n1

    + 4n2

    = 1.7 1.18

    ovvero (2.88,0.52).

    varianze uguali ma incognite Se non reputiamo attendibili le statistichedel MIUR ne quelle dei due atenei, non ci rimane altra scelta che as-sumere incognite le due varianze. Se ci sono informazioni sufficientiper assumere che tuttavia i voti hanno la stessa dispersione nelle dueuniversita, possiamo usare la formula contenente la varianza pooled perlintervallo desiderato, se conosciamo le deviazioni standard dei due

    campioni. Supponendo che le seguenti siano le devazioni standard deidue campioni: 1n1

    n1i=1

    (xi x)2 =

    50/50 = 1

    1n2

    n2i=1

    (yi y)2

    400/100 = 2

    allora la varianza pooled e data da

    2 = 50 + 40050 + 100 2

    = 3.04

    e possiamo calcolare gli estremi dellintervallo desiderato come segue:

    xytn1+n22,/2

    1

    n1+

    1

    n2= 1.7 1.96 1.74

    1

    50+

    1

    100= 1.70.59

    dato che, essendo n1 + n2 2 > 100, si ha tn1+n22,/2 z/2

    13

  • 8/14/2019 Intervalli di confidenza 2

    14/15

    7 Differenza tra due proporzioni

    Supponiamo di aver a che fare con due campioni indipendenti, diciamo(x1...xn1) e (y1...yn2), estratti rispettivamente da due popolazioni in cui unastessa variabile dicotomica si distribuisce secondo le due tabelle:

    pop.ne 1x0 1 11 1

    1

    pop.ne 2y0 1 21 2

    1

    Indichiamo inoltre, rispettivamente, con 1

    = x e 2

    = y le due frequenzerelative campionarie. Si desidera costruire un intervallo di confidenza allivello 1 per la differenza tra le proporzioni 1 2. Limportanza di unintervallo del genere e chiara: se lintervallo contiene lo 0, diremo che le dueproporzioni non sono significativamente diverse, al livello 1 .

    Il risultato che usiamo per costruire il nostro intervallo e il seguente. Sia

    =n11 + n22

    n1 + n2

    allora1 2

    (1 )

    1n1

    + 1n2

    N(0, 1).Si tratta al solito di un risultato approssimato, ma la qualita di tale risultatoe sempre migliore man mano che crescono le dimensioni campionarie n1 e n2.

    Da tale risultato, si deduce che un intervallo di confidenza per la differenzatra due proporzioni al livello 1 e dato dagli estremi

    1 2 z/2

    (1 )

    1

    n1+

    1

    n2

    1 2 + z/2

    (1 )

    1

    n1+ 1

    n2

    Supponiamo ad esempio di aver effettuato due sondaggi di opinione indate successive chiedendo agli intervistati la preferenza per un determinatopartito politico. In particolare, supponiamo di aver intervistato 100 elettoridurante il primo sondaggio e 200 elettori durante il secondo sondaggio, otte-nendo una percentuale di elettori favorevoli del 40% nel primo e del 42% nel

    14

  • 8/14/2019 Intervalli di confidenza 2

    15/15

    secondo sondaggio. Ci chiediamo se tale incremento di preferenze sia stato

    significativo al livello 1 = 0.95. Si ottiene:

    =n11 + n22

    n1 + n2=

    100 0.4 + 200 0.42

    100 + 200= 0.413

    (1 )

    1

    n1+

    1

    n2

    =

    0.413 0.587

    1

    100+

    1

    200

    = 0.060

    Se ne deduce che lintervallo di confidenza desiderato e dato da

    (0.40 0.42 1.96 0.060, 0.40 0.42 + 1.96 0.060) = (0.138, 0.098)

    ovvero laumento osservato nei campioni non puo essere considerato signi-ficativo, poiche lintervallo contiene lo 0.

    15