22
? INFERENZA STATISTICA Bruno Chiandotto Dipartimen to di Statistica, Informatica, Applicazioni “G. Parenti” (DISIA) Firenze, agosto 2017 It is easy to lie with statistics It is hard to tell the truth without it Andrejs Dunkels Queste Note didattiche sono state predisposte (in edizione provvisoria) per facilitare la preparazione dell'esame di Inferenza statistica previsto nel Corso di laurea Magistrale in Statistica, Scienze attuariali e finanziarie dell’Università degli Studi di Firenze. Lo studente troverà nelle note soltanto alcuni degli elementi di base del calcolo delle probabilità e dell’inferenza statistica. Si tratta di un’ introduzione alla conoscenza dei metodi moderni di analisi statistica dei fenomeni collettivi da approfondire mediante la lettura di altri testi. .

INFERENZA STATISTICA - UniFI · 2017. 9. 11. · INFERENZA STATISTICA Bruno Chiandotto Dipartimento di Statistica, Informatica, Applicazioni “G. Parenti”(DISIA) Firenze, agosto

  • Upload
    others

  • View
    18

  • Download
    1

Embed Size (px)

Citation preview

  • ?

    INFERENZA STATISTICA Bruno Chiandotto

    Dipartimento di Statistica, Informatica, Applicazioni “G. Parenti”(DISIA)

    Firenze, agosto 2017

    It is easy to lie with statistics

    It is hard to tell the truth without it Andrejs Dunkels

    Queste Note didattiche sono state predisposte (in edizione provvisoria) per facilitare la preparazione

    dell'esame di Inferenza statistica previsto nel Corso di laurea Magistrale in Statistica, Scienze attuariali

    e finanziarie dell’Università degli Studi di Firenze. Lo studente troverà nelle note soltanto alcuni degli

    elementi di base del calcolo delle probabilità e dell’inferenza statistica. Si tratta di un’ introduzione alla

    conoscenza dei metodi moderni di analisi statistica dei fenomeni collettivi da approfondire mediante la

    lettura di altri testi.

    .

    http://www.safs.unifi.it/http://www.safs.unifi.it/

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Indice

    i

    INDICE

    0. Premessa

    Introduzione 1

    0.1 Inferenza statistica classica 3

    0.2 Inferenza statistica bayesiana 7

    0.3 Teoria statistica delle decisioni 8

    0.4 Digressione: scale di misura 12

    Conclusioni 15

    1. Calcolo delle probabilità

    Introduzione 17

    1.1 Alcuni concetti di base 17

    1.2 Algebra degli eventi 20

    1.3 Probabilità 24

    1.4 Formula di Bayes 33

    1.5 Variabili casuali semplici 37

    1.6 Valore atteso di funzioni di variabili casuali semplici 40

    1.7 Variabili casuali discrete 50

    1.7.1 Binomiale 50

    1.7.2 Teorema di Markov 56

    1.7.3 Ipergeometrica 60

    1.7.4 di Poisson 66

    1.7.5 Binomiale negativa 70

    1.7.6 Geometrica (di Pascal) 75

    1.7.7 Variabili casuali discrete: riepilogo 75

    1.8 Variabili casuali continue 79

    1.8.1 Normale (di Gauss-Laplace 79

    1.8.2 Teorema del limite centrale 87

    1.8.3 Log-normale 89

    1.8.4 Cauchy 90

    1.8.5 Gamma 91

    1.8.6 Pareto (I° tipo) 92

    1.8.7 Weibull 92

    1.8.8 Esponenziale negativa 93

    1.8.9 2

    di Pizzetti-Pearson 95 1.8.10 Beta 97

    1.8.11 Uniforme 101

    1.8.12 t di Student 101

    1.8.13 F di Fisher-Snedecor 102

    1.8.14 Variabili casuali continue riepilogo 103

    1.9 Variabili casuali multidimensionali 108

    1.10 Valore atteso di funzioni di variabili casuali multidimensionali 113

    1.11 Variabili casuali discrete e continue a k dimensioni 119

    1.11.1 Trinomiale (binomiale doppia) 119

    1.11.2 Multinomiale e Ipergeometrica a k dimensioni 122

    1.11.3 Normale doppia 123

    1.11.4 Normale a k dimensioni 131

    1.11.5 di Dirichlet 133

    1.12 La famiglia esponenziale 133

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Indice

    ii

    1.13 Distribuzioni multiple multivariate 136

    1.14 Distribuzioni a priori coniugate 139

    2. Campionamento e distribuzioni campionarie

    Introduzione 143

    2.1 Campioni casuali 143

    2.2 Sufficienza 150

    2.3 Distribuzioni campionarie 155

    2.4 Campionamento da popolazioni normali 163

    2.5 Campionamento da popolazioni non normali 166

    2.6 Campionamento da due popolazioni indipendenti 172

    3. Teoria della stima

    Introduzione 175

    3.1 Stima puntuale 175

    3.1.1 Proprietà degli stimatori 177

    3.1.2 Sufficienza 178

    3.1.3 Concentrazione e prossimità 178

    3.1.4 Efficienza 179

    3.1.5 Proprietà asintotiche 184

    3.2 Metodi di stima puntuale 185

    3.2.1 Minimizzazione dell’errore quadratico medio 186

    3.2.2 Massima verosimiglianza 188

    3.2.3 Proprietà degli stimatori di massima verosimiglianza 197

    3.2.4 Altri metodi di stima 198

    3.3 Stima statistica di intervallo (intervalli di confidenza) 200

    3.3.1 Intervallo di confidenza per la media di una v.c. normale con varianza nota 203

    3.3.2 Intervallo di confidenza per la media di una v.c. normale con var. incognita 204

    3.3.3 Intervallo di confidenza per la var. di una v.c. normale con media incognita 206

    3.3.4 Intervallo di confidenza per la media di una v.c. con distribuz. arbitraria 206

    3.3.5 Intervalli simultanei di conf. per la media e la varianza di una v.c. normale 208

    3.3.6 Intervallo di confidenza per la differenza tra medie e tra proporzioni 210

    3.3.7 Intervallo di confidenza per la differenza tra medie per dati appaiati 212

    3.3.8 Intervallo di confidenza per il rapporto tra varianze 213

    3.4 Determinazione della numerosità campionaria 214

    4. Teoria del test delle ipotesi

    Introduzione 217

    4.1 Verifica di ipotesi statistiche 217

    4.1.1 Ipotesi semplici 221

    4.1.2 Ipotesi composite 226

    4.2 Test sulla media 227

    4.2.1 p-value 234

    4.2.2 Potenza del test 236

    4.3 Test sulla varianza 246

    4.4 Test sulla probabilità 249

    4.5 Determinazione della dimensione campionaria 253

    4.6 Confronto tra campioni 255

    4.6.1 Confronto tra medie 256

    4.6.2 Confronto tra proporzioni 262

    4.6.3 Confronto tra varianze 265

    4.6.4 Confronto per dati appaiati 268

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Indice

    iii

    4.7 Determinazione della dimensione campionaria 271

    5. Modello statistico lineare

    Introduzione 275

    5.1 Modello di regressione lineare semplice 277

    5.1.1 Ipotesi di specificazione (caso A) 280

    5.1.2 Stima dei minimi quadrati 281

    5.1.3 Ipotesi di specificazione (caso B) 289

    5.1.4 Stima di massima verosimiglianza 290

    5.1.5 Stima di intervallo 291

    5.1.6 Test delle ipotesi 295

    5.1.7 Trasformazione di modelli non lineari 296

    5.2 Coefficiente di correlazione lineare 296

    5.3 Modello di regressione lineare multipla 300

    5.3.1 Ipotesi di specificazione (caso A) 300

    5.3.2 Stima dei minimi quadrati 301

    5.3.3 Ipotesi di specificazione (caso B) 306

    5.3.4 Stima di massima verosimiglianza 306

    5.3.5 Stima di intervallo e test delle ipotesi 307

    5.4 Modello di analisi della Varianza (ANOVA) 316

    5.4.1 Analisi a un criterio di classificazione 317

    5.4.2 Analisi a due criterio di classificazione 320

    5.5 Analisi della Varianza e modello di regressione 326

    5.6 Analisi della covarianza (ANCOVA) 330

    6. Inferenza statistica bayesiana

    Introduzione 333

    6.1 Formula di Bayes 336

    6.2 Distribuzioni a priori coniugate 342

    6.3 Distribuzioni a priori non informative 355

    6.4 Stima e teoria del test delle ipotesi in ottica bayesiana 359

    6.5 Regressione bayesiana 365

    6.5.1 Regressione bayesiana con distribuzioni a priori non infor. e coniugate 367

    7. Teoria statistica delle decisioni

    Introduzione 373

    7.1 Teoria delle decisioni 373

    7.2 Decisioni basate sulle sole informazioni a priori 377

    7.2.1 Assiomi di comportamento razionale (Ia parte) 378

    7.2.2 Assiomi di comportamento razionale (2a parte) 379

    7.2.3 Assiomi di comportamento razionale (3a parte) 382

    7.3 Decisioni in situazioni di estrema incertezza 384

    7.4 Struttura del processo decisionale 387

    7.5 Decisioni basate sulle sole informazioni campionarie 392

    7.6 Decisioni basate su informazioni a priori e informazioni campionarie 399

    7.7 Valore dell’informazione 408

    7.8 Teoria causale delle decisioni 415

    Riferimenti bibliografici 419

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    1

    PREMESSA

    Introduzione

    Nello studio dei fenomeni1 di qualunque natura essi siano (economici, aziendali, fisici,

    biologici, ecc.) e qualunque sia la finalità (puramente conoscitiva o operativa) che

    s’intende perseguire, sorge sovente la necessità di rappresentare le manifestazioni dei

    fenomeni stessi attraverso tabelle e grafici per recepire più immediatamente particolari

    caratteristiche del fenomeno oggetto di analisi; altre volte, può interessare cogliere nella

    multiforme variabilità o mutabilità2 delle loro manifestazioni quello che in esse c'è di

    tipico o di costante, o magari interessa fornire una qualche misura della diversità stessa

    e/o di voler evidenziare in qualche modo l’eventuale relazione che lega fenomeni

    diversi ma logicamente collegati; infine, si può avere interesse a rappresentare il

    fenomeno o la relazione tra fenomeni mediante specifici modelli analitici che,

    schematizzando e semplificando la realtà, ne rendono più facile la comprensione.

    L’interesse può riguardare quindi:

    a. l’esecuzione di rappresentazioni tabellari e grafiche che mettano in evidenza

    certi aspetti generali del fenomeno o dei fenomeni oggetto di analisi

    (rappresentazioni tabellari e grafiche);

    b. il calcolo di indici che mettano in evidenza quello che c'è di tipico nelle

    manifestazioni dei fenomeni (rappresentazioni sintetiche: valori medi);

    c. il calcolo di indici che mettano in evidenza quello che c'è di mutabile e/o

    variabile nelle manifestazioni di fenomeni (rappresentazioni sintetiche: indici

    di variabilità e/o mutabilità);

    d. la misura della relazione tra fenomeni mediante appropriati indici

    (rappresentazioni sintetiche: indici di associazione);

    e. l’introduzione di modelli che esprimano analiticamente l'insieme delle

    manifestazioni del fenomeno e/o la relazione tra fenomeni (rappresentazioni

    analitiche).

    In seguito verranno distinti i modelli probabilistici dai modelli statistici. I modelli

    probabilistici, quali rappresentazioni, nella generalità dei casi, approssimate della realtà,

    1 In questa nota tutte le volte che si usa il termine fenomeno si fa riferimento al così detto fenomeno collettivo, cioè

    ad un fenomeno la cui misura e conoscenza richiede l’osservazione di una pluralità di sue manifestazioni. 2 Si dice variabile il fenomeno collettivo le cui manifestazioni si diversificano per grandezze numeriche enumerabili o

    misurabili (caratteri quantitativi), si dice mutabile il fenomeno collettivo le cui manifestazioni si diversificano per

    attributi non numerici (caratteri qualitativi) che possiedono, o meno, un ordine naturale di successione (cfr.

    Digressione sulle scale di misura in questo capitolo) . Come si avrà modo di chiarire nelle pagine seguenti, la natura,

    quantitativa o qualitativa, delle modalità classificatorie condiziona interamente il processo di analisi statistica dei dati:

    dalla fase della loro raccolta a quella dell’elaborazione finale.

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    2

    consentono una più immediata comprensione degli aspetti più rilevanti relativi ai

    fenomeni di interesse. Per contro, i modelli statistici, oltre ad essere rappresentazioni

    semplificata della realtà, facilitano anche la formulazione di previsioni e consentono la

    ricerca di nessi causali fornendo informazioni utilizzabili a fini decisionali.

    In particolare, se si è interessati alla conoscenza di un certo fenomeno (carattere) F si

    possono rappresentare le sue possibili manifestazioni (modalità del carattere) come

    punti di un insieme P (popolazione). Ovviamente non tutti i punti hanno lo stesso peso,

    e cioè può accadere che una determinata manifestazione (specifica modalità del

    carattere considerato) si realizzi più frequentemente di una seconda e questa con

    maggiore frequenza di una terza e così via, in tal caso, a ciascun punto resta associato

    un peso che, a seconda del contesto di riferimento, statistico o probabilistico, assume la

    denominazione di frequenza relativa o di probabilità.

    All'insieme P può essere associato un secondo insieme R che può essere chiamato

    caratteristico, cioè l'insieme di tutti gli indici caratteristici di compattazione dei dati

    che possono essere derivati applicando le funzioni (da intendersi in senso lato come

    gruppo di operazioni logiche o algebriche di qualunque natura) 1 2, ,......, hg g g ,

    all'insieme P in modo tale che ciascun elemento di R, che può essere definito l'insieme

    delle rappresentazioni statistiche, consenta una più facile ed immediata comprensione

    del fenomeno F.

    Quella riportata nella Fig.0.1 è una schematizzazione estremamente semplificata dei

    problemi propri della cosiddetta statistica descrittiva cui si è riferito ai punti a., b., c., d.

    ed e., elencati in precedenza. La figura rettangolare contiene la strumentazione (metodi

    di compattazione) capace di trasformare i dati in informazioni.

    Statistica descrittiva

    Fig. 0.1 - Rappresentazione schematica della struttura logica del metodo statistico

    F P R

    h

    i

    1

    g

    g

    g

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    3

    0.1 - Inferenza statistica classica

    Nelle argomentazioni svolte, si è implicitamente ipotizzato di avere a disposizione

    tutte le manifestazioni del fenomeno o dei fenomeni oggetto di analisi, e di voler in

    qualche modo, attraverso tabelle, grafici o calcolo di indici caratteristici, ecc.,

    compattare i dati a disposizione, ovvero raccogliere molteplici aspetti in un solo

    aspetto, individuare il costante nel variabile, accentuare quella particolarità del

    fenomeno che più interessava oscurandone altre ecc.. Quella prospettata non è,

    usualmente, la realtà in cui si opera: nella generalità dei casi si deve procedere

    nell’analisi di un fenomeno, avendo a disposizione soltanto una parte delle

    manifestazioni dello stesso. In altri termini si dispone di un sottoinsieme C (campione)

    di manifestazioni del fenomeno F pur restando inalterato il problema di comprensione

    del fenomeno stesso attraverso l'utilizzo di tabelle, grafici e appropriati indici di

    compattazione.

    Si supponga di essere interessati ad un particolare indice caratteristico che

    sintetizza specifici aspetti del fenomeno di interesse e che questo possa essere

    determinato applicando la funzione g a tutte le manifestazioni del fenomeno di

    interesse, ma che sia impossibile effettuare una tale operazione potendo disporre

    soltanto di un sottoinsieme di tali manifestazioni.

    Il problema da risolvere è quello dell’individuazione di una funzione t , non

    necessariamente uguale a g , che applicata ai dati campionari fornisca un punto ̂

    che sia il più vicino possibile a (cfr. Fig. 0.2); interessano, cioè, indici che siano

    rappresentativi non di particolari aspetti del fenomeno, così come risulta dall'insieme

    parziale delle sue manifestazioni, ma come risulterebbe se si disponesse dell'insieme di

    tutte le sue manifestazioni.

    Con un linguaggio più tecnico si dice che ̂ deve essere una buona stima di ; in

    realtà, come si avrà modo di chiarire successivamente, più che di buona stima si parlerà

    di buon stimatore, poiché non è possibile misurare la “distanza” di una quantità nota ̂

    ad una quantità incognita . Pertanto, è il procedimento che si segue per ottenere la

    quantità ̂ che può essere “buono” o “cattivo”, e la “bontà” (proprietà augurabili)

    dovrà valere qualunque sia il valore di , bontà che si misura attraverso l'analisi del

    suo comportamento nell'insieme di tutti i possibili campioni estraibili dalla popolazione

    (universo dei campioni).

    La stima, è il primo dei due problemi che costituiscono l'oggetto di studio

    dell’inferenza statistica. Un tale problema consiste, come già detto, nel cercare di

    estendere le conclusioni relative alla misura di un certo indice caratteristico, derivanti da

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    4

    un insieme parziale di manifestazioni di un determinato fenomeno, all'insieme di tutte le

    sue manifestazioni effettive o potenziali.

    Se le conclusioni cui si vuol pervenire non riguardano direttamente la misura di una

    entità incognita ma la ragionevolezza di una specifica assunzione relativa a tale entità si

    ha a che fare con il secondo problema di cui si occupa la statistica induttiva: “il test

    delle ipotesi (statistiche)”.

    Inferenza statistica classica

    DEDUZIONE INDUZIONE

    (Calcolo delle Probabilità) ( Inferenza statistica)

    Fig. 0.2 - Rappresentazione grafica del processo di induzione statistica (inferenza classica)

    I problemi della stima e quello del test delle ipotesi sono strettamente collegati ma

    coinvolgono problematiche logicamente diverse e devono, pertanto, essere tenuti

    distinti. Facendo sempre riferimento all'indice , un test statistico si risolve nella

    formulazione di un'ipotesi sul presumile vero valore dell'indice per poi decidere, sulla

    scorta dell'evidenza campionaria, se accettare o meno l'ipotesi formulata.

    Come già sottolineato, la complessa natura dei fenomeni economici, biologici, fisici,

    ingegneristici, ecc. oltre a giustificare l'esistenza di metodi statistici sempre più raffinati,

    esige spesso l'introduzione di modelli analitici che, semplificando e schematizzando la

    realtà, ne rendono più facile la comprensione.

    F

    P

    R

    SPAZIO o UNIVERSO

    dei Campioni

    C

    1

    i

    h

    g

    g

    g

    k

    i

    1

    t

    t

    t

    Rc

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    5

    Poiché una serie innumerevole di fenomeni nelle varie scienze è governata da leggi

    aventi natura aleatoria, ne consegue immediatamente che i modelli probabilistici

    risultano essere i più appropriati per descrivere le loro manifestazioni (cfr. Fig. 0.3).

    Deduzione

    (Probabilità)

    Induzione

    (Inferenza statistica)

    Fig. 0.3 - Relazioni tra probabilità, statistica induttiva, evidenza empirica e modello.

    Anche se fra i criteri logici od empirici che possono guidare nella individuazione del

    modello rappresentativo più opportuno alcuni hanno validità generale, usualmente essi

    sono strettamente connessi alla natura e al tipo del fenomeno che si intende analizzare.

    Al riguardo si deve sottolineare che quando si procede all'introduzione di un modello

    analitico per esprimere le manifestazioni di un fenomeno di interesse, non ha più senso

    parlare di popolazione in quanto la popolazione è rappresentata dal modello stesso,

    espressione del processo di generazione dei dati, e le manifestazioni del fenomeno o dei

    fenomeni d’interesse osservate hanno, necessariamente, sempre natura di manifestazioni

    campionarie essendo la popolazione rappresentata analiticamente attraverso il modello

    stesso (superpopolazione)3.

    La rappresentazione analitica dei fenomeni si risolve, nel caso in cui si considera, ad

    esempio, un solo carattere quantitativo, nella introduzione di un simbolo X al quale è

    associata una funzione di massa di probabilità, nel caso discreto, di densità di

    probabilità, nel caso continuo, del tipo:

    ; f x per x S e Θ

    dove: S rappresenta lo spazio campionario di definizione di x, cioè lo spazio (supporto)

    di tutti i valori assumibili dall'entità variabile x ; il parametro o i parametri

    3 Questa affermazione vale, ovviamente, anche quando s’introducono modelli analitici per rappresentare le relazioni

    (associazione) tra caratteri.

    UNIVERSO

    DEI

    CAMPIONI

    SITUAZIONE

    REALE

    EVIDENZA

    EMPIRICA

    (CAMPIONE)

    MODELLO

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    6

    caratteristici del modello; Θ 4 lo spazio parametrico, cioè lo spazio di tutti i valori

    assumibili dal parametro/i, usualmente incognito/i, . Come si avrà modo di verificare

    successivamente, tra gli indici caratteristici (misure di compattazione delle

    manifestazioni dei fenomeni di interesse) ed i parametri caratteristici, esiste una stretta

    relazione analitica.

    Quando si ritiene opportuna l'introduzione di un modello analitico per rappresentare

    le manifestazioni di un fenomeno di interesse, si possono distinguere almeno due

    situazioni di mancanza di conoscenza: la prima situazione è quella caratterizzata da una

    conoscenza parziale della funzione 1 2 ; , ,...., ; kf x f x nel senso che si

    conosce la forma analitica della funzione ma non si conosce il valore di tutti o di alcuni

    dei parametri che caratterizzano la funzione stessa, in questa circostanza si parla di

    inferenza statistica parametrica. La seconda situazione è quella di mancata conoscenza

    della forma analitica del modello, in questa circostanza si parla di inferenza statistica

    non parametrica. Una terza situazione, intermedia rispetto alle due precedenti, è quella

    in cui si specificano certe componenti del modello (ad esempio si suppone che la v.c.

    appartenga alla famiglia esponenziale ma non si specifica la sottofamiglia: forma

    funzionale della funzione di massa o di densità). Se si opera in tale contesto si parla di

    inferenza statistica semi-parametrica, nel senso che la forma analitica del modello è

    specificata solo parzialmente.

    La dizione inferenza statistica non parametrica non è certamente la più appropriata in

    quanto interpretabile come se, in questo ambito, le procedure di statistica induttiva non

    riguardassero i parametri. Ovviamente, questa interpretazione è fuorviante, infatti, con

    la dizione “non parametrica” si vuole, molto semplicemente, caratterizzare le situazioni

    inferenziali nelle quali non si conosce la forma analitica e, ovviamente, il valore dei

    parametri caratteristici, elementi questi entrambi coinvolti nelle procedure inferenziali.

    La dizione corretta per caratterizzare tali situazioni è quella di inferenza statistica libera

    da distribuzione (distribution free).

    Ai problemi di stima e di test delle ipotesi, che in questo contesto possono riguardare

    i soli parametri caratteristici od anche la forma analitica del modello cui si ritiene

    opportuno fare ricorso, si aggiunge la necessità di procedere ad una misura e verifica

    della capacità (bontà) rappresentativa (adattamento) del modello stesso.

    La stima e il test delle ipotesi sono, in un contesto lievemente differente, gli stessi

    due problemi di stima e di verifica delle ipotesi sopra considerati.

    Uno degli aspetti più importanti di cui la statistica si occupa, è dunque quello

    dell'estensione di conclusioni da un campione di osservazioni alla popolazione o

    superpopolazione, nel caso in cui si procede all’impiego di modelli, dal quale il

    campione è stato estratto. Se si fa riferimento ai modelli, tale problema si risolverà

    nell'utilizzo dei dati campionari per la scelta, la modifica e la misura del grado di

    4 In queste note il carattere in grassetto sta ad indicare che il simbolo utilizzato fa riferimento ad un vettore e/o ad una

    matrice e non a uno scalare; nel caso specifico i simboli e Θ stanno ad indicare che si sta trattando di uno o più parametri.

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    7

    rappresentatività dei modelli, od anche, nella verifica di ipotesi statistiche sulla forma

    e/o sul valore dei parametri che caratterizzano i modelli stessi.

    0.2 - Inferenza statistica bayesiana

    Le considerazioni fino ad ora svolte riguardano la cosiddetta inferenza statistica

    classica (frequentista): in questo contesto, per pervenire a delle conclusioni sulla

    popolazione, o sulla sua rappresentazione attraverso un modello, si utilizzano i soli dati

    campionari (insieme parziale di manifestazioni del fenomeno d’interesse).

    Un diverso modo per risolvere i problemi di induzione statistica è quello usualmente

    noto come approccio bayesiano all’inferenza statistica (cfr. Fig. 0.4). L’elemento

    caratterizzante di questo approccio è l’utilizzo esplicito e formalizzato del bagaglio

    conoscitivo pregresso (informazioni a priori) sul fenomeno d’interesse. Si deve, però,

    sottolineare che l’elemento distintivo del ragionamento bayesiano non risiede tanto

    nell’utilizzo delle informazioni a priori (queste infatti vengono utilizzate, come si avrà

    modo di chiarire in seguito, anche nell’approccio classico all’inferenza statistica),

    quanto nel diverso modo attraverso il quale le informazioni a priori vengono utilizzate.

    Inferenza statistica bayesiana

    Fig.0.4 - Rappresentazione grafica del processo di induzione statistica (inferenza bayesiana)

    Se si prevede l’impiego di modelli rappresentativi della realtà (del fenomeno e/o

    delle relazioni tra fenomeni), la conoscenza a priori si risolve nell’introduzione di una

    F

    P

    R

    Rc

    C

    1

    i

    h

    g

    g

    g

    1

    i

    k

    s

    s

    s

    Informazioni

    a priori

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    8

    distribuzione di probabilità sul parametro o sui parametri caratteristici del modello che

    assumono, in tale ottica, la natura di variabili casuali e non più, come accade nell’ottica

    classica, quella di costanti incognite.

    In precedenza, trattando dei modelli rappresentativi dei fenomeni, in funzione del

    patrimonio conoscitivo disponibile si è operata la distinzione inferenza statistica

    classica parametrica, non parametrica e semiparametrica; analogamente, in funzione

    del patrimonio conoscitivo disponibile, si parlerà di inferenza statistica bayesiana

    parametrica, inferenza statistica bayesiana non parametrica e inferenza statistica

    bayesiana semiparametrica.

    In altri termini, nel contesto classico, dato il modello

    ; f x per x S e Θ

    nel caso parametrico l’unica incognita è rappresentata dal parametro (o

    parametri) che lo caratterizzano e i dati campionari verranno utilizzati per

    trarre conclusioni su tale entità;

    nel caso non parametrico sono incognite sia il parametro (o parametri) che lo

    caratterizzano, sia la forma analitica , f del modello e i dati campionari

    verranno utilizzati per trarre conclusioni sia sulla forma analitiche sui parametri.

    Nel contesto bayesiano, dati i modelli5

    , f x per x S e Θ

    per e Θ

    dove , rappresenta la distribuzione a priori del parametro (o parametri) ,

    i parametri (detti iperparametri) che caratterizzano la distribuzione a priori. la

    dizione di inferenza bayesiana parametrica, non parametrica e semiparametrica,

    dipenderà dallo stato di conoscenza sulla forma analitica delle funzioni , f x e

    ; .

    0.3 - Teoria statistica delle decisioni

    Per comprendere i fenomeni occorre procedere all’analisi delle loro manifestazioni, se

    ci si domanda poi per quale ragione si è interessati ad una tale comprensione, la risposta

    è che si può voler soddisfare una mera esigenza conoscitiva fine a se stessa, o che la

    conoscenza è finalizzata alla risoluzione di uno specifico problema decisionale.

    In un contesto decisionale, la scelta può riguardare gli aspetti più diversificati che

    vanno da quelli quotidiani più banali (dovendo raggiungere un luogo di lavoro o di

    studio distante dalla propria abitazione ci si può servire di un mezzo pubblico di

    5 Si richiama l’attenzione sulla simbologia utilizzata: l’espressione con il punto e virgola come elemento separatore

    delle due entità dell’argomento ; f x indica che la prima entità è una variabile mentre la seconda è una

    costante, per contro quando l’elemento separatore è una virgola , f x entrambe le entità sono delle variabili.

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    9

    trasporto o utilizzare l’automobile personale o chiamare un taxi; dovendo uscire di casa

    con tempo incerto si deve decidere se prendere o meno l’ombrello, ecc.), a quelli

    relativamente più complessi riguardanti, ad esempio, il gestore di una piccola attività

    commerciale (procedere o meno alla ristrutturazione, e in che modo, dei locali in cui si

    svolge l’attività commerciale, effettuare, e in che forma e tramite quale veicolo, o meno

    attività promozionali, e fino a che punto, e in che modo, ampliare la gamma di prodotti

    offerti, ecc.) fino a quelli più complessi ed articolati quali, ad esempio quelli propri

    delle imprese di medie e grandi dimensioni (procedere alla produzione di un nuovo

    modello, e quale, di automobile, procedere - come, dove e con quali dimensioni - o

    meno all’impianto di un nuovo stabilimento, ecc.).

    Qualunque problema decisionale da risolvere, dal più banale al più complesso,

    richiede la chiara definizione del problema stesso e l’individuazione delle possibili

    relazioni che connettono i vari elementi o aspetti che lo caratterizzano.

    Il quadro logico di riferimento e le informazioni sono gli ingredienti basilari di ogni

    processo decisionale, la teoria delle decisioni, la teoria statistica ed i metodi e i modelli

    sviluppati in questi ambiti disciplinari sono gli strumenti essenziali (e necessari) per lo

    svolgimento ottimale di ogni processo decisionale, decisioni che, come già sottolineato

    e come si avrà modo di verificare successivamente, devono essere nella generalità dei

    casi prese in situazioni di conoscenza parziale della realtà in cui si opera6.

    Si è già detto che la disciplina che si occupa della raccolta e del trattamento

    scientifico dei dati statistici (manifestazioni dei fenomeni collettivi di interesse) è la

    Statistica, se poi le informazioni stesse devono essere utilizzate per risolvere uno

    specifico problema decisionale, cioè un problema che si risolve nella scelta ottimale di

    una tra diverse alternative a disposizione, allora il contesto di riferimento è la Teoria

    delle decisioni. Nella fusione delle due discipline si sostanzia un’altra disciplina

    scientifica: “La Teoria statistica delle decisioni” o “Teoria delle decisioni statistiche”

    che per certi versi può essere intesa come generalizzazione ed estensione della Statistica

    che in questo modo risulta anche meglio caratterizzata nelle sue diverse connotazioni e

    meglio precisata nei contenuti. In altri termini si può anche definire la statistica come il

    fondamento logico e metodologico per la risoluzione dei problemi decisionali.

    La teoria delle decisioni fissa principi razionali di comportamento che consentono la

    derivazione di regole di scelta ottimale. Gli sviluppi più recenti di tale teoria consentono

    anche di valutare e correggere eventuali incoerenze e contraddizioni nel comportamento

    dei decisori.

    E’ già stato sottolineato che nel contesto empirico l’elemento fondamentale di

    riferimento sono i dati statistici (disponibili e/o acquisibili) e che la statistica può essere

    identificata come la disciplina che tratta di metodi attraverso i quali i dati statistici, cioè

    6 Come già sottolineato, due sono i motivi principali che determinano una conoscenza parziale della realtà:

    l’impossibilità o la non convenienza di acquisire tutte le informazioni relative agli aspetti che interessano pur

    essendo, almeno teoricamente, possibile una tale acquisizione, o la non disponibilità, neppure potenziale, delle

    informazioni, ed è questo il caso in cui le manifestazioni del fenomeno di interesse riguardano eventi futuri o sono

    rappresentate attraverso un modello analitico.

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    10

    le manifestazioni dei fenomeni di interesse, dovrebbero o potrebbero essere impiegati

    per ottenere, in funzione delle specificità del problema analizzato, una rappresentazione

    semplificata della realtà (i dati vengono trasformati in informazione) facendo emergere

    le caratteristiche che interessano in dipendenza degli obiettivi che s’intendono

    perseguire (l’informazione diventa conoscenza utilizzabile a fini decisionali).

    In tale ottica, assumono rilevanza ulteriori elementi quali l’esatta definizione della

    qualità e quantità d’informazione che s’intende acquisire, la decisione sui tempi e sui

    modi di acquisizione e la valutazione dei costi connessi.

    La statistica, che si occupa della raccolta e del trattamento finalizzato dei dati, entra,

    a pieno titolo, in ogni processo decisionale, finalizzato al conseguimento di uno

    specifico obiettivo, che prevede l’utilizzo di informazioni. Un processo nel quale:

    l’input (materia prima) è costituito da dati statistici riferiti ad una specifica

    realtà, della quale rappresentano qualitativamente e/o quantitativamente uno o

    più aspetti;

    la trasformazione avviene attraverso l’impiego di procedure e metodi analitici;

    l’output (prodotto) è la conoscenza del fenomeno indagato la cui natura e

    interpretazione dipende dagli input utilizzati e dal meccanismo logico e

    metodologico di elaborazione e dalle finalità che s’intendono perseguire.

    Da quanto sopra detto, emergono almeno tre insiemi di elementi caratteristici:

    un insieme di elementi che vengono introdotti quali input nel processo di

    trasformazione;

    un insieme di procedure di elaborazione;

    un insieme di prodotti costituito da tutte le modalità assumibili dai risultati

    conseguenti l’applicazione delle procedure.

    Si supponga ora che sia sempre possibile associare ad ogni prodotto la descrizione

    delle conseguenze che scaturiscono dalla scelta, le quali assumeranno una fisionomia

    particolare a seconda dell’oggetto del problema: se si tratta di operare una

    compattazione di dati osservati con l’obiettivo di mettere in risalto una caratteristica

    specifica del fenomeno, le conseguenze potranno essere descritte dalla perdita (di

    informazione) determinata dal processo, oppure, se il problema è finalizzato alla scelta

    di una modalità operativa, le conseguenze potranno essere identificate in perdite

    monetarie o di altra natura ed essere, eventualmente, collegate ad errori commessi nel

    processo di trasformazione.

    Risulta, pertanto, definito un quarto insieme di elementi:

    l’insieme delle conseguenze.

    Il criterio guida nell’operare la trasformazione dei dati consiste, per quanto possibile,

    nell’evitare conseguenze negative. Ne deriva che l’informazione circa le conseguenze

    assume una rilevanza esclusiva ed un ruolo condizionante rispetto ad ogni altra tipologia

    (disponibile) per la quale si renderà, appunto, necessario un confronto o, meglio,

    un’integrazione con i dati di perdita già definiti.

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    11

    La traccia originale viene, quindi, specificata e organizzata secondo lo schema

    seguente: avendo definito l’insieme dei risultati possibili (le informazioni finali) e

    avendo individuato le perdite corrispondenti, l’elaborazione deve essere effettuata

    avendo come obiettivo la minimizzazione della perdita.

    Considerando che, con l’impostazione sopra delineata, sulla base di una funzione di

    perdita viene selezionato l’elemento ottimo (quello cioè cui corrisponde la perdita

    minima), risulta naturale attribuire agli specifici elementi che costituiscono l’insieme

    dei prodotti l’identità di decisioni, nel senso che essi rappresentano le alternative

    possibili del risultato di un problema del quale è stato specificato l’obiettivo. Si può,

    pertanto, accantonare l’espressione processo di trasformazione (compattazione) dei

    dati e fare riferimento al problema decisionale quale schematizzazione che prevede la

    lista di tutti gli esiti possibili e la scelta di quello ottimo secondo il criterio di

    minimizzazione della perdita.

    Assumendo come struttura di riferimento quella sopra introdotta è possibile

    formulare, senza perdere in generalità e senza condizionamenti, ogni problema statistico

    in termini decisionali.

    A proposito dell’ultima affermazione fatta, sorge una problematica di estrema

    rilevanza riguardo ai vantaggi e alle difficoltà, se non addirittura alla ragionevolezza,

    propria di una impostazione quale è quella decisionale. Alcuni autori ritengono

    l’impostazione decisionale applicabile ai soli problemi con finalità operative, altri

    considerano (come l’autore di queste note) la logica decisionale applicabile, secondo

    modalità particolari, a tutte le problematiche descrittive e/o inferenziali anche quando

    queste sono caratterizzate da finalità esclusivamente conoscitive, altri ancora ritengono

    la logica decisionale semplicistica ed oltremodo riduttiva.

    Gli elementi a sostegno dell’impostazione decisionale sono innumerevoli e di varia

    natura. Si può, innanzi tutto, osservare che la duplice finalità, conoscitiva ed operativa,

    assegnata alla statistica quale disciplina scientifica, con conseguente attribuzione dei

    problemi decisionali alla seconda finalità, si risolve, semplicemente, nella

    specificazione della duplice tipologia di prodotti che vanno a costituire l’insieme delle

    decisioni espresse come:

    azioni da intraprendere e da realizzare concretamente;

    affermazioni da formulare le quali, a loro volta, possono configurarsi come

    asserzioni che specificano la conformità dell’evidenza osservata nei

    confronti di una o più ipotesi assunte a priori;

    asserzioni che specificano la stima di una quantità incognita e/o

    l’adattamento di un modello teorico ad una specifica realtà di interesse,

    ecc..

    Il problema si risolve sempre in una decisione, che poi questa sia orientata al cosa

    dire o al cosa fare è solo una questione di specificità della situazione in cui lo statistico

    opera. Se si parla poi di atti o decisioni in termini più generali, nel senso di scelte, la

    suddivisione diventa addirittura artificiosa se si pensa che ogni azione può essere

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    12

    considerata come l’effetto dell’affermazione: “ la decisione d ” è la migliore possibile.

    Ne scaturisce, allora, una differenza solo verbale, terminologica e, quindi, non

    sostenibile dal punto di vista concettuale.

    Un altro rilevante aspetto che può consigliare la scelta decisionale, risiede nella

    logica interna propria della teoria statistica delle decisioni che induce a formulare ed

    interpretare correttamente un problema statistico. Si tratta di una correttezza che può

    essere ricondotta a due fatti essenziali: gli obiettivi che s’intendono perseguire e i dati

    utilizzabili. L’obiettivo della minimizzazione della perdita evidenzia, infatti, la

    parzialità e la particolarità del risultato che scaturisce dall’elaborazione: problemi

    analoghi affrontati con specificazioni diverse della funzione di perdita possono

    condurre, anzi generalmente conducono, a conclusioni diverse in quanto collegate ad

    elementi diversi dell’insieme delle decisioni possibili.

    Quale soluzione è quella giusta è quale è quella sbagliata? Nessuna delle due, oppure

    entrambe se viste in ottiche diverse; il giudizio non deve essere formulato in termini di

    correttezza o errore, si può solo dire che, ritenendo valida (accettabile, verosimile) una

    struttura di perdita così come è rappresentata dalla funzione prescelta, la decisione

    migliore è quella che risulta dall’imposizione della condizione di perdita minima.

    L’ultima riflessione si ricollega alla necessità di attribuire ai dati una specifica forma

    per poter ottenere una rappresentazione (compattazione) degli stessi significativa. La

    realtà non è né descrivibile né rappresentabile senza ricorrere a schemi concettuali di

    riferimento e in corrispondenza di ognuno di essi si ottiene un risultato, evidentemente

    parziale e condizionato allo schema specificato. La logica decisionale, i cui risultati

    sono condizionati alla particolare funzione di perdita specificata, fa emergere in modo

    inequivocabile tale consapevolezza.

    Non è infrequente imbattersi in situazioni operative nelle quali la decisione si riflette

    sulla situazione reale determinandone in qualche modo i mutamenti, diventa allora

    indispensabile procedere ad una ulteriore approfondimento dell’analisi avendo come

    obiettivo l’individuazione dei nessi causali presenti nel contesto di interesse. Nessi

    causali che, una volta definiti nelle loro specificità, devono essere inseriti nella

    procedura di analisi valutandone l’impatto sulle conseguenze relative alle singole

    azioni.

    A conclusione di questa introduzione si sottolinea che, sempre in funzione del

    contesto in cui si opera, si distinguerà la teoria statistica delle decisioni in classica e

    bayesiana che potrà essere ulteriormente distinta in causale o non causale7.

    0.4 - Digressione: scale di misura

    Come sottolineato più volte, uno dei compiti principali della statistica è quello di

    descrivere i fenomeni collettivi come primo passo verso la loro spiegazione, cui si può

    pervenire anche applicando i metodi induttivi della statistica attraverso la verifica

    7 Il lettore interessato ad un approfondimento dell’argomento può utilmente consultare , tra gli altri, Chiandotto

    (2012 e 2013). I due contributi sono riportati nella stessa pagina web di queste note.

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    13

    empirica di ipotesi sviluppate sul piano teorico. Ma il passaggio dal piano teorico a

    quello empirico non è per niente immediato; per poter connettere i concetti, sviluppati

    nel contesto teorico ed in quello empirico, risulta indispensabile operare delle scelte

    preliminari. Una di queste ha carattere fondamentale e riguarda il tipo di misura che si

    intende adottare come espressione delle manifestazioni dei fenomeni oggetto di

    indagine. La scala di misura non può che avere carattere convenzionale, e sarà tanto più

    efficace quanto più riesce a facilitare la spiegazione dei fenomeni.

    La classificazione secondo una scala di misura convenzionalmente scelta è

    l'operazione che accompagna il processo di osservazione ogni qual volta quest'ultimo si

    trasforma da occasionale in volontario e finalistico (osservazione scientifica). La

    classificazione pertanto rappresenta il primo stadio di ogni ricerca e consiste nel

    raggruppare le manifestazioni dei fenomeni secondo una o più caratteristiche di

    interesse, decidendo quali manifestazioni devono considerarsi uguali e quali diverse.

    Per ciò che concerne l'operazione di classificazione secondo una scala di misura si

    distinguono, generalmente, quattro diversi livelli di misurazione; in questo contesto si

    parla di scale nominali, scale ordinali, scale di intervallo e scale razionali o di rapporto.

    La scala nominale costituisce il più semplice livello di misurazione. Sotto il profilo

    formale le scale nominali possiedono unicamente le proprietà di simmetria e di

    transitività; da ciò deriva che relativamente alle manifestazioni di fenomeni classificate

    secondo una scala nominale si potrà semplicemente affermare se sono uguali o diverse.

    Esempi di caratteri in scala nominale sono: il sesso, il tipo di diploma di scuola media

    superiore, il settore merceologico, ecc.

    La scala ordinale consente un ordinamento delle manifestazioni dei fenomeni in

    funzione dell'entità posseduta di un certo carattere senza che sia possibile, peraltro,

    stabilire l'ammontare (intensità) del carattere posseduto; tale fatto pone le scale ordinali

    ad un livello inferiore rispetto alle scale di intervallo nelle quali è invece possibile

    misurare tale entità. Esempi di caratteri espressi in scala ordinale sono: il titolo di

    studio, il grado militare, la qualifica del personale, ecc.

    La scala di rapporto rappresenta il più alto livello di misurazione, ha uno zero

    assoluto (non arbitrario) e possiede una unità di misura di tipo fisico scelta come

    elemento comune di riferimento.

    La scala di intervallo, che possiede tutte le proprietà delle scale nominali ed ordinali,

    si differenzia dalla scala di rapporto in quanto, pur possedendo una unità di misura di

    tipo fisico, lo zero in essa contenuto ha natura arbitraria.

    Sia le scale di rapporto che le scale di intervallo sono dunque espresse con una unità

    di misura fisica scelta come elemento di riferimento e in questo caso si parla di

    fenomeni misurabili, la diversità tra le due scale risiede nello zero scelto, che è assoluto

    nelle scale di rapporto (il numero di componenti di un nucleo familiare, l’utile

    conseguito da una azienda in un anno, ecc.), relativo nelle scale di intervallo (l’intensità

    dei terremoti espressa in scala Mercalli o Richter, la temperatura di un corpo espressa in

    gradi Celsius o Fahrenheit, ecc.). Sulle due scale è quindi possibile applicare le usuali

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    14

    operazioni aritmetiche di addizione, sottrazione, moltiplicazione e divisione, ma solo

    per i fenomeni le cui manifestazioni sono espresse con una scala di rapporto ha senso

    istituire, appunto, un rapporto tra diverse intensità di manifestazione; ad esempio, ha

    senso concludere che il salario del dipendente A, che percepisce 3.000 € al mese, è il

    doppio di quello del dipendente B, che ne percepisce 1.500, mentre non ha senso

    affermare che la temperatura del corpo A è il doppio di quella del corpo B se le due

    temperature sono, rispettivamente, pari a 10° e 5° gradi Celsius, mentre è del tutto

    sensato dire che la differenza di temperatura tra i due corpi è di 5° gradi Celsius.

    L'aver distinto i procedimenti di classificazione secondo una scala di misura è

    operazione tutt’altro che oziosa; infatti, è proprio la scala di misura adottata a

    condizionare la scelta dei metodi statistici (descrittivi, induttivi o decisionali) d'analisi

    più appropriati.

    Con riferimento ai problemi di classificazione secondo la scala di misura adottata, va

    detto che gli statistici tendono usualmente ad operare una classificazione dicotoma dei

    fenomeni a seconda che le loro manifestazioni abbiano natura qualitativa (scale

    nominali ed ordinali) o quantitativa (scale di intervallo o di rapporto). Un tale fatto porta

    a distinguere, come già evidenziato nelle pagine precedenti, i fenomeni in mutabili8 e

    variabili a seconda che essi assumano, nelle loro manifestazioni, modalità qualitative o

    modalità quantitative.

    Un fenomeno variabile, e cioè un fenomeno classificato secondo le modalità

    quantitative di un suo carattere, può avere natura discreta o continua. Essendo il numero

    associato a ciascuna modalità misurabile di un certo carattere usualmente detto

    variabile, in seguito si parlerà semplicemente di variabili (discrete o continue) senza

    stare a specificare ogni volta che si sta trattando di un fenomeno classificato secondo le

    modalità quantitative di un suo carattere (discreto o continuo).

    Una variabile discreta può assumere soltanto un insieme finito o un’infinità

    numerabile di valori, mentre una variabile continua potrà assumere tutti i valori

    all'interno di un certo intervallo dell’asse reale. Sono variabili discrete il numero dei

    soggetti affetti da cancro polmonare, il numero degli abitanti di una certa regione, ecc.;

    sono variabili continue la temperatura di un corpo, l'età di un individuo, la velocità di

    un'automobile, ecc. In linea generale tutte le grandezze relative allo spazio (lunghezza,

    superficie, ecc.), al tempo (età, durata in vita, ecc.) e alla massa (peso, pressione

    arteriosa, ecc.), sono delle variabili continue9.

    Si parla di mutabili o variabili semplici, quando un fenomeno risulta classificato

    secondo le modalità (qualitative o quantitative) di un solo carattere, si parla invece di

    mutabili/variabili multiple o multivariate o multidimensionali (vettori casuali),

    8 Si segnala in proposito che la dizione mutabile statistica è poco utilizzata. Quando il carattere di interesse ha natura

    qualitativa usualmente si parla di variabili qualitative od anche di dati categorici, espressi con scala nominale o

    ordinale. 9 Nel trattare le variabili casuali, cioè entità variabili che possono assumere un’infinità non numerabile di valori

    dell’asse reale si farà riferimento ai loro intervalli di definizione (supporto) utilizzando la seguente notazione:

    http://upload.wikimedia.org/wikipedia/commons/3/39/Latex_real_numbers.svg

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    15

    quando un fenomeno viene classificato secondo le modalità (qualitative o quantitative)

    di più caratteri; nel caso in cui si considerino, relativamente ad un certo fenomeno,

    caratteri aventi natura qualitativa e caratteri aventi natura quantitativa, si parla di

    variabili miste.

    Relazioni e scale di misura

    Scala di misura

    Relazione Qualitativa Quantitativa

    Nominale Ordinale Intervallo Rapporto

    ci = cj * * * *

    ci cj * * * *

    ci cj * * *

    ci - cj * *

    ci : cj *

    Conclusioni

    La Statistica quale disciplina scientifica, qualunque sia la sua connotazione di statistica

    descrittiva, statistica induttiva (inferenza statistica) o teoria statistica delle decisioni,

    deve necessariamente avvalersi della matematica (essendo essa stessa una disciplina

    matematica).

    Nel lettore di queste note didattiche si presuppone la conoscenza dell’analisi

    matematica nei connotati essenziali (calcolo differenziale ed integrale in una e più

    variabili)10

    .

    Non si presuppone, invece, la conoscenza di quella parte della matematica che è nata

    e si è sviluppata per il trattamento scientifico dei contesti aleatori: “La Teoria delle

    probabilità”.

    Essendo l’aleatorietà la peculiarità intrinseca dell’oggetto di studio dell’inferenza

    statistica, il primo capitolo di queste note è dedicato alla trattazione sintetica degli

    aspetti essenziali della probabilità vista però nelle sue caratterizzazioni strumentali

    preferendo, di conseguenza, la dizione di Calcolo delle probabilità a quella di Teoria

    delle probabilità.

    Nel primo capitolo, dedicato interamente alla probabilità, si procede alla

    introduzione delle variabili casuali (v.c.) e alla illustrazione dei modelli probabilistici

    (variabili casuali discrete e continue, semplici e multiple) di uso più frequente. Il

    secondo capitolo tratta del campionamento e delle distribuzioni campionarie. La stima

    statistica (puntuale e di intervallo) e il test delle ipotesi sono oggetto, rispettivamente,

    (a,b)=x a < x < b; [a,b]=x a x b; (a,b]=x a < x b; [a,b)=x a x < b. 10 Per il lettore che ritiene di dover “rinfrescare” le proprie conoscenze matematiche un utile riferimento è Khuri

    (2003).

    http://upload.wikimedia.org/wikipedia/commons/3/39/Latex_real_numbers.svghttp://upload.wikimedia.org/wikipedia/commons/3/39/Latex_real_numbers.svghttp://upload.wikimedia.org/wikipedia/commons/3/39/Latex_real_numbers.svghttp://upload.wikimedia.org/wikipedia/commons/3/39/Latex_real_numbers.svg

  • B. Chiandotto Versione 2017

    INFERENZA STATISTICA

    Premessa

    16

    del terzo e del quarto capitolo. La trattazione rientra nell’ambito della cosidetta

    Inferenza statistica classica parametrica mentre l’Inferenza statistica bayesiana

    parametrica viene trattata molto sommariamente nel sesto capitolo. Il quinto capitolo è

    dedicato alla trattazione di uno dei temi classici e più rilevanti dell’inferenza statistica:

    il modello statistico lineare (rappresentazione analitica delle relazioni tra caratteri). La

    rappresentazione analitica implica l’introduzione di modelli matematici che sono

    logicamente giustificati soltanto se si ritiene che la realtà d’interesse sia rappresentabile

    attraverso il modello stesso; se si ritiene, cioè, che il fenomeno o i fenomeni di

    riferimento siano governati da leggi esprimibili analiticamente ricordando che:

    All models are wrong but some are useful (George E.P. Box, 1979)11

    .

    Il settimo e conclusivo capitolo è dedicato ad una sommaria esposizione della Teoria

    statistica delle decisioni12

    .

    11

    Molti anni prima di Box, Pompilj (1951) in un contributo sulla Logica della conformità, scrive: ”…..

    Voglio invece osservare che non solo la conformità è concettualmente diversa dalla plausibilità, ma che

    addirittura nel nostro ordine di idee, un problema della plausibilità o significatività non ha senso, perché

    non è lecito domandarsi se un modello è vero o falso quando si può sempre rispondere che, a stretto

    rigore, ogni modello è falso, in quanto non coincide con la realtà.

    Questo, naturalmente, non vuol dire che una teoria della significatività non abbia senso, ma solo che essa

    non può servire per discutere se il modello è vero,….”. ….. mentre invece il suo uso, correttamente fatto

    nell'ambito del modello, può diventare utilissimo, purché lo schema teorico di per se stesso già affermi

    che possono agire più cause e per di più fornisca tutti i dati necessari per una corretta applicazione di

    tali teorie, di modo che di volta in volta, e sempre relativamente al modello che sta alla base delle nostre

    indagini, si possa inferire, dall'esame dei risultati sperimentali, sulle cause che hanno agito. Ma fuori di

    questo modello, che deve essere considerato preesistente e indiscutibile, ogni indagine in tal senso risulta

    necessariamente vana!”

    Riguardo alle affermazioni di Box e Pompilj, occorre precisare che si tratta di riferimenti ad una

    particolare interpretazione del termine modello; in realtà, come si avrà modo di chiarire successivamente,

    alcuni modelli (probabilistici) non costituiscono una rappresentazione semplificata della realtà ma

    derivano dalla traduzione in termini analitici del processo generatore dei dati. 12

    Gli argomenti illustrati in queste note sono trattati in forma più estesa, tra gli altri, in Mood, Graybill,

    Boes (1988); Piccolo (1998); Barnett (1999); Robert (2001); Rohatgi e Salek (2001); Gelman e al

    (1995); Casella, Berger (2002), Keener (2010) e Olive (2014).