Slides Statistica Intro

Embed Size (px)

Citation preview

  • 8/12/2019 Slides Statistica Intro

    1/23

    Statistica I - a.a.2009/10 - Prof. Paroli 1

    Corsi di Laurea Triennali diEconomia

    Prof.ssa Roberta Paroli

    Corso diSTATISTICA I (gruppo A-Cl)a.a. 2009/2010

    Statistica I - a.a.2009/10 - Prof. Paroli 2

    STRUTTURA DEL CORSOSTRUTTURA DEL CORSO

    ORARIO DEL CORSO:ORARIO DEL CORSO:lun. 15.30lun. 15.30 --18.3018.30 -- aula Manzoni (G022)

    giov. 13.30giov. 13.30 --15.3015.30 -- aula Manzoni (G022)

    ESERCITAZIONIESERCITAZIONI: dott.ssa Marta Nai Ruscone????????

    INFORMAZIONI GENERALI

    Statistica I - a.a.2009/10 - Prof. Paroli 3

    RICEVIMENTORICEVIMENTOMARTEDI 10:30 12:30

    Dipartimento di Scienze Statistiche

    via Necchi 9 I piano

    e-mail:

    aula virtuale:

    [email protected]

    www.unicatt.it/docenti/paroli

    Statistica I - a.a.2009/10 - Prof. Paroli 4

    TESTITESTIGli appunti dilezionied esercitazionisono fondamentali

    Il materiale delle lezioni disponibile su Blackboard.

    TEORIAFrosini B.V.(2001) Metodi Statistici: teoria e applicazioni economiche e

    sociali , Carocci, RomaSantamaria L.(2006) Statistica descrittiva: applicazioni di carattere

    economico e aziendale, Vita e Pensiero

    Pacini B. e Raggi M.(2006) S tatistica per lanalisi operativa dei dati Carocci, Roma

  • 8/12/2019 Slides Statistica Intro

    2/23

    Statistica I - a.a.2009/10 - Prof. Paroli 5

    ESERCIZI

    Sono scaricabili da Blackboard:

    I testi desame degli a.a. 2008/2009 - 2007/2008 -2006/2007 - 2005/2006 2004/2005 - 2003/2004 -2002/2003 - 2001/2002 2000/2001

    con soluzioni esteseper gli

    a.a. 2001/2002a.a. 2002/2003

    a.a. 2003/2004

    con soluzioni sinteticheper gli

    a.a. 2000/2001a.a. 2004/2005

    a.a. 2005/2006

    a.a. 2006/2007

    solo i testi

    Statistica I - a.a.2009/10 - Prof. Paroli 6

    ESAMEESAME:: scritto esercizi di calcolo e teorici

    orale domande di teoriaDurata della prova: 1h 30

    Sono previste le prove intermedieSono previste le prove intermedie

    ESAME

    Ammissione alle prove intermedie : Le prove intermedie sono pensateper chi partecipa assiduamente alle lezioni, essendo riferite principalmenteagli argomenti trattati in aula nellanno in corso. Pertanto si rivolgonogeneralmente ai frequentanti. Ove la didattica del corso lo consenta, nepu essere prevista lestensione anche ad altre tipologie di studenti.La prova intermedia facoltativa per lo studente.

    Statistica I - a.a.2009/10 - Prof. Paroli 7

    I prova: nella settimana delle prove intermedieProgramma:statistica univariata/bivariata Durata: 1 ora o 45min

    La prova consister di esercizi in parte di calcolo e in parte teorici.Lesito sar comunicato entro Natale 2009.

    II prova: in uno degli appelli della sessione invernaleProgramma:statistica bivariata e probabilit Durata: 1 ora o 45min

    Alla II prova potr accedere solo chi avr ottenuto esito positivo nellaI prova intermedia.La prova consister di esercizi in parte di calcolo e in parte teorici.

    Prova orale: obbligatoria per tutti

    PROVE INTERMEDIEPROVE INTERMEDIE

    Statistica I - a.a.2009/10 - Prof. Paroli 8

    Non prevista la possibilit di effettuare alcuncambio corso (gruppo di lettere / professore)e non valgono i cambi corso effettuati gli anniscorsi

    TRASFERIMENTO GRUPPO

    Ciascuno pu pero frequentare le lezioni con il docente preferito ma dovr obbligatoriamente sostenere lesame con il docentedel suo gruppo di lettere(anche se non quello preferito!!!!!)

  • 8/12/2019 Slides Statistica Intro

    3/23

    Statistica I - a.a.2009/10 - Prof. Paroli 9

    - La buona educazione vorrebbe che si salutasse il docente (meglio buongiorno o buonasera; salve Prof. non molto gradito)

    - Indicare sempre nome, cognome, matricola e linsegnamento(ogni docente tiene pi di un corso e non conosce tutti gli studentiper nome non siamo al liceo).- Scrivere in italiano, usando la punteggiatura. Rileggere la mailper verificare che non ci siano errori di grammatica ( vero che lamail vi d anonimato, ma se lerrore molto grave .ciricordiamo di voi!)

    - Non correggiamo esercizi via mail, dunque non rispondiamoalle mail che lo richiedono- Non chiedeteci via mail le aule dellesame (scritto o orale),perch anche noi le scopriamo guardando la bacheca on-line.

    LE MAIL AL DOCENTE

    Statistica I - a.a.2009/10 - Prof. Paroli 10

    1) Frequentare le lezioni e le esercitazioni non OBBLIGATORIOma sicuramente utile2) Studiare sempre prima la TEORIA e, solo dopo averla capita,fare gli esercizi. Fare il viceversa non d gli stessi risultati.3) Ripetere a voce alta pensando di dovere spiegare a qualcunoquello che studiate. Dovete essere convinti di quello che dite pensate a quando lavorerete!4) Studiare volta per volta. Questo vi far capire meglio i nuoviargomenti5) Fare domande quando non si capisce (il ricevimento studenti da sfruttare non solo la settimana prima degli esami!)

    COME SI STUDIA STATISTICA???

    Statistica I - a.a.2009/10 - Prof. Paroli 11

    INTRODUZIONE

    Statistica I - a.a.2009/10 - Prof. Paroli 12

    COSA E LA STATISTICA???

    Se si muove biologia, se cambia colore chimica, se si rompe fisica, se ti fadormire statistica

    (Bob Hogg - Universit Iowa)

    FRASI CELEBRI ..

  • 8/12/2019 Slides Statistica Intro

    4/23

    Statistica I - a.a.2009/10 - Prof. Paroli 13

    Ci sono tre generi di bugie:le piccole, le grandi e le statistiche

    (Mark Twain)

    To r t u r a a b b a s t a n z a a l u n g o i d a t i e de s s i co n f e s s e r a n n o q u a l u n q u e c o s a

    Statistica I - a.a.2009/10 - Prof. Paroli 14

    e nei fumetti

    Statistica I - a.a.2009/10 - Prof. Paroli 15 Statistica I - a.a.2009/10 - Prof. Paroli 16

  • 8/12/2019 Slides Statistica Intro

    5/23

    Statistica I - a.a.2009/10 - Prof. Paroli 17

    Un insieme di strumenti logici e matematico-probabilistici per la misura e il trattamento di insiemidi informazioni configurabili come fenomeni di massa(grandi quantit di dati).

    La sua conoscenza non solo cruciale in ambitoscientifico, ma fondamentale nella gestione aziendale edi non trascurabile importanza nella vita quotidiana.

    Uno strumento di supporto nei processi decisionali(specie in quelle situazioni in cui si devono prenderedecisioni in condizione di incertezza grazie allapportodecisivo della teoria della probabilit).

    Pi seriamente.. cosa la STATISTICA ?????

    Statistica I - a.a.2009/10 - Prof. Paroli 18

    La STATISTICA si pu utilizzare in contesti moltodifferenti:

    - per studiare landamento di un titolo di borsa- per controllare la qualit di un processo produttivo- per monitorare le vendite di un negozio- per misurare la soddisfazione dei clienti- per effettuare confronti (ad es. tra due squadre di

    calcio)- per leggere i risultati delle analisi mediche- per le analisi demografiche- Vediamo alcuni esempi

    Statistica I - a.a.2009/10 - Prof. Paroli 19

    A quanto ammonta il livello giornaliero degli inquinanti dellaria?Varia nel tempo?

    statistica ed inquinamento

    PM 10

    viaVico/Olivetani

    (Zona1)S. Ambrogio

    Statistica I - a.a.2009/10 - Prof. Paroli 20

    L'inflazione un processo di aumento del livello generaledei prezzi dell'insieme dei beni e servizi destinati al consumodelle famiglie. Generalmente, si misura attraverso lacostruzione di un indice dei prezzi al consumo .Un indice dei prezzi al consumo uno strumento statistico chemisura le variazioni nel tempo dei prezzi di un insieme di beni eservizi, chiamato paniere, rappresentativo degli effettiviconsumi delle famiglie in uno specifico anno.In Italia, come nella maggior parte dei paesi, il calcolodell'indice affidato all'Istituto nazionale di statistica (ISTAT).

    In particolare, l'Istat produce tre diversi indici dei prezzi alconsumo: per l'intera collettivit nazionale (NIC), per lefamiglie di operai e impiegati (FOI) e l'indice armonizzatoeuropeo (IPCA).

    statistica ed economia

    Come si misura linflazione???

  • 8/12/2019 Slides Statistica Intro

    6/23

    Statistica I - a.a.2009/10 - Prof. Paroli 21

    Periodo di riferimento: agosto 2008Aggiornato il 15 settembre 2008

    +5,5Variazione percentuale rispetto allo stesso mesedi due anni precedenti

    +3,9Variazione percentuale rispetto allo stesso mesedell'anno precedente

    +0,1Variazione percentuale rispetto al mese precedente

    135,5Indice generale

    Indice dei prezzi al consumo FOI

    Per adeguare periodicamente i valori monetari, ad esempiogli affitti o gli assegni dovuti al coniuge separato, si utilizza

    l'indice dei prezzi FOI.

    Statistica I - a.a.2009/10 - Prof. Paroli 22

    statistica e popolazione

    Ad esempio d informazioni sulla natalit.

    Statistica I - a.a.2009/10 - Prof. Paroli 23 Statistica I - a.a.2009/10 - Prof. Paroli 24

    o sul fenomeno migratorio

  • 8/12/2019 Slides Statistica Intro

    7/23

    Statistica I - a.a.2009/10 - Prof. Paroli 25

    come pu unazienda accrescere e sfruttare al meglio le sueconoscenze sul mercato in cui opera, sui suoi clienti, suiconcorrenti?

    statistica e marketing

    Esempio 1

    Statistica I - a.a.2009/10 - Prof. Paroli 26

    Esempio 2

    Esempio 3

    Statistica I - a.a.2009/10 - Prof. Paroli 27

    perch intervistando un piccolo gruppo di persone (un campione)possiamo dire qualcosa su tutta la popolazione? Quali regole nellascelta del campione occorre seguire per ottenere risultati affidabili?

    statistica e sondaggi

    SONDAGGI DI MERCATO: per conoscere abitudini, preferenze,gusti e aspettative del consumatore. Per testare lefficacia di unnuovo prodotto o varianti dello stesso prima di lanciarlo sul

    mercatoSONDAGGI DI OPINIONE: conoscere lopinione pubblica sullequestioni di interesse generale (e non solo) attinenti le sfere:dellattivit sociale, del costume, della politica, delletica, dellareligioneSONDAGGI POLITICO-ELETTORALI:www.sondaggipoliticoelettorali.it

    Statistica I - a.a.2009/10 - Prof. Paroli 28

    Per altri esempi visita il sito ISTATwww.istat.it

  • 8/12/2019 Slides Statistica Intro

    8/23

    Statistica I - a.a.2009/10 - Prof. Paroli 29

    Dati , statistiche e probabilit sonopresenti in tutte le notizie della stampa ein TV:

    ma chi sa leggerle e interpretarle con

    chiarezza?

    Statistica I - a.a.2009/10 - Prof. Paroli 30

    Attenzione a distinguere tra lettura e

    interpretazionedei risultati.

    La lettura deve essere oggettiva.L interpretazione pu essere diversa se diversisono i punti di partenza da cui ci si muove.Non ci si deve sorprendere se uno stessorisultato viene interpretato in modo diverso daanalisti che partono da punti di vista diversi.

    Statistica I - a.a.2009/10 - Prof. Paroli 31

    Obiettivo del corso

    FAR DORMIRE ?????

    FORNIRE GLI STRUMENTI PEROTTENERE E LEGGERECORRETTAMENTE I RISULTATI

    DELLE ANALISI DEI DATIStatistica I - a.a.2009/10 - Prof. Paroli 32

    ANALISI STATISTICA UNIVARIATA

    - Indici di posizione

    Medie non analitiche

    Medie analitiche

    - La variabilit e la mutabilit statistica

    Misure assolute di variabilit

    Misure assolute di mutabilit/eterogeneit

    Indici relativi e normalizzati

    - Indici di forma- Rapporti statistici

    Numeri indici

    PROGRAMMAPROGRAMMA

  • 8/12/2019 Slides Statistica Intro

    9/23

    Statistica I - a.a.2009/10 - Prof. Paroli 33

    ANALISI STATISTICA MULTIVARIATA

    - Indipendenza statistica

    - Connessione fra due caratteri qualitativi

    misure della connessione

    - Studio della relazione in media fra due caratteri

    funzione di regressione

    - Misure di dipendenza lineare: correlazione

    - Regressione ai minimi quadrati- Cenni al modello di regressione lineare multipla

    Statistica I - a.a.2009/10 - Prof. Paroli 34

    CALCOLO DELLE PROBABILIT- Definizione di probabilit

    - Teoremi di base del calcolo delle probabilit

    - I principali modelli probabilistici

    ELEMENTI DI INFERENZA STATISTICA (???)- Cenni al campionamento

    - Stima puntuale

    - Stima intervallare- Cenni sulla verifica statistica delle ipotesi

    Programma diun corso diSTATISTICA II

    Statistica I - a.a.2009/10 - Prof. Paroli 35

    Altri corsi di STATISTICA

    Statistica Applicata I modulo: INFERENZA II modulo: caratterizzante a seconda del cdl scelto

    (statistica economica, econometria, teoria deicampioni, statistica per il marketing, .)

    Nella laurea specialistica potrete trovare altriesami di Statistica

    Statistica I - a.a.2009/10 - Prof. Paroli 36

    STATISTICA DESCRITTIVASTATISTICA DESCRITTIVAsintesi delle osservazioni campionarie o dei dati

    censuari

    STATISTICA PROBABILISTICASTATISTICA PROBABILISTICAstudio del meccanismo generatore delle

    realizzazioni campionarie(modello campione)

    STATISTICA INFERENZIALESTATISTICA INFERENZIALE

    dal campione al suo meccanismo generatore(campione modello)

    BRANCHE DELLA STATISTICA

  • 8/12/2019 Slides Statistica Intro

    10/23

    Statistica I - a.a.2009/10 - Prof. Paroli 37

    - Definizione degli obiettivi- Astrazione

    individuazione delle variabiliosservabili/proxy

    - Individuazione della popolazioneo definizione del piano di campionamento(se si tratta di una indagine campionaria)

    - Rilevazionesperimentazione, questionari, .

    FASI DELLA RICERCA STATISTICA

    Statistica I - a.a.2009/10 - Prof. Paroli 38

    - Registrazione dei datiorganizzazione daticlassificazione

    - Elaborazione dei datisintesiinterpretazione

    inferenza

    Statistica I - a.a.2009/10 - Prof. Paroli 39

    ANALISI DEI DATIANALISI DEI DATI

    DATA BASE

    analisi esplorative analisi confermative

    TECNICHESTATISTICHE

    (DATA MINING)

    Statistica I - a.a.2009/10 - Prof. Paroli 40

    I DATI

    Qualsiasi analisi dei dati presuppone che essisiano organizzati in modo che i risultati non

    siano influenzati dalla cattiva costruzione deldatabase.

    Le regole fondamentali sono: verifica delle fonti verifica della qualit dei dati creazione della matrice dei dati

  • 8/12/2019 Slides Statistica Intro

    11/23

    Statistica I - a.a.2009/10 - Prof. Paroli 41

    tabella formata dalle osservazioni di tutti idati

    rilevati per ognielementooggetto dellindagine

    DATA BASE = matrice dei dati

    xknxinx2nx1nn

    xkjxijx2jx1j j

    xk2xi2x22x122xk1xi1x21x111XkXiX2X1

    Statistica I - a.a.2009/10 - Prof. Paroli 42

    EURISKO: I BILANCI DELLE FAMIGLIE ITALIANEnel 1998 questionario capofamiglia

    INDAGINE BANCA DITALIA INFORMAZIONI RIGUARDANTI struttura famiglia occupazione e redditi strumenti di pagamento e forme di risparmio abitazioni e altri beni immobiliari consumi e spese familiari forme assicurative

    ESEMPIO DATA-BASE

    Statistica I - a.a.2009/10 - Prof. Paroli 43

    NQUEST NCOMP SEX PARENT ANASC ETA STACIV STUDIO Is t ruz_anni APQUAL APSETT ETALAV1 4 0 2 1959 39 1 3 8 1 4 152 4 0 3 1978 20 2 5 12 1 7 163 4 0 2 1947 51 1 5 12 3 9 214 3 1 1 1948 50 1 5 13 2 9 185 3 1 1 1960 38 1 7 18 4 2 186 1 0 1 1938 60 3 7 17 4 9 257 4 0 2 1954 44 1 5 12 2 9 208 2 1 1 1937 61 1 2 5 1 3 169 1 0 1 1961 37 2 3 8 1 9 15

    10 2 1 1 1941 57 1 5 13 2 3 2011 4 0 2 1954 44 1 3 8 1 9 1812 4 1 3 1974 24 2 3 8 2 2 2013 4 1 1 1954 44 1 3 8 1 2 2114 4 1 1 1950 48 1 5 13 5 7 2415 4 1 1 1949 49 1 3 8 1 9 1516 2 0 1 1964 34 2 5 13 2 4 1617 3 1 3 1978 20 2 3 8 1 4 1518 4 0 2 1946 52 1 3 8 1 9 1819 3 0 2 1963 35 1 3 8 2 2 1820 3 1 1 1968 30 1 5 13 2 2 1921 4 1 3 1974 24 2 5 13 1 4 1522 3 1 1 1950 48 1 5 13 4 4 2423 4 1 1 1960 38 1 5 13 2 5 1524 5 0 2 1957 41 1 3 8 1 2 1525 5 0 3 1970 28 1 3 8 1 4 1826 4 1 1 1966 32 1 2 5 1 2 16

    27 4 0 3 1976 22 2 5 13 4 2 2028 2 0 1 1947 51 2 6 15 2 9 2029 3 0 3 1969 29 2 5 13 2 3 2630 5 0 2 1948 50 1 5 13 2 9 2131 5 0 2 1950 48 1 5 12 3 9 1832 2 1 1 1945 53 4 2 5 1 3 1533 2 1 3 1957 41 2 7 18 3 9 27

    un estratto .

    Statistica I - a.a.2009/10 - Prof. Paroli 44

    - Unit statistiche o sperimentalisupporto fisico/materiale dellindagine

    - popolazione/universo- campione

    - Caratteripropriet dellunit sperimentale

    - qualitativi- quantitativi

    TERMINOLOGIA

  • 8/12/2019 Slides Statistica Intro

    12/23

    Statistica I - a.a.2009/10 - Prof. Paroli 45

    - Modalit del caratteremodo di manifestarsi del carattere

    - attributi qualitative- misure quantitative

    Statistica I - a.a.2009/10 - Prof. Paroli 46

    tabella formata dalle osservazioni di tutti icaratteri rilevati per ogni unit statistica

    CODFAM PAR SESS DATANASC COMNASSTCIVITITSTU PROF DATAPROV COMMA DATAMATR NCOMPON1538404 25 M 3/5/1953 072004 29 6/30/2001 00084320 01 F 1/19/1962 034027 CG 39 034027 5/6/1989 30139424 05 M 2/25/1951 034027 CG 29 45307 034027 7/20/1974 30139424 06 F 4/27/1955 034025 CG 16 99116 2/8/1965 034027 7/20/1974 30025597 18 F 9/19/1959 034027 CG 39 23916 034027 4/7/1980 40087423 03 F 7/18/1968 034033 CG 16 12/16/1975 034027 10/11/1987 30131457 01 F 9/9/1966 280042 CG 39 12505 9/3/1993 034027 3/27/1999 40087423 01 M 2/3/1965 034027 CG 29 034027 10/11/1987 3

    0039567 03 F 11/14/1951 034012 CG 29 6/6/1967 034027 10/20/1973 40065549 01 M 7/14/1950 034010 CG 29 21604 4/22/1963 034027 6/27/1976 30056435 01 M 9/10/1948 034027 CG 29 99102 034027 6/1/1974 30025597 04 M 2/15/1956 034027 CG 29 14701 7/13/1960 034027 4/7/1980 40056435 03 F 10/24/1951 034027 CG 39 23916 034027 6/1/1974 30155733 05 M 11/19/1951 034027 CG 29 62302 6/27/1974 034027 3/30/1974 3

    caratteri

    unitstatistiche

    Statistica I - a.a.2009/10 - Prof. Paroli 47

    - QUALITATIVI / CATEGORICI. sconnessi. ordinati

    - QUANTITATIVI / METRICI. discreti. continui

    TIPI DI CARATTERI

    Statistica I - a.a.2009/10 - Prof. Paroli 48

    modalitmodalit = attributi

    - sconnessi (scala nominale). comune di residenza. tipo di industria. tipo di fabbricazione

    - ordinati (scala ordinale). titolo di studio. grado di vendibilit. risultato di un esame (A,B,C, ) ...

    CARATTERI QUALITATIVI

  • 8/12/2019 Slides Statistica Intro

    13/23

    Statistica I - a.a.2009/10 - Prof. Paroli 49

    esempio :

    moltodaccordo Indifferente decisamentecontrario

    (punteggi espressi su scale convenzionali )

    osservazione :NON HA SENSO CONFRONTARE DISTANZE

    TRA MODALIT(anche se codificate con valori numerici)

    Statistica I - a.a.2009/10 - Prof. Paroli 50

    NQUEST NCOMP SEX PARENT ANASC STACIV STUDIO APQUAL YL ORETOT

    1 4 F coniuge 1959 coniug. media inf. operaio 18000 45

    2 4 F figlio/a 1978 celibe media sup. operaio 8000 25

    3 4 F coniuge 1947 coniug. media sup. insegn. 28000 65

    4 3 M capo fam. 1948 coniug. media sup. impieg. 48000 42

    5 3 M capo fam. 1960 coniug. laurea dirigente 40000 50

    6 1 F capo fam. 1938 separato laurea dirigente 36000 42

    7 4 F coniuge 1954 coniug. media sup. impieg. 29500 36

    8 2 M capo fam. 1937 c oniug. elem. operaio 15000 45

    9 1 F capo fam. 1961 celibe media inf. operaio 22100 40

    sconnessi ordinati

    Statistica I - a.a.2009/10 - Prof. Paroli 51

    modalitmodalit = misure

    numeri reali che descrivono una propriet oggettivadellunit statistica

    - discretiinsieme di modalit: finito , numeri interi

    - continuiinsieme di modalit: infinito , numeri reali

    CARATTERI QUANTITATIVI

    Statistica I - a.a.2009/10 - Prof. Paroli 52

    - ordinamento dei numeri reali

    - definibile una funzione distanza tramodalit

    d = |x 2 - x1| = |x 1 - x2| 0per la quale

    d = 0 x1 = x 2ed inoltre

    |x 1 - x3| |x 1 - x2| + |x 2 - x3|

    osservazioneHANNO SENSO LE DIFFERENZE (E LE SOMME)

  • 8/12/2019 Slides Statistica Intro

    14/23

    Statistica I - a.a.2009/10 - Prof. Paroli 53

    NQUEST NCOMP SEX PARENT ANASC STACIV STUDIO APQUAL YL ORETOT

    1 4 F c oniuge 1959 coniug. media inf. operaio 18000 45

    2 4 F figlio/a 1978 celibe media sup. operaio 8000 25

    3 4 F c oniuge 1947 coniug. media sup. ins egn. 28000 65

    4 3 M c apo fam. 1948 c oniug. media s up. impieg. 48000 42

    5 3 M c apo fam. 1960 coniug. laurea dirigente 40000 50

    6 1 F c apo fam. 1938 s eparat o laurea dirigent e 36000 42

    7 4 F c oniuge 1954 coniug. media sup. impieg. 29500 36

    8 2 M capo fam. 1937 c oniug. elem. operaio 1 5000 45

    9 1 F c apo fam. 1961 celibe media inf. o peraio 22100 40

    discreti continui

    Statistica I - a.a.2009/10 - Prof. Paroli 54

    organizzazione dei dati elementari

    prospetti/elenchi delle osservazioni

    se i dati sono tanti utile riorganizzarli inTABELLE

    utilizzando la nozione fondamentale diFREQUENZA

    TABELLE DI FREQUENZA

    Statistica I - a.a.2009/10 - Prof. Paroli 55

    SIMBOLOGIA- v j = singoli valori (j=1,2,, n)

    (le osservazioni di base)

    - xi = modalit distinten i = frequenze (i=1,2,, k)

    N.B. n e k sono solitamentediversi tra loro!!!

    Numero diunitstatistiche

    Numero dimodalitdifferenti

    Statistica I - a.a.2009/10 - Prof. Paroli 56

    frequenza assoluta = numero di unit statisticheche presentano una data modalit (n i):

    ni0 interi e ki=1ni =n

    frequenza relativa = numero di unit statistichesul totale che presentano una data modalit (f i ):

    f i= n i /n

    0 f i 1 e ki=1f i=1

    TIPI DI FREQUENZETIPI DI FREQUENZE

  • 8/12/2019 Slides Statistica Intro

    15/23

    Statistica I - a.a.2009/10 - Prof. Paroli 57

    modalit x i n i f i = n i/nx 1 n 1 f 1 x 2 n 2 f 2 : : :

    x k n k f k n 1

    per la quale si verifica che

    i=1

    k n i = n

    i=1

    k

    f i = 1

    Tabella di frequenza in generale:

    Statistica I - a.a.2009/10 - Prof. Paroli 58

    esempio : qualit dei pezzi prodotti da una linea di produzione

    x i conteggio n iidoneo |||| |||| |||| |||| 19

    2a scelta |||| |||| | 11difettoso |||| 4

    scarto || 236

    totale dei pezzi esaminati

    Statistica I - a.a.2009/10 - Prof. Paroli 59

    Ni = frequenze assolute cumulate == n 1+n 2++ni = i j=1 n j

    N1=n 1 Nk=n

    Fi = frequenze relative cumulate =

    = f 1+f 2++f i = i j=1 f j F1=f 1 Fk=1

    frequenza cumulata = numero/frazione diunit statistiche che presentano una data modalit

    minore o uguale alla corrente (Nio F

    i)

    Statistica I - a.a.2009/10 - Prof. Paroli 60

    esempio 1 : n stanze per abitazione

    x i n i N i1 184 1842 451 184+451=635

    3 312 635+312=9474 197 947+197=1144

    5 84 1144+84=1228oltre 26 1228+26=1254

    1254

    dati rilevati su n = 1254 unit sperimentali

  • 8/12/2019 Slides Statistica Intro

    16/23

    Statistica I - a.a.2009/10 - Prof. Paroli 61

    esempio 2 : n. punti vendita di una azienda

    x i n i f i F i

    1 10 0.24 0.242 8 0.20 0.24+0.20= 0.443 6 0.15 0.44+0.15= 0.594 14 0.34 0.59+0.34=0.935 3 0.07 0.93+0.07=1.00

    41 1.00

    Statistica I - a.a.2009/10 - Prof. Paroli 62

    Serie statistiche

    modalit n i f i = n i/n

    x 1 n 1 f 1 x 2 n 2 f 2 : : :

    x k n k f k

    n 1

    Tabelle di frequenza per caratteriqualitativi/quantitativi discreti

    Statistica I - a.a.2009/10 - Prof. Paroli 63

    e s em p i o 1 : carattere qualitativo

    variabile stato civilex i ni f i

    Coniugato/a 130 0.650Celibe/nubile 63 0.315

    Separato/divorziato 3 0.015Vedovo/a 4 0.020

    200 1

    Statistica I - a.a.2009/10 - Prof. Paroli 64

    e s em p i o 2 : carattere quantitativo discreto

    numero di punti vendita di una azienda

    xi n i1 102 83 64 145 3

    41

    E se fossero i punti vendita dei supermercati??? potremmoavere anche 100 punti vendita !!!!Cosa succede alla tabella???

  • 8/12/2019 Slides Statistica Intro

    17/23

    Statistica I - a.a.2009/10 - Prof. Paroli 65

    SE IL CARATTERE PRESENTA MOLTEMODALIT DISTINTE

    pu essere conveniente accorpare lemodalit inCLASSI

    RAGGRUPPAMENTO IN CLASSICostruzione di intervalli di valori chiusi o aperti(da escluso, a incluso)

    Statistica I - a.a.2009/10 - Prof. Paroli 66

    Seriazioni statistiche

    classi ni f i h0 h1 n1 f 1 h1 h2 n2 f 2

    : :hk-1 hk nk f k

    n 1

    Classi o intervalli:-devono essere disgiunte (senza sovrapposizioni)- devono essere esaustive (devono contenere il minimo ed ilmassimo osservati)- solitamente si intendono chiuse a destra

    Tabelle di frequenza per caratteriquantitativi ripartiti in classi

    Statistica I - a.a.2009/10 - Prof. Paroli 67

    e se m p i o : variabile reddito annuo 5 classi

    Classi n i f i = n i/n

    0 20 35 0.17520 30 42 0.21030 40 54 0.27040 80 59 0.29580 100 10 0.05

    200 1

    N.B. ATTENZIONE ALLAMPIEZZA DELLE CLASSI !!!!Se non costante si calcolano le densit di frequenza

    Statistica I - a.a.2009/10 - Prof. Paroli 68

    classi ni a i di

    h0 h1 n1 a 1 n1 /a 1h1 h2 n2 a 2 n2 /a 2

    : : :

    hk-1 hk nk ak nk /a k n

    densit di frequenza (di) = % di frequenzaassoluta (o relativa) nellintervallo

    di = n i /a ioppure

    f i /a iconai = ampiezza classe i-esima = h i hi-1

  • 8/12/2019 Slides Statistica Intro

    18/23

    Statistica I - a.a.2009/10 - Prof. Paroli 69

    e s e m p i o : variabile reddito annuo 5 classi

    Classi n i ai d i = n i/a i 0 20 35 20 1.7520 30 42 10 4.230 40 54 10 5.440 80 59 40 1.47580 100 10 20 0.5

    200

    In questo modo si possono confrontare le frequenze neivari intervalli !!! (es. quale classe di reddito ha max freq.)

    Statistica I - a.a.2009/10 - Prof. Paroli 70

    linsieme delle coppie modalit+frequenze

    X = {(x i,n i); i=1,2,,k}

    detto

    - mutabile statistica se il carattere qualitativo

    - variabile statistica se il carattere quantitativo(discreto o continuo)

    Statistica I - a.a.2009/10 - Prof. Paroli 71

    ESEMPIO RIASSUNTIVO

    La seguente matrice di dati si riferisce al data-base della contabilit clientidi una certa azienda

    c o d i c e c l i e n t e c a t e g o r i a r e s i d e n z a F a t t u r a t o p r o d .A p r o d .B p r o d .C0 0 0 1 g ro s s is ta I ta lia 1 1 .2 2 1 2 7 0 3 7 0 40 0 0 2 g ra n d e d is tr ib I ta lia 3 0 .5 3 4 8 2 0 4 5 5 5

    0 0 0 3 g ra n d e d is tr ib F ra n c ia 3 4 .5 5 5 5 5 0 5 8 0 40 0 0 4 g ro s s is ta I ta lia 1 5 .1 2 0 2 1 0 30 0 0 5 g ro s s is ta S v izze ra 2 8 .9 8 4 7 5 0 3 5 5 40 0 0 6 g ra n d e d is tr ib S v izze ra 2 0 .5 3 2 5 7 0 5 5 0 50 0 0 7 g ro s s is ta G e rm a n ia 1 2 .1 8 1 3 4 0 3 6 5 50 0 0 8 g ra n d e d is tr ib A u s tria 2 7 .6 5 3 8 5 0 6 8 0 50 0 0 9 g ro s s is ta I ta lia 1 7 .2 3 2 3 2 0 3 1 0 50 0 1 0 d e tta g lia n te G e rm a n ia 1 2 .4 3 1 7 5 0 2 2 5 40 0 1 1 g ro s s is ta F ra n c ia 1 3 .2 3 1 2 2 0 4 6 0 50 0 1 2 d e tta g lia n te I ta lia 1 3 .1 4 1 8 7 5 2 7 5 40 0 1 3 g ro s s is ta F ra n c ia 3 8 .0 5 6 4 4 0 3 8 5 50 0 1 4 d e tta g lia n te I ta lia 4 4 .5 3 7 5 0 1 7 5 40 0 1 5 d e tta g lia n te G e rm a n ia 4 6 .4 7 1 4 0 2 3 5 40 0 1 6 g ro s s is ta O la n d a 4 0 .1 2 6 7 5 0 4 8 2 50 0 1 7 d e tta g lia n te I ta lia 1 3 .8 8 2 5 7 0 0 30 0 1 8 g ro s s is ta F ra n c ia 2 3 .3 6 3 5 0 0 4 8 0 40 0 1 9 d e tta g lia n te O la n d a 6 .7 6 9 5 0 1 2 0 30 0 2 0 g ro s s is ta S v izze ra 1 9 .8 8 2 7 8 0 3 8 0 5 Statistica I - a.a.2009/10 - Prof. Paroli 72

    CARATTERISTICHE DATACARATTERISTICHE DATA--BASEBASE

    n= 20 unit statistiche6 caratteri rilevatitipi di caratteri:

    - Categoria : qualitativo ordinabile- Residenza : qualitativo sconnesso- Fatturato : quantitativo continuo- Prod. A/B/C : quantitativi discreti

  • 8/12/2019 Slides Statistica Intro

    19/23

    Statistica I - a.a.2009/10 - Prof. Paroli 73

    DISTRIBUZIONI DI FREQUENZADISTRIBUZIONI DI FREQUENZA

    Carattere Categoria

    x i n i f iDettagliante 6 0.3

    Grossista 10 0.5Grande distribuzione 4 0.2

    20 1

    Statistica I - a.a.2009/10 - Prof. Paroli 74

    Carattere Residenza

    x i n i f i N iItalia 7 0.35

    Francia 4 0.2Svizzera 3 0.15

    Germania 3Austria 1Olanda 2

    20 1

    Statistica I - a.a.2009/10 - Prof. Paroli 75

    Carattere Prodotto C =numero di pezziacquistati del prodotto di tipo C

    x i n i3 34 85 9

    20

    !!!!! Provate a fare anche quelle deiProdotti A e B !!!!!

    Statistica I - a.a.2009/10 - Prof. Paroli 76

    Carattere Fatturatopoich si tratta di un carattere di tipo continuo bisogna scegliere

    una opportuna ripartizione in classi

    5 classi con stessa ampiezza pari a 10

    x i ni0 10 1

    10 20 920 30 430 40 340 50 3

    20

  • 8/12/2019 Slides Statistica Intro

    20/23

    Statistica I - a.a.2009/10 - Prof. Paroli 77

    4 classi con ampiezza differente pari a 10, 10, 20, 15

    x i ni a i di 0 10 1 10 1/10=0.1

    10 20 9 10 9/10=0.920 40 7 20 7/20=0.3540 55 3 15 3/15=0.2

    20

    classi di ampiezza diversasi calcolano ledensitdi frequenza

    Statistica I - a.a.2009/10 - Prof. Paroli 78

    Dalla lettura delle frequenze si possono trarre alcuneosservazioni:

    il 50% dei clienti dellazienda sono grossisti, il 30%dettaglianti ed il restante 20% della grande distribuzione

    per il 35% sono italiani, tra il 15% - 20% francesi,svizzeri e tedeschi

    per la maggior parte hanno fatturato tra 10 e 20per il prodotto C il numero di pezzi maggiormente

    acquistati 5 (per i prodotti A e B????)

    Statistica I - a.a.2009/10 - Prof. Paroli 79

    RAPPRESENTAZIONI GRAFICHE

    A) RAPPRESENTAZIONI DI DISTRIBUZIONI DIFREQUENZA

    - caratteri qualitativi. diagrammi a torta. diagrammi a rettangoli separati

    - caratteri quantitativi discreti. diagrammi a bastoncini (canne dorgano)

    - caratteri quantitativi continui. Istogrammi

    Statistica I - a.a.2009/10 - Prof. Paroli 80

    Grafici su coordinate cartesiane in cui:

    asse ascisse = modalit

    asse ordinate = frequenze

    assolute relative densit

  • 8/12/2019 Slides Statistica Intro

    21/23

    Statistica I - a.a.2009/10 - Prof. Paroli 81

    - diagrammi a torta (caratteri sconnessi)in corrispondenza ad ogni modalit si disegna un settorecircolare il cui angolo al centro proporzionale allafrequenza.

    F53%

    M47%

    sex ni fiF 16 0,53M 14 0,47

    30 1

    Caratteri qualitativi

    Per trovare langolo i:360 : i = n : n i360 : i = 1 : f i

    Statistica I - a.a.2009/10 - Prof. Paroli 82

    - diagrammi a rettangoli separati (caratteri sconnessie ordinati)in corrispondenza ad ogni modalit si disegna un rettangolocon altezza proporzionale alla frequenza

    sex

    02468

    101214161820

    F M

    n i

    sex ni fiF 16 0,53M 14 0,47

    30 1

    Statistica I - a.a.2009/10 - Prof. Paroli 83

    titolo di studio ni filicenza elementare 10 0.111111diploma media sup 50 0.555556laurea 30 0.333333

    90 1

    0

    10

    20

    30

    40

    50

    60

    licenza elementare diploma media sup laurea

    titolo di studio

    n i

    carattere qualitativoordinato

    Statistica I - a.a.2009/10 - Prof. Paroli 84

    diagrammi a bastonciniin corrispondenza ad ogni modalit si disegna unsegmento con altezza proporzionale alla frequenza

    Caratteri quantitativi discreti

    n c o m p

    02

    468

    1012

    1416

    0 1 2 3 4 5 6

    n i

    NCOMP ni fi

    1 2 0,0672 4 0,1333 7 0,2334 14 0,4675 3 0,100

    30 1

  • 8/12/2019 Slides Statistica Intro

    22/23

    Statistica I - a.a.2009/10 - Prof. Paroli 85

    istogrammain corrispondenza ad ogni classe si disegna un

    rettangolo con base proporzionale allampiezza dellaclasse e altezza proporzionale alla frequenza(o alla densit se le classi sono di diversa ampiezza)

    Caratteri quantitativi continui(o discreti con modalit in classi)

    anasc

    0

    2

    4

    6

    8

    10

    12

    1936-|1946 1946-|1956 1956-|1966 1966-|1976 1976-|1986

    n i

    ANASC ni fi1936-|1946 4 0,1331946-|1956 10 0,3331956-|1966 8 0,2671966-|1976 6 0,200

    1976-|1986 2 0,06730 1,000

    Statistica I - a.a.2009/10 - Prof. Paroli 86

    Carattere = ore lavorative settimanalihi-1 hi ni ai di=n i/a i17 25 13 8 1.6325 35 32 10 3.235 45 81 10 8.145 50 8 5 1.6

    classi con ampiezza diversa

    altezze rettangoli = densit di frequenza

    classi con ampiezza diversa

    Statistica I - a.a.2009/10 - Prof. Paroli 87

    d i

    Statistica I - a.a.2009/10 - Prof. Paroli 88

    B) GRAFICO DELLE FREQUENZE CUMULATE

    Grafico cartesiano per la rappresentazionedellandamento dei valori delle frequenze cumulateassolute o relative (N i o Fi).

    GRAFICO AGRADINI

    Fi

    xi

    max F i(n sefosserole N i)

  • 8/12/2019 Slides Statistica Intro

    23/23

    Statistica I - a.a.2009/10 - Prof. Paroli 89

    x i ni N i1 184 1842 451 6353 312 9474 197 11445 84 1228

    oltre 26 12541254

    esempio: n. di stanze per abitazione

    1 2 3 4 5 6 ..

    Ni

    n=1254

    184

    xi

    Statistica I - a.a.2009/10 - Prof. Paroli 90

    serie dipendenti dal tempo :

    grafico in coordinate cartesiane ortogonali incui il tempo (variabile t) sullasse delle ascisse,mentre i valori della serie sono sullasse delleordinate

    0

    5

    10

    15

    20

    25

    30

    35

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

    C) GRAFICO PER SERIE STORICHE O TEMPORALI