41
DESCRIPTIVE STATISTICS

Stat Formulae

  • Upload
    casey

  • View
    242

  • Download
    5

Embed Size (px)

DESCRIPTION

stat

Citation preview

Descriptive Statistics

Descriptive StatisticsMeasures of central tendencyMean

Median

10,000; 10,000; 10,000; 15,000; 17,000; 17,000; 65,000; 65,000; Mean = 26,125Median = 16,000Mode

AsulPulaDilaw1236Measures of spread101214161820Mean15Median15141415151616Mean15Median15Range101214161820Mean15Median15Range10141415151616Mean15Median15Range 2Variance

Standard deviation

Inferential statistics

Inferential statisticsPagbuo ng mga konklusyon tungkol sa isang populasyon base sa mga obserbasyon mula sa maliit na grupo ng sampleMga paraan para magamit ang mga sample sa paggawa ng paglalahat tungkol sa kabuuang populasyon. Mahalaga na ang napiling sample ay maaaring kumatawan sa buong populasyon [sa pamamagitan ng sampling techniques]Maaaring maging sanhi ng sampling error2 metodo: -- estimation-- normal curve

Margin of ErrorNagpapakita ng katumpakan o accuracyMababa ang margin of error, mataas ang accuracyKapag sinabing 4% Margin of Error sa 46% na taong sumagot ng positibo sa isang pahayag, masasabing nasa 42%-50% na tao ang sasagot na positibo sa nasabing pahayag kapag inulit ang pagsagot ngunit mula sa ibang sample na pareho ang bilang.

Tatlong ibat ibang pormula:MOE = (1.96)sqrt[p(1-p)/n]MOE = (0.98)sqrt(1/n)MOE = (0.98)sqrt[(N-n)/(Nn-n)]Pormula 1: MOE = (1.96)sqrt[p(1-p)/n]Malaki ang populasyon (higit 1 milyon) 95% confidence 95% na kasiguraduhann = samplep = porsyento ng mga taong sumagot sa isang partikular na kasagutanKapag marami ang pagpipilian, piliin ang pinakamalapt sa 50% (o 0.50) para sa "p".Halimbawa 1: MOE = (1.96)sqrt[p(1-p)/n] Nais mong makuha ang passing rate ng 800 estudyante ng 4th year hayskul ngayong taong 2014-2015 sa buong Pilipinas. 85% porsyento ang nakapasa, 10% ang hindi nakapasa at 5% ang hindi nakakakuha ng eksaminasyon sa Matematika. p = 0.85; n = 800MOE = (1.96)sqrt[0.85(1-0.85)/800]MOE = 0.02474 = 2.47%

Sa 800 na estudyante, nasa 95% na kasiguraduhan na nasa 82.53% - 87.47% ang porsyento ng mga makakapasa kapag inulit ang eksaminasyon sa ibang grupo ng 800 sample. Diff group of sample but Same population17Pormula 2: MOE = (0.98)sqrt(1/n)Mas simpleng paraan [maximum margin of error]Mas Malaki ang makukuhang margin of error kaysa sa unang pormulaNagmula sa naunang formula (p=5)Malaki ang populasyon (higit 1 milyon) 95% na kasiguraduhann = sample

Halimbawa 2:MOE = (0.98)sqrt(1/n)Nais mong makuha ang passing rate ng 800 estudyante ng 4th year hayskul ngayong taong 2014-2015 sa buong Pilipinas. 85% porsyento ang nakapasa, 10% ang hindi nakapasa at 5% ang hindi nakakakuha ng eksaminasyon sa Matematika. n = 800MOE = (0.98)sqrt(1/800)MOE = 0.034648 = 3.46%

Sa 800 na estudyante, nasa 95% na kasiguraduhan na nasa 81.54% - 88.46% ang porsyento ng mga makakapasa kapag inulit ang eksaminasyon sa ibang grupo ng 800 sample.

Pormula 3: MOE = (0.98)sqrt[(N-n)/(Nn-n)]Maliit na populasyon (mas mababa sa 1 milyon)Karaniwang ginagamit ng mga mananaliksik na may mababang budyetMay tiyak na bilang ng populasyon at sample na ibinigayNagmula sa ikalawang pormula (p=5)95% kasiguraduhanN = populasyonn = sampleHalimbawa 3:MOE = (0.98)sqrt[(N-n)/(Nn-n)]Nais mong malaman kung ano sa tingin ng 50 mula sa 175 na estudyante ng 2nd year ng Chemical Engineering sa Unibersidad ng Santo Tomas ang nararapat na uri ng pamahalaan para sa bansang Pilipinas. 75% ang nagsasabing Demokratiko; 15% ang Komunismo; 5% ang Monarkiya; 3% ang walang komento at 2% ang walang pakialam sa kung anong uri ng pamahalaan ang nararapat sa Pilipinas. N = 175; n = 50MOE = (0.98) sqrt [ (175-50) / ( (175x50) - 50) ]MOE = 0.11746 = 11.75%Nasa 63.25% - 86.75% ang muling sasagot ng Demokratiko at nasa 3.25% - 26.75% ang muling sasagot ng Komunismo mula sa ibang grupo ng 50 na sample mula sa parehong 175 na populasyon.Slovins FormulaSlovins Formula Isang Random Sampling Technique upang matantiya ang Laki ng iyong Sample

n = N / (1+Ne2)n = no. of samplesN = total populatione = error margin / margin of errorEXAMPLESuppose that you have a group of 1,000 city government employees and you want to survey them to find out which tools are best suited to their jobs. You decide that you are happy with a margin of error of 0.05. Using Slovin's formula, you would be required to survey n = N / (1 + Ne^2) people:

1,000 / (1 + 1000 * 0.05 * 0.05) = 286Normal DistributionMga Termino:Mean - averageMedian - gitnang balyu sa isang grupo ng datosMode umuulit na balyu sa isang grupo ng datosStandard Deviation kung gaano kalalayo ang mga balyung nakaalap sa isat-isa

Paano malalaman kung normally distributed ang datos na nakalap?

Mean = Median = ModeMay symmetry sa gitnaMay 50-50 na hati na kung saan ang isang side ay mas mababa sa mean at ang isa ay mas mataas

68% na mga datos ay kabilang sa isang standard deviation ng mean95% na mga datos ay kabilang sa dalawang standard deviation ng mean98.7% na mga datos ay kabilang sa tatlong standard deviation ng meanHalimbawa: 95% ng mga estudyante ay mula 1.1 m hanggang 1.7 m katangkad. Kung ang datos ay normally distributed hanapin ang mean at standard deviation.

Makukuha ang mean sa pamamagitan ng:Mean = (1.1m + 1.7m) / 2 =1.4m

Para naman sa standard deviation:

At ang resulta ay:

1 standard deviation= (1.7m-1.1m) / 4= 0.6m / 4=0.15 m

Normal Distribution Standard Normal Distribution

Z Standard scoreX value na kailangan istandard mean standard deviationKahalagahan ng Normal Distribution sa pananaliksikKadalasan, ang mga datos na makakalap ay normally distributed o malapit ditoMadali itong prosesong isagawa dahil dalawa lang na variable ang kailangan: mean at standard deviationPwede din itong pangcompute ng mga errors sa mga datos na nakalapEstimation in Statisticsistimasyon sa mga istatistikaEstimation in StatisticsKALAMANGAN (advantage)Ito ay nakabatay sa impormasyon na nakuhaMadaling gawinKASAHULAN (disadvantage)Maaaring maging bias at hindi mabisaPoint EstimateInterval EstimateCONFIDENCE INTERVALSConfidence interval used to express the precision and uncertainty associated with a particular sampling method.

Nahahati ito sa tatlong bahagi:Confidence level inilalarawan ang pagiging uncertain ng isang sampling method.Statistic at Margin of error ipinapakita ang interval estimate na nailalarawan ang pagiging precise ng metodong ginamit.*Ang interval estimate ng isang confidence interval ay itinatakda ng sample statistic margin of error.Halimbawa:

Suppose we compute an interval estimate of a population parameter. We might describe this interval estimate as a 95% confidence interval. This means that if we used the same sampling method to select different samples and compute different interval estimates, the true population parameter would fall within a range defined by the sample statistic margin of error 95% of the time.Confidence LevelThe probability part of a confidence intervalDescribes the likelihood that a particular sampling method will produce a confidence interval that includes the true population parameter

Halimbawa (pag-interpreta ng confidence level):Suppose we collected all possible samples from a given population, and computed confidence intervals for each sample. Some confidence intervals would include the true population parameter; others would not. A 95% confidence level means that 95% of the intervals contain the true population parameter; a 90% confidence level means that 90% of the intervals contain the population parameter; and so on.Margin of ErrorThe range of values above and below the sample statistic in a confidence interval

Halimbawa:Suppose the local newspaper conducts an election survey and reports that the independent candidate will receive 30% of the vote. The newspaper states that the survey had a 5% margin of error and a confidence level of 95%. These findings result in the following confidence interval: We are 95% confident that the independent candidate will receive between 25% and 35% of the vote.