Upload
muls
View
73
Download
10
Tags:
Embed Size (px)
Citation preview
Агуулга Report цэс ..................................................................................................................................................... 2
Descriptive statistic цэс ................................................................................................................................ 4
Descriptive statistic/frequencies .............................................................................................................. 4
Descriptive statistic/descriptives .............................................................................................................. 4
Descriptive statistic/explore ..................................................................................................................... 5
Compare means /one sample T test ............................................................................................................. 6
Compare means /independent-Sample T test .......................................................................................... 7
Compare means/ One-Way ANOVA ......................................................................................................... 8
Descriptive statistic/crosstabs .................................................................................................................. 8
Chart builder ............................................................................................................................................... 10
Regression and correlation ......................................................................................................................... 11
Шугаман регресс – Iinear regression .................................................................................................... 11
Олон хүчин зүйлийн регресс – Non-Iinear regression ......................................................................... 14
За ингээд цаанаас өгөгдсөн цэсний дагуу даалгавруудыг хийгээд явъяа.
Report цэс Мөрөөр, баганаар эсвэл тодорхой хэсгийн ста үзүүлэлтүүдийг гаргана. Хамгийн ашиглах боломжтой
цэс нь case summaries юм.
Жишээ нь: Нас, хүйс, сарын орлого, хичээлэлдэг спортоор нь ангилан шинжилгээ хийе гэж бодий.
Тайлбар: Skewness ба kurtosis нь хоёулаа 0-рүү ойролцоо байх ёстой. Харьцангуй 20-100 тохиолдлыг агуулсан бага түүврийн үед өргөн хэрэглэгддэг. Хэвийн байхыг зөвшөөрөх эрхий хурууны дүрэм бол /ийм байвал хэвийн гэж үзнэ /
−0,5 ≤ түүврийн 𝑠𝑘𝑒𝑤𝑛𝑒𝑠𝑠 ≤ +0,5 −1,01 ≤ түүврийн 𝑘𝑢𝑟𝑡𝑜𝑠𝑖𝑠 ≤ +1.0
- Skewness: Хэлбийлт
Тэгш хэмтэй тархалтын дундаж, медиан, мод нэг ижил байрлал дээр Skew=0 байна
Тархалт хэвтээ тэнхлэгийн дагуу баруун тийш хэлбийсэн бол эерэг хэлбийсэн.
- Kurtosis: ижил дундаж ба стандарт
хэлбэлзэлтэй тархалтыг хэвийн тархалттай харьцуулан тархалтын сүүлийн хүндийг хэмждэг хэмжигдэхүүн юм. Хэрэв тархалт сүүл хэсэгтээ хэвийн тархалттай харьцуулахад /3-аас бага/ цөөн утгуудтай бол куртосис сөрөг утгатай байна. Энэ үед тархалтын төв нь хавтгай хэлбэр лүү дөхнө.
- Variance: хазайлтыг хэмжих
хэмжигдэхүүн. тархалтын төвийн үзүүлэлтийн эргэн тойрон дахь мэдээллийн тархац.
- Std.deviation хэлзэлзлүүдийг квадрат зэрэг дэвшүүлсний дундаж болох вариац, вариацаас
квадрат язгуур гаргасантай тэнцүү болох SD статистик юм. /ажиглалтын тархалтыг хэмжих хэмжигч үзүүлэлт/
- Std. Error of mean: стандарт дундаж алдаа
- Тархалтын төвийг
Дундаж /mean/: хувьсагчийн бүх утгуудын нийлбэрийг утгын тоонд хуваана. Төвийн параметрийн хэмжигдэхүүн бөгөөд тархалтын гол параметр юм.
Median: Тархалтын голд байрлах утга Mode: Хамгийн олон давтагддаг.
Descriptive statistic цэс Descriptive statistic/frequencies. Энэ цэс нь үзүүлэлтийн давталтын судалгааны статистик ба
график дүрслэлийн олон утгыг тодорхойлж харуулдаг.
Descriptive statistic/descriptives. Хувьсагчийн статистик үзүүлэлтүүдийг нэг хүснэгтэд харуулах
бөгөөд мөн стандартчлагдсан үнэлгээнүүдийг бодож гаргадаг.
Descriptive statistic/explore Нийт болон бүлэг үзүүлэлтийн ста үзүүлэлтүүдийг график дүрслэлийг
харуулна. Энэ нь маш олон хүчин зүйл дээр ашиглагддаг юм.
Жишээ нь:
Гарсан үр дүн:
Case Processing Summary
Cases
Valid Missing Total
N Percent N Percent N Percent
age 13 100.0% 0 0.0% 13 100.0%
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
age .205 13 .137 .895 13 .114
a. Lilliefors Significance Correction
Нийт ажиглалтын утга 13 ба насны бүтцийг авч үзэхэд sig=0.114 байгаа нь 0,005-аас их байгаа учраас хэвийн тархалтгүй.
Хэрэв цаанаасаа алдааны утгыг 10% байх үед гэсэн өгөгдөл өгвөл бид sig=0.114, sig≤0.1 учраас хэвийн тархалттай гэж үзэж болно. Гол нь энэ нь алдааг ихэсгэж үнэмшилийг 90% болгож байна гэсэн үг. Колмогоров – Смирновын шалгуур үр дүн болох Sig=0.137 ач богдлын холбогдлын түвшин 0,05-аас их байгаа тул хэвийн байх 0 таамаглалыг /0,05-аас бага
байвал 0 таамаглалыг үгүйсгэнэ/ баталж байна. Мөн Шапиро-Вилксийн шалгуур үр дүн P-утга 0,114 байгаа нь ач холбогдлын түвшин 0,05-аас их байгаа тул хэвийн байх 0 таамаглалыг баталж байна. Эндээс бид хувьсагч хэвийн /0,05-аас бага байвал хэвийн биш/байх хүчтэй нотолгоог оллоо.
Compare means /one sample T test Тухайн нэг хувьсагчийн дундаж утга нь тодорхой
нэг тогтмол тоотой ямар харьцаатай байгааг харуулна. Жишээ:
Бидний таамаглаж байгаа нас 20, буюу Түүврийн дундаж утга нь таамаглаж буй утгаас хир ялгаатай байгааг шалгана.
Тайлбар: дундаж утга 20,0769, Таамагласан утганаас
зөрсөн утга нь 0,07692 байна. Шалгуур хангахгүй байх
үеийн дээд хязгаар 1,4825, доод хязгаар -1,3287
One-Sample Test
Test Value = 20
t df Sig. (2-tailed) Mean Difference
95% Confidence Interval of the
Difference
Lower Upper
age .119 12 .907 .07692 -1.3287 1.4825
One-Sample Statistics
N Mean Std. Deviation Std. Error Mean
age 13 20.0769 2.32600 .64512
Compare means /independent-Sample T test 2 түүврийн хувьд. Үл хамаарсан түүврүүдийн t
шалгуур нь энгийн тархалттай хамаарах хувьсагчийн 2 үл хамаарсан бүлгүүдийн дунджийг
харьцуулахад хэрэглэнэ. Мөн дээрх жишээ дээр
Group Statistics
sex N Mean Std. Deviation Std. Error Mean
age er 6 19.3333 1.36626 .55777
em 7 20.7143 2.87021 1.08484
- Df: Чөлөөний зэрэг - T : t түүврийн t-statistic - Sig. (2-tailed): t-тархалтын магадлал - Mean Difference: түүврийн дунджаас шалгуурын утгаг хассан дүн /таамаглалын зөрсөн утга/ - Confidence Interval of the Difference : шалгуурыг хангахгүй байх магадлалын дээд, доод
хязгаар
Independent Samples Test
Levene's Test for
Equality of Variances t-test for Equality of Means
F Sig. t df Sig. (2-
tailed)
Mean
Difference
Std. Error
Difference
95% Confidence
Interval of the
Difference
Lower Upper
age
Equal variances
assumed 3.150 .104 -1.074 11 .306 -1.38095 1.28587 -4.21114 1.44924
Equal variances not
assumed
-1.132 8.849 .287 -1.38095 1.21983 -4.14757 1.38566
Compare means/ One-Way ANOVA Хамааран хувьсагч, нэг үл хамааран хувьсагчийн хоорондын
вариацын тест хийж үр дүнг харуулна. Тэг таамаглалыг шалгана. Дээрх жишээн дээр
Хамаарах хувьсагчийн үл хамаарах /бүлгэлсэн/ хувьсагчийн түвшинөөр ялгасан дунджуудийн хоорондох ялгааг шалгана. Бүлгүүд дотроо л өөр байна уу үгүй юу
Хамаарах хувьсагчийн дундаж утга нь /нас/
хүйсний хувьд ста холбогдолын хувьд ялгаатай
болохыг харуулж байна. Дундаж нь ялгаатай юм
уу үгүй юм уу л гэсэн асуултанд хариулагдана. Гол
нь sig ээ хараад 0,5 аас бага байвал дундаж утгууд
ялгаагүй тиймээс манайхаар ялгатай шүү!!!
Descriptive statistic/crosstabs 2 ба түүнээс дээш олон хэмжигдэхүүний тестүүд, хэмжээс,
харилцан уялдаа холбоог огтлолцсон хүснэгтээр харуулна /2 бүлэглэсэн төрлийн хувьсагчийн
хооронд хамаарал бий эсэхийг шалгадаг/
Scale биш тохиолдолд болно
ANOVA
age
Sum of Squares df Mean Square F Sig.
Between Groups 6.161 1 6.161 1.153 .306
Within Groups 58.762 11 5.342
Total 64.923 12
Тайлбар: спорт болон хүйсийн хооронд ач холбогдолын түвшин /sig= 0,067, sig≥ 0,05/ гарч байгаа нь хамаарал байхгүйг илгэж байна. Chi-square test – мөр баганын өгөгдлүүд хоорондоо уялдаагүй байх үед ажиглалтын утга, таамаглаж буй утгуудын хоорондын зөрүүг тооцоолж харуулна. Phi – хи квадрат дээр суурилсан хамаарлын хэмжүүр бөгөөд хи квадратын утгыг түүврийн хэмжээнд хуваагаад, үр дүнгээс нь квадрат язгуур авснаар энэ ста гарна. Cramer`s V - хи квадрат дээр суурилсан хамаарлын хэмжүүр
sex * sport Crosstabulation
Count
sport
Total bas foot gym swim ten voll
sex er 3 2 0 1 0 0 6
em 0 0 1 2 3 1 7
Total 3 2 1 3 3 1 13
Chi-Square Tests
Value df
Asymp. Sig.
(2-sided)
Pearson Chi-Square 10.317a 5 .067
Likelihood Ratio 14.126 5 .015
N of Valid Cases 13
a. 12 cells (100.0%) have expected count less than 5. The
minimum expected count is .46.
Symmetric Measures
Value Approx. Sig.
Nominal by Nominal Phi .891 .067
Cramer's V .891 .067
N of Valid Cases 13
Chart builder График байгуулахдаа
Graphs/ chart builder
Гол анхаарах зүйл нь area график
бол хувьсагчууд бүгд scale байх
ёстой !!!
Тархалтыг диаграммаар шинжлэх
диаграмм Тайлбар Ямар хувьсагчид хүчинтэй
Тэгш өнцөгт /bar chart/ Тохиолдсон ялгаатай утга бүрийг нэг тэгш өнцөгт харуулна
Нэрлэсэн ба дараалсан
Дугуй /Pie chart/ Тохиолдсон ялгаатай утга бүрийг нэг тэгш өнцөгт харуулна
Нэрлэсэн ба дараалсан
Гистограм /Histogram/ Тохиолдсон ялгаатай утга бүрийг нэг зүсмээр харуулна.
Интервал
Давтамжийн муруй /Frequency poligon/
Утгуудыг интервалаар бүлэглэж, интервал бүрийг нэг тэгш өнцөгтөөр харуулна.
Дараалсан ба интервал
Давтамжийн муруй /Frequency curve/
Дараалсан тэгш өнцөгтүүдийн эсвэл гистограмын тэгш өнцөгтүүдийн дээд оройн голын цэгийг шулуун шугамаар холбоно.
Дараалсан ба интервал
Иш-ба-навч дүрс /stem and leaf plot/
Эхний цифрээр /иш/ интерталыг тодорхойлж 2 дахь цифрээр /навч/ тэгш өнцөгтийг дүрсэлсэн гистограм юм.
Интервал
Box and whisker plot /bar chart/ Хайрцаг нь медианыг тэмдэглээд 1-3-р квартил хүртэл зурна. Боломжийн утгуудаас хамгийн багаас хамгийн их утгыг харуулна. Хязгаараас гарсан утгууд /outliers/ болон хэт /extreme/ утгуудыг тэмдэглэдэг.
Интервал
Диаграмм байгуулах тархалтын хэлбэр
Бүлэглэсэн хувьсагчийн график Graphs/bar….simple
Интервал хувьсагчийн график Graphs/Histogram….
Дараалсан ба интервал хувьсагчийн давтамжийн полигон ба муруй
Transform/compute….. Graphs/line….simple define
Regression and correlation
Шугаман регресс – Iinear regression Байгууллагын хувьд дараах зүйлс өгөгдсөн.
𝑌 − Борлуулалтын хэмжээ, сая төг
𝑋1 − Хугацаа, сар
𝑋2 − Зар сурталчилгааны зардал, мян. төг
𝑋3 − Бүтээгдэхүүний үнэ, төг
𝑋4 − өрсөлдөгч бүтээгдэхүүний дундаж үнэ, төг
𝑋5 − Хэрэглэгчийн зардлын индекс, %
1. Дээрх хүчин зүйлүүдээс регрессийн загварт орох хүчин зүйлийг сонгоно.
Хүснэгт1. Корреляцийн матриц тооцох арга: Analyze – Correlate – bivariate
Correlations
y x1 x2 x3 x4 x5
y Pearson Correlation 1 .663** .661** .207 .261 .801**
Sig. (2-tailed) .005 .005 .441 .329 .000
N 16 16 16 16 16 16
x1 Pearson Correlation .663** 1 .106 .110 -.069 .953**
Sig. (2-tailed) .005 .695 .684 .801 .000
N 16 16 16 16 16 16
x2 Pearson Correlation .661** .106 1 .070 .196 .271
Sig. (2-tailed) .005 .695 .796 .468 .310
N 16 16 16 16 16 16
x3 Pearson Correlation .207 .110 .070 1 .512* .121
Sig. (2-tailed) .441 .684 .796 .042 .655
N 16 16 16 16 16 16
x4 Pearson Correlation .261 -.069 .196 .512* 1 -.002
Sig. (2-tailed) .329 .801 .468 .042 .993
N 16 16 16 16 16 16
x5 Pearson Correlation .801** .953** .271 .121 -.002 1
Sig. (2-tailed) .000 .000 .310 .655 .993
N 16 16 16 16 16 16
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
Дээрх хүснэгтээс харахад Y хамааран хувьсагчид 𝑋1 буюу хугацаа сарын нөлөөл нь 0,663 буюу 63%-
ийн хамаарал байна. Харин 𝑋2 буюу зар сурталчилгааны зардал нь борлуулалтын орлогод ( Y
хамааран хувьсагчид ) 61%, 𝑋3болох бүтээгдэхүүний үнэ 20%, 𝑋4 буюу өрсөлдөгч бүтээгдэхүүний
дундаж үнэ нь 26,1%, 𝑋5 буюу хэрэглэгчийн зардлын индекс нь 80%-ийн хамаарал байгааг харж
болно.
Дараагийн алхам бол Y хамааран хувьсагчтай ач холбогдол багатай 𝑋3, 𝑋4 үл хамаарах хувьсагчийг
регрессийн загварт оруулахгүй байхаар шийднэ. Мөн бидэнд 16 ажиглалтын утга байгаа гэвч үл
хамаарах хувьсагч 3 байна. Ийм байхад үнэмшилгүй учраас /2*7=14, 2*8=16/ регрессийн загварт
тааруулж 2 хувьсагч сонгон авахад тохирно гэж үзээд Хүснэгт1-ээс хувьсагч хоорондын хамаарлыг
авч үзэхэд 𝑋1, 𝑋5 гэх хувьсагчууд хоорондын хамаарал маш өндөр байгаа учраас аль нэгийг нь
загварт оруулахгүй. Ингээд ач холбогдол (хүснэгт1)-ыг харсны үндсэн дээр 𝑋1 хувьсагчийг хасах
боллоо.
2. Регрессийн тэгшитгэл
Регрессийн тэгшитгэлийн коэффициент. (Analyze – Regression – Linear)
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig. B Std. Error Beta
1 (Constant) -1393.377 259.083 -5.378 .000
x2 9.951 2.286 .479 4.352 .001
x5 14.987 2.461 .671 6.089 .000
a. Dependent Variable: y
𝑦 = −1393.377 + 9.951𝑥2 + 14.987𝑥5
Тайлбар: зар сурталчилгааны зардал 1мян.төгрөгөөр өсөхөд борлуулалтын хэмжээ 9,951 сая
төгрөгөөр харин хэрэглэгчийн зардлын инкекс 1%-иар өсөхөд борлуулалтын хэмжээ 14,987сая
төгрөгөөр өсөх нь харагдаж байна.
t-статистик. Энэ нь хувьсагчуудын өмнөх тоо буюу параметрүүдийг хэр үнэмшилтэй вэ гэдгийг
шалгах арга юм. Эндээс Sig буюу probability нь t шалгуурын ач холбогдлыг харуулах ба 0,005-аас
бага байх ёстой юм. Дээрх хүснэгтэнд Sig нь 0,000-0,001 байгаа нь алдаа гарах магадлал 1% байна
гэсэн үг.
3. Загварт үнэлгээ өгөх
Model Summary
Model R R Square Adjusted R
Square
Std. Error of
the Estimate
1 .924a .854 .831 41.878
a. Predictors: (Constant), x5, x2
Тайлбар: 𝑅 = 0.92 гарсан нь үр дүнгийн хувьсагч загварт орсон бүх тайлбарлагч хувьсагчуудын
хоорондын хамаарлыг хүч их байгааг (𝑦, 𝑥 –ийн хамаарал хүчтэй) харуулж байна.
𝑅2 = 0.85 гарсан нь тухайн загварт нөлөөлөх хүчин зүйлсийн 85%-ийг тооцсон гэж үзсэн. Өөрөөр
хэлбэл энэ регрессийн тэгшитгэлээр (𝑦 = −1393.377 + 9.951𝑥2 + 14.987𝑥5) 𝑦-ийг 85% тооцож
байна.
ANOVAa
Model Sum of Squares df Mean Square F Sig.
1 Regression 133206.545 2 66603.273 37.977 .000b
Residual 22799.392 13 1753.799
Total 156005.937 15
a. Dependent Variable: y
b. Predictors: (Constant), x5, x2
Тайлбар: Фишерийн шалгуур 𝐹 = 37.97 гарсан нь загвар (тэгшитгэл) бүхэлдээ ач холбогдолтой
гарсан юм.
4. Прогноз урьдчилан таамаглал зохиох
Бидэнд ажиглалтын 16 утга байгаа. Нэг үгээр хэлбэл 17 дахь борлуулалтын утгыг олно. Эндээс
эхлээд 𝑋2, 𝑋5 буюу зар сурталчилгааны зардал мөн хэрэглэгчийн зардлын индексийн 17 сарын
утгыг заавал оруулах SPSS-ийн өгөгдөлд заавал нэмж оруулах ёстой. Дараагаар нь
Analyze – Regression – Linear – Save /standartized/ - ok
Оруулсан өгөдлийн ард багана нэмэгдэх ба үүнийг
Pre – онолын утга
Res – онолын утга болон ажиглалтын утгын зөрүү
Олон хүчин зүйлийн регресс – Non-Iinear regression