14
Агуулга Report цэс ..................................................................................................................................................... 2 Descriptive statistic цэс ................................................................................................................................ 4 Descriptive statistic/frequencies .............................................................................................................. 4 Descriptive statistic/descriptives .............................................................................................................. 4 Descriptive statistic/explore ..................................................................................................................... 5 Compare means /one sample T test ............................................................................................................. 6 Compare means /independent-Sample T test .......................................................................................... 7 Compare means/ One-Way ANOVA ......................................................................................................... 8 Descriptive statistic/crosstabs .................................................................................................................. 8 Chart builder ............................................................................................................................................... 10 Regression and correlation ......................................................................................................................... 11 Шугаман регресс – Iinear regression .................................................................................................... 11 Олон хүчин зүйлийн регресс – Non-Iinear regression ......................................................................... 14

spss

  • Upload
    muls

  • View
    73

  • Download
    10

Embed Size (px)

Citation preview

Page 1: spss

Агуулга Report цэс ..................................................................................................................................................... 2

Descriptive statistic цэс ................................................................................................................................ 4

Descriptive statistic/frequencies .............................................................................................................. 4

Descriptive statistic/descriptives .............................................................................................................. 4

Descriptive statistic/explore ..................................................................................................................... 5

Compare means /one sample T test ............................................................................................................. 6

Compare means /independent-Sample T test .......................................................................................... 7

Compare means/ One-Way ANOVA ......................................................................................................... 8

Descriptive statistic/crosstabs .................................................................................................................. 8

Chart builder ............................................................................................................................................... 10

Regression and correlation ......................................................................................................................... 11

Шугаман регресс – Iinear regression .................................................................................................... 11

Олон хүчин зүйлийн регресс – Non-Iinear regression ......................................................................... 14

Page 2: spss

За ингээд цаанаас өгөгдсөн цэсний дагуу даалгавруудыг хийгээд явъяа.

Report цэс Мөрөөр, баганаар эсвэл тодорхой хэсгийн ста үзүүлэлтүүдийг гаргана. Хамгийн ашиглах боломжтой

цэс нь case summaries юм.

Жишээ нь: Нас, хүйс, сарын орлого, хичээлэлдэг спортоор нь ангилан шинжилгээ хийе гэж бодий.

Page 3: spss

Тайлбар: Skewness ба kurtosis нь хоёулаа 0-рүү ойролцоо байх ёстой. Харьцангуй 20-100 тохиолдлыг агуулсан бага түүврийн үед өргөн хэрэглэгддэг. Хэвийн байхыг зөвшөөрөх эрхий хурууны дүрэм бол /ийм байвал хэвийн гэж үзнэ /

−0,5 ≤ түүврийн 𝑠𝑘𝑒𝑤𝑛𝑒𝑠𝑠 ≤ +0,5 −1,01 ≤ түүврийн 𝑘𝑢𝑟𝑡𝑜𝑠𝑖𝑠 ≤ +1.0

- Skewness: Хэлбийлт

Тэгш хэмтэй тархалтын дундаж, медиан, мод нэг ижил байрлал дээр Skew=0 байна

Тархалт хэвтээ тэнхлэгийн дагуу баруун тийш хэлбийсэн бол эерэг хэлбийсэн.

- Kurtosis: ижил дундаж ба стандарт

хэлбэлзэлтэй тархалтыг хэвийн тархалттай харьцуулан тархалтын сүүлийн хүндийг хэмждэг хэмжигдэхүүн юм. Хэрэв тархалт сүүл хэсэгтээ хэвийн тархалттай харьцуулахад /3-аас бага/ цөөн утгуудтай бол куртосис сөрөг утгатай байна. Энэ үед тархалтын төв нь хавтгай хэлбэр лүү дөхнө.

- Variance: хазайлтыг хэмжих

хэмжигдэхүүн. тархалтын төвийн үзүүлэлтийн эргэн тойрон дахь мэдээллийн тархац.

- Std.deviation хэлзэлзлүүдийг квадрат зэрэг дэвшүүлсний дундаж болох вариац, вариацаас

квадрат язгуур гаргасантай тэнцүү болох SD статистик юм. /ажиглалтын тархалтыг хэмжих хэмжигч үзүүлэлт/

- Std. Error of mean: стандарт дундаж алдаа

- Тархалтын төвийг

Дундаж /mean/: хувьсагчийн бүх утгуудын нийлбэрийг утгын тоонд хуваана. Төвийн параметрийн хэмжигдэхүүн бөгөөд тархалтын гол параметр юм.

Median: Тархалтын голд байрлах утга Mode: Хамгийн олон давтагддаг.

Page 4: spss

Descriptive statistic цэс Descriptive statistic/frequencies. Энэ цэс нь үзүүлэлтийн давталтын судалгааны статистик ба

график дүрслэлийн олон утгыг тодорхойлж харуулдаг.

Descriptive statistic/descriptives. Хувьсагчийн статистик үзүүлэлтүүдийг нэг хүснэгтэд харуулах

бөгөөд мөн стандартчлагдсан үнэлгээнүүдийг бодож гаргадаг.

Page 5: spss

Descriptive statistic/explore Нийт болон бүлэг үзүүлэлтийн ста үзүүлэлтүүдийг график дүрслэлийг

харуулна. Энэ нь маш олон хүчин зүйл дээр ашиглагддаг юм.

Жишээ нь:

Гарсан үр дүн:

Case Processing Summary

Cases

Valid Missing Total

N Percent N Percent N Percent

age 13 100.0% 0 0.0% 13 100.0%

Tests of Normality

Kolmogorov-Smirnova Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

age .205 13 .137 .895 13 .114

a. Lilliefors Significance Correction

Page 6: spss

Нийт ажиглалтын утга 13 ба насны бүтцийг авч үзэхэд sig=0.114 байгаа нь 0,005-аас их байгаа учраас хэвийн тархалтгүй.

Хэрэв цаанаасаа алдааны утгыг 10% байх үед гэсэн өгөгдөл өгвөл бид sig=0.114, sig≤0.1 учраас хэвийн тархалттай гэж үзэж болно. Гол нь энэ нь алдааг ихэсгэж үнэмшилийг 90% болгож байна гэсэн үг. Колмогоров – Смирновын шалгуур үр дүн болох Sig=0.137 ач богдлын холбогдлын түвшин 0,05-аас их байгаа тул хэвийн байх 0 таамаглалыг /0,05-аас бага

байвал 0 таамаглалыг үгүйсгэнэ/ баталж байна. Мөн Шапиро-Вилксийн шалгуур үр дүн P-утга 0,114 байгаа нь ач холбогдлын түвшин 0,05-аас их байгаа тул хэвийн байх 0 таамаглалыг баталж байна. Эндээс бид хувьсагч хэвийн /0,05-аас бага байвал хэвийн биш/байх хүчтэй нотолгоог оллоо.

Compare means /one sample T test Тухайн нэг хувьсагчийн дундаж утга нь тодорхой

нэг тогтмол тоотой ямар харьцаатай байгааг харуулна. Жишээ:

Бидний таамаглаж байгаа нас 20, буюу Түүврийн дундаж утга нь таамаглаж буй утгаас хир ялгаатай байгааг шалгана.

Тайлбар: дундаж утга 20,0769, Таамагласан утганаас

зөрсөн утга нь 0,07692 байна. Шалгуур хангахгүй байх

үеийн дээд хязгаар 1,4825, доод хязгаар -1,3287

One-Sample Test

Test Value = 20

t df Sig. (2-tailed) Mean Difference

95% Confidence Interval of the

Difference

Lower Upper

age .119 12 .907 .07692 -1.3287 1.4825

One-Sample Statistics

N Mean Std. Deviation Std. Error Mean

age 13 20.0769 2.32600 .64512

Page 7: spss

Compare means /independent-Sample T test 2 түүврийн хувьд. Үл хамаарсан түүврүүдийн t

шалгуур нь энгийн тархалттай хамаарах хувьсагчийн 2 үл хамаарсан бүлгүүдийн дунджийг

харьцуулахад хэрэглэнэ. Мөн дээрх жишээ дээр

Group Statistics

sex N Mean Std. Deviation Std. Error Mean

age er 6 19.3333 1.36626 .55777

em 7 20.7143 2.87021 1.08484

- Df: Чөлөөний зэрэг - T : t түүврийн t-statistic - Sig. (2-tailed): t-тархалтын магадлал - Mean Difference: түүврийн дунджаас шалгуурын утгаг хассан дүн /таамаглалын зөрсөн утга/ - Confidence Interval of the Difference : шалгуурыг хангахгүй байх магадлалын дээд, доод

хязгаар

Independent Samples Test

Levene's Test for

Equality of Variances t-test for Equality of Means

F Sig. t df Sig. (2-

tailed)

Mean

Difference

Std. Error

Difference

95% Confidence

Interval of the

Difference

Lower Upper

age

Equal variances

assumed 3.150 .104 -1.074 11 .306 -1.38095 1.28587 -4.21114 1.44924

Equal variances not

assumed

-1.132 8.849 .287 -1.38095 1.21983 -4.14757 1.38566

Page 8: spss

Compare means/ One-Way ANOVA Хамааран хувьсагч, нэг үл хамааран хувьсагчийн хоорондын

вариацын тест хийж үр дүнг харуулна. Тэг таамаглалыг шалгана. Дээрх жишээн дээр

Хамаарах хувьсагчийн үл хамаарах /бүлгэлсэн/ хувьсагчийн түвшинөөр ялгасан дунджуудийн хоорондох ялгааг шалгана. Бүлгүүд дотроо л өөр байна уу үгүй юу

Хамаарах хувьсагчийн дундаж утга нь /нас/

хүйсний хувьд ста холбогдолын хувьд ялгаатай

болохыг харуулж байна. Дундаж нь ялгаатай юм

уу үгүй юм уу л гэсэн асуултанд хариулагдана. Гол

нь sig ээ хараад 0,5 аас бага байвал дундаж утгууд

ялгаагүй тиймээс манайхаар ялгатай шүү!!!

Descriptive statistic/crosstabs 2 ба түүнээс дээш олон хэмжигдэхүүний тестүүд, хэмжээс,

харилцан уялдаа холбоог огтлолцсон хүснэгтээр харуулна /2 бүлэглэсэн төрлийн хувьсагчийн

хооронд хамаарал бий эсэхийг шалгадаг/

Scale биш тохиолдолд болно

ANOVA

age

Sum of Squares df Mean Square F Sig.

Between Groups 6.161 1 6.161 1.153 .306

Within Groups 58.762 11 5.342

Total 64.923 12

Page 9: spss

Тайлбар: спорт болон хүйсийн хооронд ач холбогдолын түвшин /sig= 0,067, sig≥ 0,05/ гарч байгаа нь хамаарал байхгүйг илгэж байна. Chi-square test – мөр баганын өгөгдлүүд хоорондоо уялдаагүй байх үед ажиглалтын утга, таамаглаж буй утгуудын хоорондын зөрүүг тооцоолж харуулна. Phi – хи квадрат дээр суурилсан хамаарлын хэмжүүр бөгөөд хи квадратын утгыг түүврийн хэмжээнд хуваагаад, үр дүнгээс нь квадрат язгуур авснаар энэ ста гарна. Cramer`s V - хи квадрат дээр суурилсан хамаарлын хэмжүүр

sex * sport Crosstabulation

Count

sport

Total bas foot gym swim ten voll

sex er 3 2 0 1 0 0 6

em 0 0 1 2 3 1 7

Total 3 2 1 3 3 1 13

Chi-Square Tests

Value df

Asymp. Sig.

(2-sided)

Pearson Chi-Square 10.317a 5 .067

Likelihood Ratio 14.126 5 .015

N of Valid Cases 13

a. 12 cells (100.0%) have expected count less than 5. The

minimum expected count is .46.

Symmetric Measures

Value Approx. Sig.

Nominal by Nominal Phi .891 .067

Cramer's V .891 .067

N of Valid Cases 13

Page 10: spss

Chart builder График байгуулахдаа

Graphs/ chart builder

Гол анхаарах зүйл нь area график

бол хувьсагчууд бүгд scale байх

ёстой !!!

Тархалтыг диаграммаар шинжлэх

диаграмм Тайлбар Ямар хувьсагчид хүчинтэй

Тэгш өнцөгт /bar chart/ Тохиолдсон ялгаатай утга бүрийг нэг тэгш өнцөгт харуулна

Нэрлэсэн ба дараалсан

Дугуй /Pie chart/ Тохиолдсон ялгаатай утга бүрийг нэг тэгш өнцөгт харуулна

Нэрлэсэн ба дараалсан

Гистограм /Histogram/ Тохиолдсон ялгаатай утга бүрийг нэг зүсмээр харуулна.

Интервал

Давтамжийн муруй /Frequency poligon/

Утгуудыг интервалаар бүлэглэж, интервал бүрийг нэг тэгш өнцөгтөөр харуулна.

Дараалсан ба интервал

Давтамжийн муруй /Frequency curve/

Дараалсан тэгш өнцөгтүүдийн эсвэл гистограмын тэгш өнцөгтүүдийн дээд оройн голын цэгийг шулуун шугамаар холбоно.

Дараалсан ба интервал

Иш-ба-навч дүрс /stem and leaf plot/

Эхний цифрээр /иш/ интерталыг тодорхойлж 2 дахь цифрээр /навч/ тэгш өнцөгтийг дүрсэлсэн гистограм юм.

Интервал

Box and whisker plot /bar chart/ Хайрцаг нь медианыг тэмдэглээд 1-3-р квартил хүртэл зурна. Боломжийн утгуудаас хамгийн багаас хамгийн их утгыг харуулна. Хязгаараас гарсан утгууд /outliers/ болон хэт /extreme/ утгуудыг тэмдэглэдэг.

Интервал

Диаграмм байгуулах тархалтын хэлбэр

Бүлэглэсэн хувьсагчийн график Graphs/bar….simple

Интервал хувьсагчийн график Graphs/Histogram….

Дараалсан ба интервал хувьсагчийн давтамжийн полигон ба муруй

Transform/compute….. Graphs/line….simple define

Page 11: spss

Regression and correlation

Шугаман регресс – Iinear regression Байгууллагын хувьд дараах зүйлс өгөгдсөн.

𝑌 − Борлуулалтын хэмжээ, сая төг

𝑋1 − Хугацаа, сар

𝑋2 − Зар сурталчилгааны зардал, мян. төг

𝑋3 − Бүтээгдэхүүний үнэ, төг

𝑋4 − өрсөлдөгч бүтээгдэхүүний дундаж үнэ, төг

𝑋5 − Хэрэглэгчийн зардлын индекс, %

1. Дээрх хүчин зүйлүүдээс регрессийн загварт орох хүчин зүйлийг сонгоно.

Хүснэгт1. Корреляцийн матриц тооцох арга: Analyze – Correlate – bivariate

Correlations

y x1 x2 x3 x4 x5

y Pearson Correlation 1 .663** .661** .207 .261 .801**

Sig. (2-tailed) .005 .005 .441 .329 .000

N 16 16 16 16 16 16

x1 Pearson Correlation .663** 1 .106 .110 -.069 .953**

Sig. (2-tailed) .005 .695 .684 .801 .000

N 16 16 16 16 16 16

x2 Pearson Correlation .661** .106 1 .070 .196 .271

Sig. (2-tailed) .005 .695 .796 .468 .310

N 16 16 16 16 16 16

x3 Pearson Correlation .207 .110 .070 1 .512* .121

Sig. (2-tailed) .441 .684 .796 .042 .655

N 16 16 16 16 16 16

x4 Pearson Correlation .261 -.069 .196 .512* 1 -.002

Sig. (2-tailed) .329 .801 .468 .042 .993

N 16 16 16 16 16 16

x5 Pearson Correlation .801** .953** .271 .121 -.002 1

Sig. (2-tailed) .000 .000 .310 .655 .993

N 16 16 16 16 16 16

Page 12: spss

**. Correlation is significant at the 0.01 level (2-tailed).

*. Correlation is significant at the 0.05 level (2-tailed).

Дээрх хүснэгтээс харахад Y хамааран хувьсагчид 𝑋1 буюу хугацаа сарын нөлөөл нь 0,663 буюу 63%-

ийн хамаарал байна. Харин 𝑋2 буюу зар сурталчилгааны зардал нь борлуулалтын орлогод ( Y

хамааран хувьсагчид ) 61%, 𝑋3болох бүтээгдэхүүний үнэ 20%, 𝑋4 буюу өрсөлдөгч бүтээгдэхүүний

дундаж үнэ нь 26,1%, 𝑋5 буюу хэрэглэгчийн зардлын индекс нь 80%-ийн хамаарал байгааг харж

болно.

Дараагийн алхам бол Y хамааран хувьсагчтай ач холбогдол багатай 𝑋3, 𝑋4 үл хамаарах хувьсагчийг

регрессийн загварт оруулахгүй байхаар шийднэ. Мөн бидэнд 16 ажиглалтын утга байгаа гэвч үл

хамаарах хувьсагч 3 байна. Ийм байхад үнэмшилгүй учраас /2*7=14, 2*8=16/ регрессийн загварт

тааруулж 2 хувьсагч сонгон авахад тохирно гэж үзээд Хүснэгт1-ээс хувьсагч хоорондын хамаарлыг

авч үзэхэд 𝑋1, 𝑋5 гэх хувьсагчууд хоорондын хамаарал маш өндөр байгаа учраас аль нэгийг нь

загварт оруулахгүй. Ингээд ач холбогдол (хүснэгт1)-ыг харсны үндсэн дээр 𝑋1 хувьсагчийг хасах

боллоо.

2. Регрессийн тэгшитгэл

Регрессийн тэгшитгэлийн коэффициент. (Analyze – Regression – Linear)

Coefficientsa

Model

Unstandardized Coefficients

Standardized

Coefficients

t Sig. B Std. Error Beta

1 (Constant) -1393.377 259.083 -5.378 .000

x2 9.951 2.286 .479 4.352 .001

x5 14.987 2.461 .671 6.089 .000

a. Dependent Variable: y

𝑦 = −1393.377 + 9.951𝑥2 + 14.987𝑥5

Тайлбар: зар сурталчилгааны зардал 1мян.төгрөгөөр өсөхөд борлуулалтын хэмжээ 9,951 сая

төгрөгөөр харин хэрэглэгчийн зардлын инкекс 1%-иар өсөхөд борлуулалтын хэмжээ 14,987сая

төгрөгөөр өсөх нь харагдаж байна.

t-статистик. Энэ нь хувьсагчуудын өмнөх тоо буюу параметрүүдийг хэр үнэмшилтэй вэ гэдгийг

шалгах арга юм. Эндээс Sig буюу probability нь t шалгуурын ач холбогдлыг харуулах ба 0,005-аас

бага байх ёстой юм. Дээрх хүснэгтэнд Sig нь 0,000-0,001 байгаа нь алдаа гарах магадлал 1% байна

гэсэн үг.

Page 13: spss

3. Загварт үнэлгээ өгөх

Model Summary

Model R R Square Adjusted R

Square

Std. Error of

the Estimate

1 .924a .854 .831 41.878

a. Predictors: (Constant), x5, x2

Тайлбар: 𝑅 = 0.92 гарсан нь үр дүнгийн хувьсагч загварт орсон бүх тайлбарлагч хувьсагчуудын

хоорондын хамаарлыг хүч их байгааг (𝑦, 𝑥 –ийн хамаарал хүчтэй) харуулж байна.

𝑅2 = 0.85 гарсан нь тухайн загварт нөлөөлөх хүчин зүйлсийн 85%-ийг тооцсон гэж үзсэн. Өөрөөр

хэлбэл энэ регрессийн тэгшитгэлээр (𝑦 = −1393.377 + 9.951𝑥2 + 14.987𝑥5) 𝑦-ийг 85% тооцож

байна.

ANOVAa

Model Sum of Squares df Mean Square F Sig.

1 Regression 133206.545 2 66603.273 37.977 .000b

Residual 22799.392 13 1753.799

Total 156005.937 15

a. Dependent Variable: y

b. Predictors: (Constant), x5, x2

Тайлбар: Фишерийн шалгуур 𝐹 = 37.97 гарсан нь загвар (тэгшитгэл) бүхэлдээ ач холбогдолтой

гарсан юм.

4. Прогноз урьдчилан таамаглал зохиох

Бидэнд ажиглалтын 16 утга байгаа. Нэг үгээр хэлбэл 17 дахь борлуулалтын утгыг олно. Эндээс

эхлээд 𝑋2, 𝑋5 буюу зар сурталчилгааны зардал мөн хэрэглэгчийн зардлын индексийн 17 сарын

утгыг заавал оруулах SPSS-ийн өгөгдөлд заавал нэмж оруулах ёстой. Дараагаар нь

Analyze – Regression – Linear – Save /standartized/ - ok

Оруулсан өгөдлийн ард багана нэмэгдэх ба үүнийг

Pre – онолын утга

Res – онолын утга болон ажиглалтын утгын зөрүү

Page 14: spss

Олон хүчин зүйлийн регресс – Non-Iinear regression