4
Regents Review # 11.notebook 1 June 01, 2015 May 272:45 PM TP: To review Standard Deviation, Residual Plots, and Correlation Coefficients Do Now: Write down the 5 statistic summary for each box plot below. Which plot has the higher interquartile range? Which box plot shows more variability? A B May 272:53 PM Reminder: Univariate Data Bivariate Data Example: Puppy Weights You weigh the pups and get these results: 2.5, 3.5, 3.3, 3.1, 2.6, 3.6, 2.4 May 272:59 PM One of the ways we can compare univariate data is to consider Standard Deviation. Standard Deviation tells us about variability. The higher the SD, the more spread out the data is. The lower the SD, the closer together the data is. May 273:02 PM Without calculating it, which one of these has the highest Standard Deviation? Test Scores for Class A: 68, 90, 99, 88, 41, 78 Test Scores for Class B: 87, 89, 87, 79, 84, 82 May 273:03 PM Check the website tonight for a video reminder of how to calculate standard deviation by hand. To calculate SD by calculator: 1) Enter your univariate data in L1 (Stat, Edit) 2) Go to Stat, Calc, and Select 1Var Stats 3) "Sx" tells us standard deviation May 273:05 PM The "correlation coefficient" of bivariate data measures the strength and type of correlation between two variables. This number is between 1 and 1. CC close to 1 or close to 1 would indicate that data is linear. CC close to 0 indicate that the data is nonlinear.

Regents Review # 11.notebook - WordPress.com › 2015 › 06 › ... · Regents Review # 11.notebook 2 June 01, 2015 May 273:07 PM Estimate whether the correlation coefficient will

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Regents Review # 11.notebook - WordPress.com › 2015 › 06 › ... · Regents Review # 11.notebook 2 June 01, 2015 May 273:07 PM Estimate whether the correlation coefficient will

Regents Review # 11.notebook

1

June 01, 2015

May 27­2:45 PM

TP: To review Standard Deviation, Residual Plots, and Correlation Coefficients

Do Now: Write down the 5 statistic summary for each box plot below. Which plot has the higher interquartile range? Which box plot shows more variability?

A

B

May 27­2:53 PM

Reminder: Univariate Data Bivariate DataExample: Puppy WeightsYou weigh the pups and get these results:

2.5, 3.5, 3.3, 3.1, 2.6, 3.6, 2.4

May 27­2:59 PM

One of the ways we can compare univariate data is to consider Standard Deviation.

Standard Deviation tells us about variability. 

The higher the SD, the more spread out the data is.

The lower the SD, the closer together the data is.

May 27­3:02 PM

Without calculating it, which one of these has the highest Standard Deviation?

Test Scores for Class A:

68, 90, 99, 88, 41, 78

Test Scores for Class B: 

87, 89, 87, 79, 84, 82

May 27­3:03 PM

Check the website tonight for a video reminder of how to calculate standard deviation by hand. 

To calculate SD by calculator: 

1) Enter your univariate data in L1 (Stat, Edit)

2) Go to Stat, Calc, and Select 1­Var Stats

3) "Sx" tells us standard deviation

May 27­3:05 PM

The "correlation coefficient" of bivariate data measures the strength and type of correlation between two variables. This number is between ­1 and 1.

CC close to 1 or close to ­1 would indicate that data is linear.CC close to 0 indicate that the data is non­linear.

Page 2: Regents Review # 11.notebook - WordPress.com › 2015 › 06 › ... · Regents Review # 11.notebook 2 June 01, 2015 May 273:07 PM Estimate whether the correlation coefficient will

Regents Review # 11.notebook

2

June 01, 2015

May 27­3:07 PM

Estimate whether the correlation coefficient will be closer to ­1, 0 or 1.

May 27­3:11 PM

Graphing Calculator Instructions:

1. Enter your lists into L1 and L2. Use L1 for x and L2 for y.*make sure ordered pairs are together*

2. Turn "Diagnostic On" by pressing 2nd ­­> 0 and finding "Diagnostic On". Then, press Enter. Make sure you see the word "Done".

3. Run a regression analysis. (Stat Calc 4)*make sure the "XList" is L1 and the "YList" is L2. Press Calculate.

4. The value of "r" is the correlation coefficient (note: this test also shows you the slope and y­intercept of the line of best fit).

May 27­3:11 PM

We can also use residual plots to determine if a line of best fit is a good representation of data.

Which set of data is better modeled by the line of best fit?

May 27­3:23 PM

To calculate residuals, create a table, the first two columns show experimental data. 

To find predicted value, use "LinReg" on the calculator to find the line of best fit. Then plug in each x variable and find y. 

The residual is the predicted value ­ experimental value.

Line of best fit:

y = 53x + 1514

Predicted value for 14 minutes:

y = 53(14) + 1514

y = 2,256

Residual for 14: 

2256 ­ 1510 = 746Try the rest of the table.

May 27­3:30 PM

To create a residual plot, make a scatter plot. The x­axis will represent the independent variable. 

The y­axis represents the residuals.

Residuals

(x)0123456

­6­5

­1

­4­3­2

25

Curb weight (x)

3332313029282726

May 27­3:32 PM

A residual plot will describe how far away each piece of experimental data is from the predicted data. 

A residual plot with no pattern (some dots above the line, some below) indicates that the original data is linear.

A residual plot that is curved or includes a pattern is not linear. 

Page 3: Regents Review # 11.notebook - WordPress.com › 2015 › 06 › ... · Regents Review # 11.notebook 2 June 01, 2015 May 273:07 PM Estimate whether the correlation coefficient will

Regents Review # 11.notebook

3

June 01, 2015

May 27­5:36 PM

Which residual plot(s) describe linear data?

May 27­5:38 PM

1 Which of these cannot be used to help determine if bivariate data can be accurately described with a linear model.

A Residual Plot

B Standard Deviation

C Correlation Coefficient

D Line of Best Fit

May 27­5:41 PM

Find the standard deviation for the following data. Then determine which is more spread out.

A)  2.5, 4, 2.8, 3.6, 4.3

B) 1.7, 1.9, 2.0, 2.4, 4.1 

Puppy weights

May 27­5:42 PM

Which of the following data sets would have a correlation coefficient closest to ­1?

1)  2)

3)  4)

May 27­5:45 PM

Find the equation of the line of best fit for the following data. Then use that to predict the distance traveled when the time is 148 minutes.

May 27­5:46 PM

Fred draws two conclusions from this residual plot. First he says that this data is not linear. Second, he says that it must be quadratic because the data looks like a parabola. Which of Fred's conclusions is correct and what is wrong with the other conclusion?

Page 4: Regents Review # 11.notebook - WordPress.com › 2015 › 06 › ... · Regents Review # 11.notebook 2 June 01, 2015 May 273:07 PM Estimate whether the correlation coefficient will

Regents Review # 11.notebook

4

June 01, 2015

May 27­5:49 PM

Write down in your notebooks your best explanation of why data that is linear will result in a residual plot that has no pattern. 

Then discuss your answer with your table. 

May 27­5:51 PM

1) What would a data set with a standard deviation of 0 look like?

2) What could the correlation coefficient of a data set that is perfectly linear be? 

3) What would the residual plot of a data set that is perfectly linear look like?

May 27­5:54 PM

Summary: What does standard deviation tell us about univariate data?

What do Correlation Coefficients and Residual Plots tell us about bivariate data?