75
Estatística Indutiva para os cursos de Engenharia e Informática. Anotações de Aula Eurípedes MACHADO Rodrigues 1 ESTATÍSTICA INDUTIVA MÓDULO 1 - REVISÃO I. DISTRIBUIÇÃO NORMAL OU DE GAUSS É a mais importante distribuição de probabilidades, sendo aplicada em inúmeros fenômenos e utilizada para o desenvolvimento teórico da Estatística. É também conhecida como distribuição de Gauss, Laplace, Laplace-Gauss ou curva em sino (por lembrar o formato de um sino). Os primeiros estudos ligados à distribuição Normal foram feitos por De Moivre e, cem anos depois, por Laplace, que consolidou as descobertas feitas até então. Embora Gauss tenha nascido 23 anos depois da morte de De Moivre, a distribuição e a curva normais acabaram recebendo o seu nome. Seja X uma variável aleatória contínua. X terá distribuição normal se: f(x) = π σ 2 . 1 . 2 . x 2 1 e σ μ , −∞ < x < +onde: μ = média de distribuição, σ = desvio-padrão, π = 3,1416, e = 2,7182 O gráfico da distribuição normal é a curva: Se uma variável tem distribuição normal: 68,27% de seus valores cairão no intervalo de um desvio padrão, ou seja, 1σ < z < 1σ ; 95,45% de seus valores cairão no intervalo de dois desvios padrões, ou seja, 2σ < z < 2σ ; 99,73% de seus valores cairão no intervalo de três desvios padrões, ou seja, 3σ < z < 3σ. -μσ μ μ+σ + x μ M o M d f(x) 50% 50% 3σ 2σ 1σ μ 1σ 2σ 3σ z 68,27% 95,45% 99,73%

AP. ESTATÃSTICA INDUTIVA - 2012.2

Embed Size (px)

DESCRIPTION

ap

Citation preview

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    1

    ESTATSTICA INDUTIVA MDULO 1 - REVISO

    I. DISTRIBUIO NORMAL OU DE GAUSS a mais importante distribuio de probabilidades, sendo aplicada em inmeros fenmenos e utilizada para o desenvolvimento terico da Estatstica. tambm conhecida como distribuio de Gauss, Laplace, Laplace-Gauss ou curva em sino (por lembrar o formato de um sino). Os primeiros estudos ligados distribuio Normal foram feitos por De Moivre e, cem anos depois, por Laplace, que consolidou as descobertas feitas at ento. Embora Gauss tenha nascido 23 anos depois da morte de De Moivre, a distribuio e a curva normais acabaram recebendo o seu nome. Seja X uma varivel aleatria contnua. X ter distribuio normal se:

    f(x) = 2.

    1.

    2. x

    21

    e

    , < x < +

    onde: = mdia de distribuio, = desvio-padro, = 3,1416, e = 2,7182 O grfico da distribuio normal a curva: Se uma varivel tem distribuio normal: 68,27% de seus valores cairo no intervalo de um desvio padro, ou seja, 1 < z < 1 ; 95,45% de seus valores cairo no intervalo de dois desvios padres, ou seja, 2 < z < 2 ; 99,73% de seus valores cairo no intervalo de trs desvios padres, ou seja, 3 < z < 3.

    - + + x

    Mo Md

    f(x) 50% 50%

    3 2 1 1 2 3 z

    68,27%

    95,45%

    99,73%

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    2

    Principais caractersticas dessa funo:

    a) a varivel aleatria pode assumir qualquer valor real; b) o grfico da distribuio normal uma curva em forma de sino, simtrica em torno da mdia , que tambm a moda e a mediana, como mostra a figura acima; c) a rea total sob a curva vale 1 (100%), porque essa rea corresponde probabilidade de a varivel aleatria assumir qualquer valor real; d) como a curva simtrica em torno da mdia, os valores maiores do que a mdia e os valores menores do que a mdia ocorrem com igual probabilidade; e) decrescente assintoticamente a zero nos extremos; f) a configurao da curva dada por dois parmetros: a mdia e a varincia 2. Mudando a mdia, muda a posio da distribuio; Mudando a varincia, muda a disperso da distribuio; g) e + so pontos de inflexo.

    A determinao da probabilidade de se obter um valor em um dado intervalo poderia ser feita pela integral definida nesse intervalo, no entanto, o uso de tabelas facilita esse clculo. Usaremos a tabela 1 de Faixa central, em anexop.3, que utiliza valores padronizados de uma varivel z, em funo de x,

    obtida pela transformao linear zo = x

    . Essa varivel chamada normal reduzida ou normal

    padronizada tambm normalmente distribuda com (z) = 0 e (z) = 1. A varivel z representa a distncia algbrica entre o ponto x desejado e a mdia , medida em desvios padres. Assim, obtido um valor zo correspondente a um valor xo considerado, teremos: P( x xo) = P(0 Z zo)

    A tabela de faixa central d a rea sob a curva normal padro entre z = 0 e qualquer valor positivo de zo mas, sendo a curva simtrica em relao mdia, em torno de z = 0, os valores fornecidos so vlidos tambm para valores negativos de zo. O sinal da varivel Z serve apenas para indicar se o valor est acima ou abaixo da mdia. Portanto, P(0 Z zo) = P(zo Z 0) 0 zo Z

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    3

    0 zo Z

    Tabela 1. reas de uma distribuio normal padro. Cada casa na tabela d a proporo sob a curva inteira entre z = 0 e um valor positivo de z. As reas para os valores de z negativos so obtidas por simetria.

    zo 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

    0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2518 0.2549 0.7 0.2580 0.2612 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

    1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

    1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767

    2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4880 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936

    2.5 0.4938 0.4940 04941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986

    3.0 0.4986 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990 3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993 3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995 3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997 3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998 0.4998

    3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.5000 0.5000 0.5000 3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000

    P(0 Z zo)

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    4

    Para consultar a tabela, preciso decompor o Zo em duas parcelas: Parte inteira + 1 casa decimal e 0,0 + 2 casa decimal

    1 PARCELA 2 PARCELA 1 parcela = 1,3 (vertical margem esquerda) Se Zo = 1,39 2 parcela = 0,09 (horizontal margem superior) Zo 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 1,3 0,4177

    No cruzamento das duas parcelas encontra-se a probabilidade correspondente rea da curva entre zero e zo calculado (tambm chamado crtico). A probabilidade que a tabela fornece (0,4177) corresponde rea hachurada. Exemplo 1: O tempo necessrio para executar uma tarefa uma varivel normal de mdia 60 minutos e desvio padro 5 minutos. Qual a proporo de vezes que o tempo necessrio ser: a) maior que 70 minutos? b) menor que 65 minutos? c) exatamente 40 minutos? d) maior que 53 e menor que 62 minutos? Soluo: Temos: = 60 e = 5

    Pela transformao linear z = x

    = 5

    60x

    a) x = 70 zo = 5

    6070 = 2,00

    Da tabela obtemos: 0,4772 P(X > 70) = 0,5 0,4772 = 0,0228 = 2,28% 50%

    b) x = 65 zo = 5

    6065 = 1,00

    Da tabela obtemos: 0,3413 P(X < 65) = 0,5 + 0,3413 = 0,8413 = 84,13% 50%

    X

    Z

    0 Z=1,00

    0,3413

    60 65

    50%

    0,4772

    60 70 X

    0 Z=2,00

    Z

    50%

    0 1,39 Z

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    5

    c) Como em qualquer tipo de varivel aleatria contnua, a probabilidade da varivel tomar exatamente um determinado valor zero, conclumos que:

    P(X = 40) = 0

    d) x = 53 z = 5

    6053 = 1,40

    Da tabela obtemos: 0,4192

    x = 62 zo = 5

    6062 = 0,40

    Da tabela obtemos: 0,1554 P(53 0,5)

    X

    Z

    0 Z=0,40

    0,1554

    60 62 53

    Z=1,40

    0,4192

    X 1,60 1,80 1,50

    0,2486

    Z 0 0,67 0,33

    0,1293

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    6

    P(x > 1,75) = P(z > 0,5) = 0,5000 0,1915 = 0,3085 = 30,85%

    c) x = 1,48 z1 = 30,0

    60,148,1 z1 = 0,4 Tab. : 0,1554

    P(x < 1,48) = P(z < 0,4) P(x < 1,48) = P(z < 0,4) = 0,5000 0,1554 = 0,3446 = 34,46% d) A operao inversa aos itens (a), (b) e (c), ou seja, dada a probabilidade, determine a medida.

    z = x

    1,28 = 30,0

    60,1x x = 1,98 m

    MDULO 2

    ESTATSTICA INDUTIVA: INTRODUO E AMOSTRAGEM

    INTRODUO: a parte da Estatstica que, baseando-se em resultados obtidos da anlise de uma amostra da populao, procura concluir, sugerir ou estimar as leis de comportamento da populao da qual a amostra foi retirada. Os objetivos principais da Estatstica Indutiva so: tirar concluses sobre populaes atravs de amostras extradas dessa populao, induzindo ou caracterizando uma populao atravs de amostra e ainda dizer qual a probabilidade de erro, j que o processo de induo no exato. Tambm atravs da Estatstica Indutiva podemos aceitar ou rejeitar hipteses que podem surgir sobre

    1,60 1,75 X

    50%

    0 0,5 Z

    0,5

    0,1915

    1,60 1,48 X

    50% 0,5

    0,4 0 Z

    0,1554

    0 Zo Z 1,60 X X

    0,4 = 40%

    0,1 = 10%

    Na tabela com P(z) = 0,4000, encontramos Z0 = 1,28

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    7

    as caractersticas da populao, a partir tambm da anlise da amostra representativa dessa populao. Como observao: quanto maior for a amostra, mais precisas e confiveis devero ser as indues realizadas na populao.

    AMOSTRAGEM

    Voc no precisa beber todo o vinho

    para saber que gosto ele tem!.

    1. Introduo

    A teoria da amostragem um estudo das relaes existentes entre uma populao e as amostras dela extradas.

    Portanto fundamental que a amostra seja representativa da populao, isto , deve possuir as mesmas caractersticas bsicas da populao no que diz respeito s variveis pesquisadas para que possamos fazer inferncias (concluses ou indues) acerca da populao.

    Em geral, um estudo de inferncias, feito a respeito de uma populao, mediante a utilizao de amostras dela extradas, juntamente com as indicaes da preciso dessas inferncias, obtidas por meio da teoria da probabilidade denominada inferncia estatstica.

    Dependendo do tipo de varivel a ser estudada, podemos encontrar maior e menor dificuldade para realizar a amostragem. As maiores dificuldades so obtidas nas pesquisas scio-econmicas ou de opinio, onde preciso deixar muito bem caracterizado a populao e o processo de amostragem da mesma. Se a pesquisa elaborada por questionrios, deve-se ter o cuidado de no apresentar perguntas inibidoras ou dbias. 2. Tipos de Amostragem

    2.1) Amostragem Probabilstica

    Uma amostragem ser probabilstica se todos os elementos da populao tiverem probabilidade conhecida, e diferente de zero, de pertencer amostra. Desta forma, a amostragem probabilstica implica em um sorteio sobre todos os elementos da populao com regras bem determinadas, cuja realizao s ser possvel se a populao for finita e totalmente acessvel.

    Principais tcnicas de amostragem probabilsticas:

    1) Amostragem aleatria simples ou casual ou ao acaso ou elementar ou randmica.

    Este tipo de amostragem equivalente a um sorteio lotrico. A amostragem Aleatria Simples constituda de elementos retirados ao acaso da populao, tendo cada um, igual probabilidade de pertencer amostra e todas as possveis amostras tm tambm igual probabilidade de ocorrer. Por isso que a esse tipo de amostragem tende a produzir amostras representativas.

    Exemplo: Supondo que um clube tenha 650 scios e deseja-se fazer uma amostra casual simples de 2% dos scios desse clube, ou seja, 13 scios. Para isso, faremos os seguintes passos:

    I. Numeramos os scios de 001 a 650;

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    8

    II. Escrevemos os nmeros de 001 a 650, em pedaos iguais de um mesmo papel e colocamos os mesmos dentro de uma caixa (uma urna). Agite sempre a caixa para misturar bem os pedaos de papel e retire, um a um 13 nmeros que formaro a amostra.

    Uma segunda opo para o sorteio seria:

    Coloque em uma urna, bolas numeradas de zero a nove, inclusive, misture bem e retire uma. Anote o nmero dessa bola que ser o primeiro dgito do nmero do scio que ser amostrado. Volte a bola retirada urna, misture bem e retire outra. O nmero dessa segunda bola ser o segundo dgito do nmero do scio que ser amostrado. O procedimento dever ser repetido at completar os trs dgitos da numerao utilizada. Como a populao constituda por 650 scios, devem ser desprezados os nmeros maiores que 650, bem como os nmeros que j foram sorteados e o nmero 000. O sorteio dever ser repetido at se conseguir a amostra de 13 scios.

    O processo de seleo exige que se atribuam nmeros consecutivos aos itens listados escolhendo-se depois, aleatoriamente, os nmeros dos itens que comporo a amostra. Conceitualmente, podemos usar cartas de baralho, dados, fichas numeradas ou bolas numeradas para gerar nmeros aleatrios correspondentes aos nmeros de nossa listagem.

    Na prtica, tais dispositivos so empregados raramente, por vrias razes. Uma delas que cada dispositivo deixa algo a desejar; os mtodos no so perfeitamente aleatrios. As cartas, por exemplo, podem aderir umas s outras, impedindo um embaralhamento perfeito. As arestas de um dado podem estar desgastadas. E sempre h o risco de que as bolas de uma urna no terem sido convenientemente misturadas. Em vista disso, e porque a amostragem aleatria vital para a inferncia estatstica, existem tabelas especialmente elaboradas, chamadas tabelas de nmeros aleatrios, construdas de modo que os dez algarismos (0 a 9) so distribudos ao acaso nas linhas e colunas atravs de sorteio equiprovvel. Na tabela de nmeros aleatrios os dez algarismos 0, 1, 2, ..., 7, 8 , 9, podem ser lidos isoladamente ou em grupos; podem ser lidos em qualquer ordem, como por exemplo linhas ou colunas, num sentido ou no outro, diagonalmente, etc. e podem ser considerados aleatrios. A opo de leitura, porm, deve ser feito antes de iniciado o processo. Para usar uma tabela de nmeros aleatrios devemos: 1) Fazer uma lista dos nmeros da populao;

    2) Enumerar consecutivamente os itens da lista, a comear do zero;

    3) Ler os nmeros na tabela de nmeros aleatrios de modo que o nmero de algarismos em cada um seja igual ao nmero de algarismos do ltimo nmero da sua listagem;

    4) Desprezar quaisquer nmeros que no correspondam a nmeros da lista ou que sejam repeties de nmeros lidos anteriormente. Continue o processo at ter o nmero desejado de observaes;

    5) Usar os nmeros assim escolhidos para identificar os itens da lista a serem includos na amostra. NOTA: O inconveniente desse processo a exigncia da enumerao de todos os elementos da populao e sua identificao posterior, quando escolhidos para compor a amostra.

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    9

    EXEMPLO DE UMA TABELA DE NMEROS ALEATRIOS (retirada de: STEVENSON, William J. Estatstica aplicada administrao, So Paulo: Harbra, 1981)

    3690 2492 7171 7720 6509 7549 2330 5733 4730 0813 6790 6858 1489 2669 3743 1901 4971 8280 6477 5289 4092 4223 6454 7632 7577 2816 9202 0772 2160 8236 0812 4195 5589 0830 8261 9232 5692 9870 3583 8997 1533 6566 8830 7271 3809

    2080 3828 7880 0586 8482 7811 6807 3309 2729 1039 3382 7600 1077 4455 8806 1822 1669 7501 7227 0104 4141 1521 9104 5563 1392 8238 4882 8506 6348 4612 8252 1062 1757 0964 2983 2244 5086 0303 7423 3298 3979 2831 2257 1508 7642

    0092 1629 0377 3590 2209 4839 6332 1490 3092 0935 5565 2315 8030 7651 5189 0075 9353 1921 2605 3973 8204 4143 2677 0034 8601 3340 8383 7277 9889 0390 5579 4620 5650 0210 2082 4664 5484 3900 3485 0741 9069 5920 4326 7704 6525

    6905 7127 5933 1137 7583 6450 5658 7678 3444 8387 5323 3753 1859 6043 0294 5110 6340 9137 4094 1957 0163 9717 4118 4276 9465 8820 4127 4951 3781 5101 1815 7068 6379 7252 1086 8919 9047 0199 5068 7447 1664 9278 1708 3625 2864

    7274 9512 0074 6677 8676 0222 3335 1976 1645 9192 4011 0255 5458 6942 8043 6201 1587 0972 0554 1690 6333 1931 9433 2661 8690 2313 6999 8231 5627 1815 7171 8036 1832 2031 6298 6073 3995 9677 7765 3194 3222 4191 2734 4469 8617

    2402 6250 9362 7373 4757 1716 1942 0417 5921 5295 7385 5474 2123 7035 9983 5192 1840 6176 5177 1191 2106 3351 5057 0967 4538 1246 3374 7315 3365 7203 1231 0546 6612 1038 1425 2709 5775 7517 8974 3961 2183 5295 3096 8536 9442

    5500 2276 6307 2346 1285 7000 5306 0414 3383 3251 8902 8843 2112 8567 8131 8116 5270 5994 4675 1435 2192 0874 2897 0262 5092 5541 4014 3543 6130 4247 4859 2660 7852 9096 0578 0097 3521 8772 6612 0721 3899 2999 1263 7017 8057

    5573 9396 3464 1706 9204 3389 5678 2589 0288 7478 7569 7551 3380 2152 5411 2647 7242 2800 3339 2854 9691 9562 3252 9848 6030 8472 2266 5505 8474 3167 8552 5409 1556 4247 4652 2953 6381 2086 5457 7703 2758 2963 8167 6712 9820

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    10

    O uso da tabela pode ser entendido atravs do seguinte exemplo: De uma populao constituda por 650 elementos queremos retirar uma amostra aleatria de 50. O primeiro passo enumerar a populao de 001 a 650. A partir de um dgito escolhido ao acaso na tabela de nmeros aleatrios vamos tomando os nmeros, sempre com 3 algarismos (pois a populao constituda por 650 elementos), at completarmos os 50 elementos necessrios para a amostra desejada. Suponhamos que os algarismos da tabela a partir do dgito escolhido sejam: 369024927171772065..., (percorrer a primeira linha da tabela da esquerda para a direita), os elementos sorteados para a amostra sero os de ordem 369, 024, 171, 065, etc. Os grupos 927 e 772 no foram considerados pois no constam da populao. Ento, so desprezados os nmeros ou grupos que so maiores do que 650 e eventuais repeties, exceto se a amostragem seja com reposio.

    2) Amostragem Sistemtica Quando os elementos da populao j se acham ordenados, no h necessidade de construir um sistema de referncia. Por este processo, as amostras so retiradas periodicamente a partir de determinado elemento ou ponto de partida (por exemplo: de hora em hora). So exemplos os pronturios mdicos de um Hospital, as linhas de produo, etc. Deve ser adotado com cuidado, pois pode conduzir a amostras enviesadas que no detectam eventos peridicos e cclicos. Apesar de seus inconvenientes, um mtodo bastante usado em pesquisas de opinio pblica, onde transeuntes so entrevistados de hora em hora ou aps certa contagem. A seleo dos elementos que constituiro a amostra pode ser feita por um sistema imposto pelo pesquisador. Exemplo: Suponhamos uma populao ordenada constituda por 650 elementos, da qual desejamos retirar uma amostra sistemtica de 50 elementos. Podemos dividir o tamanho da populao (N = 650) pelo tamanho da amostra (n = 50). O nmero obtido vai servir de base para efetuamos a amostragem.

    50

    650 = 13

    O primeiro elemento da populao a fazer parte da amostra dever ser escolhido ao acaso entre os 13 primeiros. A partir do elemento escolhido a cada 13 retira-se outro. Assim, se o primeiro escolhido fosse o 10, o seguinte seria o 23, o outro seria o 36 e assim por diante. A amostragem sistemtica bastante usada pela sua simples execuo. Em linhas de produo sua utilizao muito grande. Existe apenas um risco na sua utilizao que , por exemplo, a possibilidade de existir um defeito cclico numa linha de produo e esse ciclo coincidir com o ciclo adotado na amostragem.

    3) Amostragem por meio de conglomerados Consiste em subdividir a populao que vai ser estudada em pequenos grupos (chamados de conglomerados) fisicamente prximos, independentemente de eles serem homogneos ou no. Nesses grupos, so agregados os elementos com estreito contato fsico (como casas, quarteires, bairros, cidades, etc.). Ao invs de numerarmos os elementos da populao para fazermos uma amostragem aleatria, numeramos os conglomerados e sorteamos alguns deles para constiturem a amostra. Na realidade apenas uma maneira de simplificar o trabalho. A principal razo desse tipo de ajuntamento que muitos elementos podem ser estudados por poucos pesquisadores.

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    11

    4) Amostragem estratificada Muitas vezes a populao se divide em grupos (ou sub-populaes) chamados estratos

    baseados em caractersticas associadas a cada elemento. Dentro de cada estrato os elementos so razoavelmente homogneos mas diferentes de um estrato para outro. o caso dos agrupamentos por sexo, raa, religio, escolaridade, etc. Ao fazermos a amostragem, se no levarmos em conta a existncia dos estratos, poder ocorrer que um ou mais fiquem sem representao na amostra, principalmente se esta for pequena. Portanto, a amostragem estratificada consiste em determinar quantos elementos da amostra sero retirados de cada estrato. So mais considerados dois tipos de amostragem estratificada: a uniforme e a proporcional. Na amostragem estratificada uniforme retira-se igual nmero de elementos de cada estrato e na amostragem estratificada proporcional, o nmero de elementos retirados de cada estrato proporcional ao tamanho do estrato.

    A vantagem desse mtodo com relao ao mtodo da amostra aleatria simples (sem

    estratificao) o de obter estimativas com maior preciso, com mesmo tamanho amostral. Exemplo: Seja obter uma amostra estratifica proporcional de 10% para a pesquisa da estatura

    de 100 alunos de uma escola onde 58 so meninos e 42 so meninas. Temos dois estratos: sexo masculino e sexo feminino. I) Primeiro vamos determinar o tamanho da amostra em cada estrato:

    Sexo Populao 10% Amostra Masculino 58 0,10 . 58 = 5,8 6 Feminina 42 0,10 . 42 = 4,2 4 Total 100 0,10 . 100 = 10 10

    II) Numeramos os alunos de 001 a 100, sendo que de 001 a 058 correspondem meninos e de

    059 a 100 meninas. II) Obtemos uma amostra aleatria ou sistemtica de cada sexo e reunimos as informaes

    numa s amostra, denominada amostra estratificada.

    5) Amostragem mltipla A amostra constituda pela retirada dos elementos da populao em etapas sucessivas,

    sendo que a realizao ou no de uma etapa depende do resultado da etapa anterior. A principal vantagem da amostragem mltipla a diminuio do nmero de elementos

    inspecionados.

    2.2) Amostragem No Probabilstica Quando nem todos os elementos da populao tiverem uma probabilidade diferente de zero de pertencerem amostra, dizemos que a amostragem no-probabilstica. Este processo de amostragem subjetivo e seu regimento depende do conhecimento que o pesquisador possui a respeito da estrutura da populao. empregada, muitas vezes, por simplicidade ou pela impossibilidade de se obter amostragens probabilsticas. Para a Estatstica Indutiva interessa a amostragem probabilstica, pois assim, o acaso ser o nico responsvel por eventuais diferenas entre a populao e a amostra. No entanto, muitas vezes

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    12

    no poderemos conseguir amostras probabilsticas e nesses casos o bom senso nos indicar como proceder para que os resultados possam ser considerados e trabalhados.

    Principais casos de amostragem no probabilstica: 1) Amostragem por Julgamento (ou inacessibilidade a toda a populao)

    A amostra obtida na parte da populao que conhecida (ou acessvel). Ento se faz uma distino entre populao amostrada e populao objeto. Populao amostrada a parte da populao que acessvel e da qual retirada a amostra; Populao objeto aquela sobre a qual pretendemos realizar o trabalho estatstico (de toda a populao). Se as caractersticas das variveis de interesse so as mesmas na populao amostrada e na populao objeto, a amostragem ser equivalente a uma amostragem probabilstica. Isso muito comum quando conclumos sobre a qualidade de um produto pelas unidades que j foram produzidas e estendemos essa concluso para as unidades que ainda sero produzidas. Se as condies de produo permanecerem as mesmas a concluso ser vlida. Se o tamanho da amostra bem pequeno, a amostragem aleatria poder ser no-representativa, ao passo que uma pessoa familiarizada com a populao pode especificar quais os itens mais representativos da populao. Exemplo: Uma rede de pizzarias pode querer experimentar uma nova tcnica de servio, empregando bandejas com aquecimento. Problemas de custo podem fazer com que a experincia se limite a duas lojas, as quais podem diferir consideravelmente em termos de tamanho, localizao, clientela e lucratividade. Ao invs de uma seleo aleatria das duas lojas a serem usadas como teste, ser melhor confiar no conhecimento da administrao para fazer tal escolha. 2) Amostragem a esmo ou sem norma o caso em que o pesquisador procura ser aleatrio, sem, no entanto, utilizar um sorteio aleatrio rigoroso. Exemplo: Se tivermos numa caixa 15.000 parafusos e desejamos retirar uma amostra contendo 150 parafusos do mesmo modelo e tamanho, certamente no faramos uma amostragem aleatria simples, pois seria extremamente trabalhosa, mas faramos retiradas a esmo. Os resultados de uma amostragem a esmo so os mesmos de uma amostragem probabilstica se a populao homognea e se no existe a possibilidade de o pesquisador (ou amostrador) ser influenciado (mesmo que inconscientemente) por alguma caracterstica dos elementos da populao. No seria o caso da amostra dos parafusos, acima, se estes tivessem modelos e tamanhos diferentes, e isto afetasse a caracterstica observada nos parafusos. 3) Populao formada por material contnuo Quando a populao for lquida ou gasosa o procedimento no probabilstico homogeneizar a mistura e retirar uma amostra a esmo. Se a populao for constituda por material slido o processo no probabilstico o da enquartao. O processo da enquartao consiste em dividir a populao em diversas partes e sortear algumas para constiturem a amostra.

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    13

    4) Amostragem Intencional De acordo com determinado critrio, escolhido intencionalmente um grupo de elementos que iro compor a amostra por ach-los representativos da populao. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinio. Exemplo: Numa pesquisa sobre preferncia por determinado cosmtico, o pesquisador se dirige a um grande salo de beleza e entrevista as pessoas que ali se encontram. O grande risco desse procedimento que fica sujeito ao julgamento de uma ou mais pessoas. 5) Amostragem por voluntrios A amostra constituda por elementos da populao que concordam em ser voluntrio principalmente em experincias com novos medicamentos.

    Exerccios

    1) Os pronturios dos pacientes de um hospital esto organizados em um arquivo, por ordem alfabtica. Qual a maneira mais rpida de amostrar 1/3 do total de pronturios?

    2) Um pesquisador tem dez gaiolas que contm, cada uma seis periquitos. Como o pesquisador

    pode selecionar dez periquitos para uma amostra?

    3) Para levantar dados sobre o nmero de filhos por casal, em uma comunidade, um pesquisador organizou um questionrio que enviou, pelo correio, a todas as residncias. A resposta ao questionrio era facultativa, pois o pesquisador no tinha condies de exigir a resposta. Nesse questionrio pergunta-se o nmero de filhos por casal morador na residncia. Voc acha que os dados assim obtidos tm algum tipo de tendenciosidade?

    4) Um pesquisador pretende levantar dados sobre o nmero de moradores por domiclio, usando

    a tcnica de amostragem sistemtica. Para isso, o pesquisador visitar cada domiclio selecionado. Se nenhuma pessoa estiver presente na ocasio da visita, o pesquisador excluir o domiclio da amostra. Esta ltima determinao introduz tendenciosidade. Por qu?

    5) Muitas pessoas acreditam que as famlias se tornaram menores. Suponha que, para estudar

    essa questo, foi selecionada uma amostra de 2000 casais e perguntou-se quantos filhos eles tinham, quantos filhos tinham seus pais e quantos filhos tinham seus avs. O procedimento introduz tendenciosidade nos dados. Por qu?

    6) Supondo que os dados abaixo sejam os dimetros, medidos em mm, de 15 peas recebidas

    por uma empresa. Tome uma amostra de 5 elementos utilizando a tabela de nmeros aleatrios a partir do 31 dgito da 5 linha. Calcule a mdia, a varincia e o desvio padro das medidas dos dimetros das peas da amostra.

    11 15 16 10 20 18 14 12 12 19 17 23 13 22 17

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    14

    NOTA: Para resolver as questes de 6 a 10, utilizar a tabela aleatria abaixo:

    Tabela de nmeros aleatrios 25 19 64 82 84 62 74 29 92 24 61 03 91 22 48 64 94 63 15 07 66 85 12 00 27 23 02 41 46 04 44 31 52 43 07 44 06 03 09 34 19 83 94 62 94 48 28 01 51 92 55 85 66 96 28 28 30 62 58 83 65 68 62 42 45 13 08 60 46 28 95 68 45 52 43 68 45 19 69 59 35 14 82 56 80 22 06 52 26 39 59 78 98 76 14 36 09 03 01 86

    69 31 46 29 85 18 88 26 95 54 01 02 14 03 05 48 00 26 43 85 33 93 81 45 95

    37 31 61 28 98 94 61 47 03 10 67 80 84 41 26 88 84 59 69 14 77 32 82 81 89

    66 42 19 24 94 13 13 38 69 96 76 69 76 24 13 43 83 10 13 24 18 32 84 85 04 33 65 78 12 35 91 59 11 38 44 23 31 48 75 74 05 30 08 46 32 90 04 93 56 16 76 32 06 19 35 22 95 30 19 29 57 74 43 20 90 20 25 36 70 69 38 32 11 01 01

    43 33 42 02 59 20 39 84 95 61 58 22 04 02 99 99 78 78 83 82 43 67 16 38 95

    28 31 93 43 94 87 73 19 38 47 54 36 90 98 10 83 43 32 26 26 22 00 90 59 22

    97 19 21 63 34 69 33 17 03 02 11 15 50 46 08 42 69 60 17 42 14 68 61 14 48 82 80 37 14 20 56 39 59 89 63 33 90 38 44 50 78 22 87 10 88 06 58 87 39 67 03 68 03 13 60 64 13 90 37 11 86 02 57 41 99 31 66 60 65 64 03 03 02 58 97

    65 16 58 11 01 98 78 80 63 23 07 37 66 20 56 20 96 06 79 80 33 39 40 49 42

    24 65 58 57 04 18 62 85 28 24 26 45 17 82 76 39 65 01 73 91 50 37 49 38 73

    02 72 64 07 75 85 66 48 38 73 75 10 96 59 31 48 78 58 08 88 72 08 54 57 17 79 16 78 63 99 43 61 00 66 42 76 26 71 14 33 33 86 76 71 66 37 85 05 56 07 04 75 14 93 39 68 52 16 83 34 64 09 44 62 58 48 32 72 26 95 32 67 35 49 71 40 64 64 57 60 97 00 12 91 33 22 14 73 01 11 83 97 68 95 65 67 77 80 98 87

    7) Resolva o exerccio anterior tomando uma amostra de 6 elementos, utilizando a tabela de nmeros aleatrios a partir da interseco da vigsima segunda coluna com a oitava linha.

    8) Uma indstria recebeu determinado tipo de pea de dois fornecedores, sendo 30 peas do

    fornecedor A e 20 do B. Sabe-se que o aspecto a ser analisado o peso. As peas foram numeradas ao darem entrada no almoxarifado e as 30 primeiras foram as do fornecedor A.

    33 38 34 34 34 31 36 35 32 37 35 34 30 37 36 33 34 34 32 39 34 33 33 34 31 32 36 33 29 36 34 35 34 33 31 35 35 35 37 32 34 34 36 35 34 33 32 38 34 33

    Pede-se: a) Utilizando a tabela de nmeros ao acaso a partir do 11 dgito da 5 linha, tome uma amostra de tamanho 10 e calcule o peso mdio e a varincia dos pesos das peas da amostra;

    a) Se fosse efetuada uma amostragem estratificada proporcional e a amostra fosse de 15 elementos, quantos seriam retirados de cada estrato?

    b) Suponha que das 30 pea do fornecedor A tenha sido colhida uma amostra sistemtica de 5 peas e sabe-se que a 3 pea a entrar no almoxarifado faz parte da amostra. Calcule a mdia e o desvio padro dos pesos das peas dessa amostra.

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    15

    9) Uma populao est dividida em 4 estratos de tamanhos 180, 420, 240 e 360. Foi realizada uma amostragem estratificada proporcional e foram retirados 9 elementos do menor estrato. Qual o tamanho total da amostra?

    10) Na terceira srie de um curso de Engenharia Mecatrnica existem duas turmas: a da manh

    com 40 alunos e a da noite com 20 alunos. As 40 primeiras notas so dos alunos da manh e as outras 20 so dos alunos da noite.

    6,0 6,2 6,6 6,1 6,0 6,8 7,0 7,1 6,5 6,9 6,3 6,5 6,8 6,3 6,4 6,5 7,2 6,0 6,2 6,1 6,6 6,8 6,9 6,2 6,4 6,6 7,0 6,4 6,3 6,5 6,8 6,0 6,6 7,0 6,3 7,1 6,8 6,3 6,1 6,0 6,0 5,1 4,8 6,0 5,0 4,5 4,0 5,0 5,1 5,5 4,5 4,6 5,1 5,3 5,5 4,7 4,8 5,3 5,2 5,8

    a) Foi retirada uma amostra aleatria de 10 notas com auxlio da tabela de nmeros ao acaso, a partir da interseco da stima linha com a vigsima sexta coluna. Calcule a mdia e a varincia das notas dessa amostra; b) Se tivesse sido realizada uma amostragem estratificada uniforme de 10 notas e tivesse sido obtida mdia 6,4 para os alunos da manh e 5,2 para os alunos da noite, em quanto voc estimaria a mdia dos 60 alunos?

    c) Se das notas dos alunos da manh fosse retirada uma amostra sistemtica de 8 notas e soubssemos que a oitava nota (7,1) faz parte dessa amostra, qual a mdia e o desvio padro das notas dessa amostra?

    Respostas:

    1) Seleciona-se, para a amostra, um de cada trs pronturios ordenados (por exemplo, o terceiro de cada trs).

    2) O pesquisador pode usar a tcnica de amostragem estratificada, isto , sortear um periquito de cada gaiola para compor a amostra.

    3) Neste caso, razovel esperar os seguintes tipos de tendenciosidade: a) os casais com muitos filhos responderiam, pensando na possibilidade de algum tipo de ajuda, como instalao de uma creche no bairro; b) os casais que recentemente tiveram o primeiro filho tambm responderiam; c) muitos dos casais que no tm filhos no responderiam.

    4) Nos domiclios onde moram muitas pessoas, ser fcil o pesquisador encontrar pelo menos uma pessoa, por ocasio de sua visita. Ento razovel admitir que os domiclios com poucos moradores tm maior probabilidade de serem excludos da amostra.

    5) Os casais de geraes anteriores que no tiveram filhos no tm possibilidade de serem selecionados para a amostra. Por outro lado, os casais de geraes anteriores que tiveram muitos filhos tero grande probabilidade de serem amostrados.

    6) 16,0 22,5 4,74 7) 16,17 18,17 4,26 8) a) 35 4,44 b) 9 do A e 6 do B c) 34,4 2,8 9) 60

    10) a) 5,98 e 0,508 b) 6,0 c) 6,25 e 0,78

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    16

    MDULO 3 - CORRELAO E REGRESSO

    CORRELAO

    1. INTRODUO:

    Uma das atividades humanas que realizamos sem cessar a de associar a variao de uma varivel variao de outra, constituindo em um dos principais mtodos de ajustamento ao ambiente em que vivemos. J nos primeiros anos de vida, a criana capaz de associar certas expresses faciais dos pais ao seu comportamento provvel. capaz, tambm, de associar certos rudos com determinadas atividades que se passam no lar, e quanto maior for o nmero de associaes que seja capaz de fazer, tanto melhor ser o seu ajustamento ao lar.

    Esse relacionamento entre variveis recebe o nome de correlao. Existe uma grande quantidade de variveis que se relacionam atravs de uma frmula matemtica, como por exemplo, a rea de um quadrado, que depende da medida do seu lado, ou seja, a rea do quadrado igual ao valor do seu lado elevado ao quadrado: A = llll2 ; outras variveis no se relacionam atravs de uma frmula matemtica, como por exemplo, beleza x inteligncia. Em estatstica o assunto abordado pela correlao exatamente uma tentativa de matematizar, sem no entanto resumir por frmulas, a relao que existe entre duas variveis. Outros exemplos estudados pela correlao: nvel econmico x nvel escolar cigarros x cncer horas trabalhadas x rendimento escolar peso x idade da pessoa consumo da famlia x renda familiar demanda de um produto x preo etc....

    Particularmente em psicologia esse assunto largamente aplicado em T.E.P. (tcnicas do exame psicolgico) na medida em que avalia a preciso e a validade de testes psicolgicos,tambm em exames vocacionais que procuram indicar a profisso futura adequada para adolescentes. O que se faz correlacionar os resultados obtidos pelos sujeitos com os resultados esperados para cada uma das profisses e da, indica-se a profisso onde a correlao apresentou o maior grau.

    2. DIAGRAMA DE DISPERSO

    a representao dos pares ordenados (xi ; yi), de duas variveis aleatrias X e Y, em um sistema de coordenadas cartesianas, obtendo uma nuvem de pontos que denominamos diagrama de disperso.

    Exemplo:

    A tabela abaixo fornece as notas de 10 alunos de uma universidade nas disciplinas de matemtica e estatstica: N O T A S ALUNO MATEMTICA (xi) ESTATSTICA (yi)

    01 5,0 6,0 02 5,0 9,0 03 7,0 8,0 04 10,0 10,0 05 6,0 5,0 06 7,0 7,0 07 9,0 8,0 08 3,0 4,0 09 8,0 6,0 10 2,0 2,0

    xi e yi so as variveis dadas na tabela.

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    17

    Diagrama de disperso (grfico da tabela):

    02468

    1012

    0 2 4 6 8 10 12

    notas de matemtica

    notas de estatstica

    Os pontos obtidos, no diagrama (nuvem de pontos), vistos em conjunto, formam uma elipse em diagonal. Podemos imaginar que, quanto mais fina (achatada) for a elipse, mais ela se aproximar de uma reta. Dizemos, ento, que a correlao de forma elptica tem como imagem uma reta, sendo, por isso, denominada correlao linear. Se essa reta for crescente, a correlao ser linear positiva e se for decrescente, a correlao ser linear negativa.

    02468

    1012

    0 2 4 6 8 10 12

    notas de matemtica

    notas de estatstica

    Correlao linear negativa

    2 4 6 8 10 x

    Correlao linear positiva

    y

    10

    8

    6

    4

    2

    0

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    18

    Ausncia de correlao (correlao nula)

    2 4 6 8 10 x 1. MEDIDAS DE CORRELAO

    A correlao linear procura medir a relao entre duas variveis X e Y atravs da disposio dos pontos (x, y) em torno de uma reta. O instrumento de medida da correlao linear dado pelo coeficiente de correlao de Pearson que varia entre 1 e +1 no seguinte esquema:

    correlao aumenta correlao aumenta negativamente positivamente 1 0,75 0,5 0,25 0 0,25 0,5 0,75 1 | | | | | | | | | Correlao positiva perfeita Correlao positiva alta (forte) Correlao positiva mdia Correlao positiva baixa (fraca) Ausncia de correlao (correlao inexistente) Correlao negativa baixa (fraca) Correlao negativa mdia Correlao negativa alta (forte) Correlao negativa perfeita

    y

    10

    8

    6

    4

    2

    0

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    19

    4. Coeficiente de Pearson (rP) Se as variveis em questo X e Y so cardinais, utilizamos o coeficiente de Pearson (Karl Pearson, 1857 1936) dado pela frmula:

    rP = ])y ( y . n [ . ])x ( x . [n

    ) y ( . ) x ( ) y. (x . n

    2i

    2i

    2i

    2i

    iiii

    , onde:

    n = nmero de observaes OBS.: O coeficiente de Correlao Linear de Pearson pode ser calculado tambm por uma Frmula Alternativa que :

    rP = yyxx

    xy

    SS

    S

    ., onde:

    1

    )).((),cov(

    =

    =n

    yyxxyxS

    iixy , que a covarincia entre as variveis x e y,

    cujo resultado determina o sinal e o grau da correlao das variveis;

    ( )

    = nx

    xSi

    ixx

    2

    2)( e ( )

    = ny

    ySi

    iyy

    2

    2)(

    NOTA: O Coeficiente de Pearson calculado pela primeira frmula mais preciso que o calculado pela segunda frmula (frmula alternativa), pois trabalha com os Dados Brutos, sem transformaes, sem arredondamentos. Exemplo: Calcule e interprete o coeficiente de Pearson (rP) para os dados da tabela:

    ALUNO BIOLOGIA (Xi) FISIOLOGIA (Yi) 1 4,5 3,5 2 6 4,5 3 3 3 4 2,5 2 5 5 5,5 6 5,5 5 7 1,5 1,5 8 7 6 35 31

    Completando a tabela, temos:

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    20

    ALUNO BIOLOGIA (Xi) FISIOLOGIA (Yi) Xi . Yi (Xi)2 (Yi)

    2 1 4,5 3,5 15,75 20,25 12,25 2 6 4,5 27 36 20,25 3 3 3 9 9 9 4 2,5 2 5 6,25 4 5 5 5,5 27,5 25 30,25 6 5,5 5 27,5 30,25 25 7 1,5 1,5 2,25 2,25 2,25 8 7 6 42 49 36 35 31 156 178 139

    OBSERVAO: Como o clculo de rP trabalhoso, recomenda-se fazer o grfico antes de comear qualquer clculo. Se os pontos do grfico distriburem-se de tal modo que lembrem uma linha reta, convm calcular rP; se os pontos estiverem dispersos de modo no-linear, no convm calcular rP . A) Diagrama de Disperso:

    0

    2

    4

    6

    8

    0 2 4 6 8

    Notas de Biologia

    Notas de Fisiologia

    B) Coeficiente de Pearson:

    rP = ]31 139 8. [ . ]35 178 . 8 [

    31 . 35 156 . 8

    ])y ( y . n [ . ])x ( x . [n

    ) y ( . ) x ( ) y. (x . n

    222i

    2i

    2i

    2i

    iiii

    =

    rP = 35,173

    163 rP = 0,94

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    21

    C) Interpretao do resultado (correlao positiva alta) O resultado obtido pelo coeficiente de Pearson (rP = 0,94) indica uma correlao positiva altamente significativa entre as duas variveis analisadas. D) Clculo pela Frmula Alternativa:

    8

    35178

    2=xxS = 24,875 , 8

    31139

    2=yyS = 18,875 , 8

    31.35156 =xyS = 20,375

    rP = 875,18.875,24

    375,20 =

    668,21

    375,20 rP = 0,94

    OBSERVAO: A natureza no produz correlaes perfeitas (do tipo rP = 1,00 ou rP = 1,00). Essas correlaes pertencem ao campo da Matemtica, por exemplo, se y = 2x, ento:

    rP =](20) (120) 5. [ . ](10) (30) . 5 [

    (20) . (10) (60) . 5

    ])y ( y . n [ . ])x ( x . [n

    ) y ( . ) x ( ) y. (x .

    222i

    2i

    2i

    2i

    iiii

    =

    n

    rP = 200.50

    100 =

    10000

    100 =

    100

    100 rP = 1,00

    EXERCCIOS PROPOSTOS: 1. Descreva um exemplo de correlao linear positiva e um exemplo de correlao linear negativa, esboando para cada um o respectivo diagrama de disperso;

    Xi Yi Xi . Yi (Xi)2 (Yi)

    2 0 0 0 0 0 1 2 2 1 4 2 4 8 4 16 3 6 18 9 36 4 8 32 16 64 10 20 60 30 120

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    22

    2. Numa pesquisa realizada sobre, nmero de cigarros fumados por dia (x) e idade da morte (y):

    N de cigarros/dia Idade da morte 20 60 25 55 30 40 15 70 25 55 20 61 18 63 28 42 20 58

    Pede-se:

    a) esboar o diagrama de disperso; b) calcular o coeficiente de Pearson; c) interpretar os resultados.

    3.De acordo com um estudo realizado por uma equipe de pesquisadores, as variveis medo do escuro e tempo de convivncia diria com a me esto correlacionadas. A varivel medo foi medida atravs de uma escala que variou entre 1 e 5, sendo 1 o grau mnimo e 5 o grau mximo. A varivel tempo foi avaliada em nmero de horas dirias que a criana convive exclusivamente com a me. Abaixo encontram-se os resultados do estudo em questo, obtidos com 8 crianas:

    Artigo I. Medo do escuro 2 4 3 5 1 3 5 3 Artigo II. Tempo de convivncia 10 8 6 3 12 8 4 7

    Pede-se: a) esboar o diagrama de disperso; b) calcular o coeficiente de Pearson; c) interpretar os resultados.

    4. De acordo com uma pesquisa em uma clnica psicolgica, levantou-se a hiptese segundo a qual o tempo de internao dos pacientes teria uma relao com o grau de satisfao que os sujeitos tm por sua famlia. Foi elaborado um questionrio cujo resultado identificava, em uma escala de 0 a 10, o grau de satisfao dos sujeitos. Com base nos resultados, realize o procedimento adequado para a confirmao ou no desta hiptese, e interprete o resultado. X = grau de satisfao familiar Y = tempo de internao (nmero de dias)

    Artigo III. X 8 4 2 1 9 10 3 5 6 2 Artigo IV. Y 20 5 14 8 3 2 18 30 5 15

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    23

    REGRESSO LINEAR

    Como vimos na Correlao, os pares ordenados de uma tabela determinam o que denominamos de diagrama de disperso, que representa uma correlao entre as variveis da tabela dada. Cabe regresso linear fazer o ajustamento da reta, ou seja, obter a equao da reta que melhor se ajusta aos pontos dados no diagrama de disperso. A anlise de regresso tem por objetivo descrever, atravs de uma equao matemtica, o relacionamento entre duas variveis, partindo de n observaes das mesmas. A varivel sobre a qual desejamos fazer uma estimativa recebe o nome de varivel dependente (y) e a outra recebe o nome de varivel independente (x)

    A equao do ajustamento de uma reta dada por: y* = a x + b, onde a e b so os parmetros. A indicao y* devida pelo fato da eq. de regresso ter um valor aproximado ou terico.

    Os valores dos parmetros a e b so obtidos pelo mtodo dos mnimos quadrados em que:

    a =

    2

    i2i

    ii ii

    ) x( x . n

    y . x ) y. (x . n e b = x a y , onde:

    n o nmero de observaes;

    x a mdia dos valores xi :

    =n

    xx i

    y a mdia dos valores yi :

    =n

    yy i

    EXEMPLO: A tabela a seguir indica as quantidades produzidas mensalmente de um produto e os respectivos custos totais de produo:

    quantidade produzida xi 10 12 13 14 15 16

    custo total (R$) yi 200 230 270 290 280 300

    Pede-se estabelecer pela anlise de regresso:

    a) a reta que melhor se ajusta a esses dados; b) o valor mais provvel dos custos fixos; c) o valor do custo estimado para 18 produtos.

    reta imagem

    10

    8

    6

    4

    2

    0

    y

    2 4 6 8 10 x

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    24

    a) xi yi xi . yi xi

    2

    10 200 2000 100

    12 230 2760 144

    13 270 3510 169

    14 290 4060 196

    15 280 4200 225

    16 300 4800 256

    80 1570 21330 1090

    33,136

    80

    n

    xx i === e 66,261

    6

    1570

    n

    yy i ===

    a =

    2

    i2i

    ii ii

    ) x( x . n

    y . x ) y. (x . n = 17

    140

    2380

    80 1090 . 6

    1570 . 80 21330 .62

    ==

    b = x a y = 261,66 17 . 13,33 = 35,05 35 Portanto a equao de ajuste da reta : y = ax + b y* = 17x + 35

    050

    100150200250300350

    0 5 10 15 20

    quantia produzida (unid.)

    custo total (R$)

    b) o Custo fixo obtido quando fazemos x = o, assim: y* = 17 . 0 + 35 = 0 + 35 y* = R$ 35,00 (custo fixo)

    d) o Custo estimado para x = 18 dado por: y* = 17 . 18 + 35 = 306 + 35 y* = R$ 341,00 (custo estimado)

    EXERCCIOS:

    1. A tabela abaixo indica a quantidade de bolas de basquete produzidas mensalmente e os

    respectivos custos totais de produo: quantidade xi 10 11 12 13 14 15

    custos em R$ yi 100 112 119 130 139 142

    Reta que melhor se ajusta aos dados

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    25

    Pede-se:

    a) a reta que melhor se ajusta a esses dados; b) o valor mais provvel dos custos fixos; c) qual o custo para a quantidade de 16 bolas.

    2. A tabela abaixo mostra a taxa de desemprego em porcentagem da populao economicamente

    ativa de 1980 a 1992 de um determinado pas. Pede-se: a) a reta que melhor se ajusta a esses dados; b) avaliar (estimar) a taxa de desemprego para o ano de 1993 Ano (xi) 80 81 82 83 84 85 86 87 88 89 90 91 92

    % (yi) 2,2 4,3 4 4,3 4,9 4,5 2,4 2,6 3,8 3,2 2,6 4,5 6

    3. A tabela abaixo mostra as alturas e o peso em quilogramas de uma amostra de alunos do

    curso de administrao do 1 semestre. Pede-se: a) a reta que melhor se ajusta a esses dados; b) avaliar a altura do aluno cujo peso 63 kg; c) avaliar o peso do aluno cuja altura 180 cm peso (xi) 45 60 58 55 66 58 70 68 76

    altura (yi) 150 155 158 160 162 165 170 175 178

    4. A tabela abaixo revela uma amostra de valores de seguro pessoal contratados em funo da

    quantidade de salrios mnimos recebidos. Usando a equao de regresso linear, qual seria o montante segurado para algum que recebe 30 salrios mnimos?

    Salrios (xi) 13 16 17 18 20 25 26 32 38 40 42

    Seguro (mil R$) (yi) 50 150 200 100 100 120 150 300 400 500 400

    5. A variao do valor do BTN (Bnus do Tesouro Nacional), relativamente a alguns meses de

    1990, deu origem tabela: Meses (xi) abr mai jun jul ago set out nov

    Valores ($) (yi) 41,73 41,73 43,98 48,91 53,41 59,06 66,65 75,76

    Pede-se: a) a reta que melhor se ajusta a esses dados; ( y* = 4,9x + 17,15 ) b) estime o valor do BTN para o ms de dezembro do mesmo ano. ( $ 75,95 )

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    26

    Resoluo dos exerccios da pgina 24 Prof. Machado 1.

    quantidade xi 10 11 12 13 14 15

    custo total (R$) yi 100 112 119 130 139 142

    a) xi yi xi . yi xi

    2

    10 100 1000 100

    11 112 1232 121

    12 119 1428 144

    13 130 1690 169

    14 139 1946 196

    15 142 2130 225

    75 742 9426 955

    5,126

    75

    n

    xx

    i === e 66,1236

    742

    n

    yy

    i ===

    a =

    2

    i2i

    ii ii

    ) x( x . n

    y . x ) y. (x . n = 8,63

    105

    906

    75 955 . 6

    742 . 75 9426 .62

    ==

    b = x a y = 123,66 8,63 . 12,5 = 15,785 15,78 Portanto a equao de ajuste da reta : y* = ax + b y* = 8,63x + 15,78

    0

    2040

    60

    80

    100

    120

    140

    160

    0 5 10 15 20

    quantidade de bolas

    custo total (R$)

    b) o Custo fixo obtido quando fazemos x = o, assim: y* = 8,63 . 0 + 15,78 = 0 + 15,78 y* = R$ 15,78 (custo fixo)

    c) o Custo estimado para x = 16 dado por: y* = 8,63 . 16 + 15,78 = 138,08 + 15,78 y* = R$ 153,86 (custo estimado)

    Reta que melhor se ajusta aos dados

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    27

    2. Ano (xi) 80 81 82 83 84 85 86 87 88 89 90 91 92

    % (yi) 2,2 4,3 4 4,3 4,9 4,5 2,4 2,6 3,8 3,2 2,6 4,5 6

    a) xi yi xi . yi xi

    2

    80 2,2 176 6400

    81 4,3 348,3 6561

    82 4 328 6724

    83 4,3 356,9 6889

    84 4,9 411,6 7056

    85 4,5 382,5 7225

    86 2,4 206,4 7396

    87 2,6 226,2 7569

    88 3,8 334,4 7744

    89 3,2 284,8 7921

    90 2,6 234 8100

    91 4,5 409,5 8281

    92 6 552 8464

    1118 49,3 4250,6 96330

    8613

    1118

    n

    xx i === e 8,3

    13

    3,49

    n

    yy i ===

    a =

    2

    i2i

    ii ii

    ) x( x . n

    y . x ) y. (x . n = 0,06

    2366

    140,4

    1118 13.96330

    49,3 . 1118 4250,6 .132

    ==

    b = x a y = 3,8 0,06 . 86 1,36 Portanto a equao de ajuste da reta : y* = ax + b y* = 0,06x 1,36

    b) a taxa de desemprego (estimada) para 1993 obtida fazendo na equao do ajuste x = 93. Assim, y* = 0,06 . 93 1,36 = 5,58 1,36 = 4,2%

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    28

    3. peso (xi) 45 60 58 55 66 58 70 68 76

    altura (yi) 150 155 158 160 162 165 170 175 178

    a) xi yi xi . yi xi

    2

    45 150 6750 2025 60 155 9300 3600 58 158 9164 3364 55 160 8800 3025 66 162 10692 4356 58 165 9570 3364 70 170 11900 4900 68 175 11900 4624 76 178 13528 5776 556 1473 91604 35034

    78,619

    556

    n

    xx i === e 67,163

    9

    1473

    n

    yy i ===

    a =

    2

    i2i

    ii ii

    ) x( x . n

    y . x ) y. (x . n = 0,88

    6170

    5448

    556 35034 . 9

    1473 . 556 91604 .92

    ==

    b = x a y = 163,67 0,88 . 61,78 = 109,3 Portanto a equao de ajuste da reta : y* = ax + b y* = 0,88x + 109,3 b) para um peso x = 63 kg, temos: y* = 0,88 . 63 + 109,3 y* = 164,74 cm c) para uma altura y = 180 cm, temos: 180 = 0,88 x + 109,3 0,88 x = 180 109,3 0,88 x = 70,7 x = 80,34 kg

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    29

    4. Salrios (xi) 13 16 17 18 20 25 26 32 38 40 42

    Seguro (mil R$) (yi) 50 150 200 100 100 120 150 300 400 500 400

    a) xi yi xi . yi xi

    2

    13 50 650 169 16 150 2400 256 17 200 3400 289 18 100 1800 324 20 100 2000 400 25 120 3000 625 26 150 3900 676 32 300 9600 1024 38 400 15200 1444 40 500 20000 1600 42 400 16800 1764 287 2470 78750 8571

    1,2611

    287

    n

    xx i === e 5,224

    11

    2470

    n

    yy i ===

    a =

    2

    i2i

    ii ii

    ) x( x . n

    y . x ) y. (x . n = 13,2

    11912

    157360

    287 11.8571

    2470 . 287 78750 .112

    ==

    b = x a y = 224,5 13,2 . 26,1 120 Portanto a equao de ajuste da reta : y* = ax + b y* = 13,2x 120 b) para quem recebe x = 30 salrios mnimos, temos:

    y* = 13,2 . 30 120 = 396 120 y* = R$ 276,00 de montante segurado.

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    30

    5. Meses (xi) abr mai jun jul ago set out nov

    Valores ($) (yi) 41,73 41,73 43,98 48,91 53,41 59,06 66,65 75,76

    a) xi yi xi . yi xi

    2

    4 41,73 166,92 16 5 41,73 208,65 25 6 43,98 263,88 36 7 48,91 342,37 49 8 53,41 427,28 64 9 59,06 531,54 81 10 66,65 666,5 100 11 75,76 833,36 121 60 431,23 3440,5 492

    5,78

    60

    n

    xx i === e 9,53

    8

    23,431

    n

    yy i ===

    a =

    2

    i2i

    ii ii

    ) x( x . n

    y . x ) y. (x . n = 4,9

    336

    1650,2

    60 8.492

    431,23 . 60 3440,5 .82

    ==

    b = x a y = 53,9 4,9 . 7,5 = 17,15 Portanto a equao de ajuste da reta : y* = ax + b y* = 4,9x + 17,15 b) para o ms de dezembro, devemos ter x = 12. Logo:

    y* = 4,9 . 12 + 17,15 = 58,8 + 17,15 y* = $ 75,95

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    31

    MDULO 4 ESTIMATIVA DE PARMETROS.

    1. Parmetro a medida usada para descrever uma caracterstica numrica populacional, ou seja, da populao. Exemplos de parmetros populacionais: mdia (representada por ), varincia (representada por 2) e desvio-padro (representado por ).

    2. Estatsticas da amostra so medidas caractersticas determinadas na amostra para escolher os estimadores de um parmetro populacional. Exemplos de parmetros populacionais: mdia amostral (representada por x ), Varincia amostral (representada por s2) e desvio-padro amostral (represen- tado por s). Resumindo:

    Parmetros Populacionais

    Estatsticas da amostra (Estimadores)

    Mdia x Varincia 2 s2

    Desvio padro s 3. Distribuio Amostral quando selecionamos aleatoriamente vrias amostras de tamanho n da populao, os valores da mdia e do desvio-padro calculados estaro distribudos em torno de valores verdadeiros para a populao. Se selecionarmos aleatoriamente, todas as amostras com mesmo tamanho n desta populao e calcularmos uma estatstica x ou uma estatstica s para as amostras, podemos construir uma distribuio de probabilidades da estatstica. Essa distribuio chamada de Distribuio Amostral.

    Observaes: a) A mdia das mdias das amostras igual mdia populacional, ou seja: x ====

    b) O desvio-padro das mdias das amostras igual ao desvio-padro populacional

    dividido pela raiz quadrada de n, ou seja: n

    x

    ====

    O desvio-padro da distribuio amostral das mdias das amostras denominado erro padro da mdia.

    c) Amostra com reposio aquela em que o elemento extrado devolvido populao aps anotadas suas caractersticas.

    d) Amostra sem reposio aquela em que o elemento extrado no devolvido populao aps anotadas suas caractersticas.

    Exemplo: Suponha que a mdia de uma populao bastante grande seja = 50 e o desvio padro =12. Determinar a distribuio de amostragem das mdias das amostras de tamanho n = 36.

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    32

    Soluo: Em termos de valor esperado e de erro padro da distribuio, temos:

    x = = 50 e n x

    ==== = 36

    12 =

    6

    12 = 2

    Notas: 1) Se usarmos amostras de uma populao finita, deve-se incluir um fator de correo finita (ou fator de correo para populao finita) na frmula do erro padro da mdia. Uma regra de bolso que a correo insignificante e pode ser omitida sempre que n < 0,05.N; isto , quando o tamanho da amostra for menor que 5% do tamanho da populao. A frmula para o erro padro da mdia quando se inclui o fator de correo

    finita : n

    x

    ==== .1N

    nN

    2) Se o desvio padro da populao for desconhecido, o erro padro da mdia pode ser estimado, usando-se o desvio padro da amostra s como um estimador do desvio padro da populao. Para diferenciar este erro padro daquele baseado em um conhecido, denota-se o mesmo por xs . A frmula para o erro padro estimado da mdia

    : n

    s sx ====

    A frmula para o erro padro estimado da mdia quando se inclui o fator de correo

    finita : n

    s sx ==== . 1N

    nN

    , onde 1N

    nN

    o fator de correo finita.

    Exemplo: Um auditor toma uma amostra aleatria de tamanho n = 16 de um conjunto de N = 100 contas a receber. No se conhece o desvio padro dos valores das 100 contas a receber. Contudo, o desvio padro da amostra s = $ 57,00. Determinar o valor do erro padro da distribuio de amostragem da mdia. Soluo: Temos: n = 16 e 5%.N = 0,05 . 100 = 5, ento, n > 5%.N. Logo, usaremos o fator de correo finita para calcularmos o erro padro estimado da mdia com base no desvio padro amostral, ou seja:

    n

    s sx ==== . 1N

    nN

    = 16

    57.

    1100

    16100

    = 4

    57.

    99

    84 = 14,25 . 0,9211 $ 13,13

    3.1. Distribuio amostral das propores Uma distribuio de propores amostrais indica quo provvel determinado um conjunto de propores amostrais, dados o tamanho da amostra e a proporo populacional. Quando o tamanho da amostra 20 ou menos, as probabilidades dos diversos resultados possveis podem ser lidas diretamente numa tabela de probabilidades binomiais simplesmente convertendo o nmero de sucessos em porcentagens. Por exemplo, 3 ocorrncias em 10 observaes correspondem a 30%, 5 ocorrncias em 20 observaes correspondem a 25%. Para maiores amostras, a aproximao normal da binomial d resultados bastante satisfatrios. A mdia (proporo ou porcentagem mdia) da distribuio amostral sempre igual proporo populacional, isto , p = p , onde: p = proporo populacional e p = mdia da distribuio amostral das propores.

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    33

    Quando a populao muito grande ou infinita, o desvio padro da distribuio amostral se calcula pela frmula:

    n

    )p1( .p)p(

    = ou

    n

    q pp

    .)( = , pois (1 p) = q

    Exemplo1: Um varejista compra copos diretamente da fbrica em grandes lotes. Os copos vm embrulhados individualmente. Periodicamente o varejista inspeciona os lotes para determinar a proporo dos quebrados ou lascados. Se um grande lote contm 10% de quebrados ou lascados, qual a probabilidade de o varejista obter uma amostra de 100 copos com 17% ou mais defeituosos? Soluo: Temos: (p ) = p = 10%, que a porcentagem populacional de defeitos, ento (1 p) = 90%; n = 100

    O desvio padro ser: n

    )p1( .p)p(

    = =

    100

    )90,0).(10,0( =

    10

    3,0 = 0,03 = 3%.

    z = )p(

    )p(p

    = %3

    %10%17 =

    %3

    %7 = 2,33 tab.: 0,4901

    Potanto, P( p 17%) = P(z 2,33) = 0,5 0,4901 = 0,0099 = 0,99% 1%

    4. Teorema do Limite Central medida que se aumenta o tamanho da amostra, a distribuio de amostragem da mdia se aproxima da forma da distribuio normal, qualquer que seja a forma da distribuio populacional. Na prtica, a distribuio de amostragem da mdia pode ser considerada como distribuio normal sempre que o tamanho da amostra for n 30. Portanto, o uso da distribuio normal na estimativa da mdia populacional garantido para qualquer grande amostra (n 30), sendo-o para uma pequena amostra (n < 30) somente se a populao for normalmente distribuda e for conhecido, ou seja, importante saber que a populao submetida a amostragem tem distribuio normal, ou ao menos aproximadamente normal.

    Exemplo 1: Um auditor toma uma amostra de n = 36 de uma populao de 1.000 contas a receber. O desvio padro da populao desconhecido, mas o desvio padro da amostra s = $ 43,00. Se o verdadeiro valor da mdia da populao de contas a receber = $ 260,00, qual a probabilidade de que a mdia da amostra seja menor ou igual a $ 250,00, ou seja, P( x 250) = ?

    Soluo: 5%N = 0,05.1000 = 50 n < 5%N. Logo, no inclui fator de correo.

    10% 17% p 0 2,33 z

    0,4901

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    34

    A distribuio de amostragem descrita pela mdia e pelo erro padro:

    x = = 260,00 (como foi dado); ns

    sx ==== = 36

    43 =

    6

    43 7,17

    Nota: s usado como estimador de , e o fator de correo finita no necessrio, uma vez que (n = 36 < 5%N = 0,05 . 1000 = 50)

    zo = xs

    x =

    17,7

    260250 =

    17,7

    10 = 1,39 Tab.: 0,4177

    P(x 250) = P(z 1,39) = 0,5 0,4177 = 0,0823 = 8,23%

    Exemplo 2: Uma transportadora entrega em uma adega 30 caixas, cada uma contendo trs dzias de garrafas de vinho. Sabendo-se que o volume mdio do lote 750 ml por garrafa, com um desvio-padro de 20 ml, determine:

    a) o volume mdio de cada caixa; b) a probabilidade de uma caixa, que contm 36 garrafas ter volume mdio inferior a 740

    ml, ou seja, P( x < 740) = ?

    Como a populao composta de N = 30 x 36 = 1080 garrafas, ela pode ser considerada infinita; Como n = 36 garrafas (n > 30), pode ser considerada uma grande amostra. Da, a distribuio amostral do volume mdio por garrafa pode ser considerado normal, seja qual for a distribuio populacional.

    a) A mdia da distribuio amostral sempre igual mdia da populao. Logo, o volume mdio por caixa ser: = )x( = 750 ml

    b) Para determinar a probabilidade de uma caixa ter volume mdio inferior a 740 ml, devemos calcular: I) o desvio padro da distribuio amostral do volume mdio:

    n)x(

    = =

    36

    20 =

    6

    20 =

    3

    10 (n = 36 < 5%N = 54 no inclui fator de correo finita).

    II) o valor do volume limite na escala reduzida padronizada Z:

    zo = )x(

    )x(x

    =

    3

    10750740

    = 10

    10 .3 zo = 3 tab.: 0,4986

    P(x < 740) = P(z < 3) = 0,5000 0,4986 = 0,0014 = 0,14%

    zo 0.00 --- 0.09

    1.3 0.4032 --- 0.4177

    750 740 x

    50% 0,5

    3 0 Z

    0,4986

    260 250 x

    50% 0,5

    1,39 0 Z

    0,4177

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    35

    Exemplo2: Uma mquina de encher sacos plsticos de leite foi ajustada para um volume mdio de 1.000 ml, com um desvio padro de 25 ml. O ajuste deve ser sempre verificado porque o Servio de Inspeo Federal SIF multar o fabricante se uma amostra aleatria acusar volume mdio inferior a 950 ml e os sacos podero romper-se no transporte se contiverem mais que 1.050 ml de leite. Se uma amostras de 25 unidades for aleatoriamente escolhidas sem reposio de um lote de 750 sacos, qual ser:

    a) O volume mdio esperado? b) O desvio padro da distribuio amostral correspondente? c) O nmero de amostras com volume mdio entre 990 ml e 1.010 ml?

    Temos: N = 750; n = 25; = 25; 5%N = 0,05.750 = 37,5 n < 5%N a) o volume mdio esperado igual ao volume populacional: = )x( = 1000 ml b) o desvio padro da distribuio amostral correspondente :

    n

    )x(

    ==== = 25

    25 =

    5

    25 5 ml

    c) como conhecido e a populao tem distribuio amostral, ela aproximadamente normal.

    P(990 < x < 1010) =?

    z1 = )x(

    )x(x

    =

    5

    1000990 = 2 tab.: 0,4772

    z2 = )x(

    )x(x

    =

    5

    10001010 = 2 tab.: 0,4772

    Ento: P(990 < x < 1010) = P(2 < z < 2) = 2 . 0,4772 = 0,9544 = 95,44%

    Portanto, o nmero de amostras com volume mdio entre 990ml e 1010ml :

    n = 25 . 95,44% = 23,86 24

    5. Estimao Pontual Uma estimativa pontual quando obtida de um nico valor para um parmetro populacional. Exemplo: a mdia amostral x uma estimativa pontual para a mdia populacional .

    6. Estimao por Intervalos.

    a) Uma estimativa intervalar um intervalo (ou uma amplitude) de valores usados para estimar um parmetro populacional.

    b) Nvel de confiana (ou grau de confiana ou coeficiente de confiana) a probabilidade de que o intervalo estimado contenha o parmetro populacional. Vimos que: Se n 30, a distribuio amostral das mdias uma distribuio normal.

    zo 0.00 0.01 0.02

    2.0 0.4772 0.4778 0.4783

    x 1000 1010 990

    0,4772

    Z 0 2 2

    0,4772

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    36

    O nvel de confiana c a rea sob a curva normal reduzida, entre os valores crticos zc e zc

    Nota: Alguns autores representam o nvel de confiana por (1 ) (geralmente expressa com valor

    porcentual).

    7. Intervalos de confiana para a mdia (amostras grandes) Sendo c um nvel de confiana, a margem de erro E a maior distncia possvel entre a estimativa pontual e o valor do parmetro a ser estimado. Esse erro dado pela frmula:

    E = zc . n

    ou E =

    2z .

    n

    Observao: Se n 30, o desvio padro amostral s poder ser usado no lugar do desvio padro populacional quando este for desconhecido. Neste caso,

    E = zc . n

    s ou E =

    2z .

    n

    s

    Um intervalo de confiana c para a mdia populacional dado por:

    x E < < x + E ou = x E ou = x 2

    z . n

    Nota: Dizemos que c ou (1 ) a probabilidade de que o intervalo de confiana contenha a mdia populacional .

    Observao: Os intervalos de confiana mais freqentemente utilizados so os de 90%, 95% e 99%

    Propores selecionadas de rea sob a curva Nvel (ou grau) de confiana

    c ou (1 )% Valor crtico

    zc = 2

    z

    90% = 0,90 10% = 0,10 1,645 95% = 0,95 5% = 0,05 1,96 99% = 0,99 1% = 0,01 2,575

    1 = 90% = 10% 1 = 95% = 5% 1 = 99% = 1%

    Exemplo:

    2 = 5%

    45%=0,45

    Z 0 1,645 1,645

    45%

    2 = 5%

    90% 2

    = 2,5%

    1,96 1,96

    47,5%=0,475

    Z 0

    47,5%

    2 = 2,5%

    95%

    49,5%=0,495

    2 = 0,5%

    Z 0 2,57 2,57

    49,5%

    2 = 0,5%

    99%

    z = 0 zc zc z

    c (1 )

    2 2

    2z

    2z

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    37

    Uma amostra aleatria de n = 36 elementos retirados de uma populao aproximadamente normal forneceu mdia x = 15,5 e desvio-padro s = 1,5. Construir um intervalo de 95% de confiana para a mdia dessa populao. Soluo: c = 95% = 0,95 ; n = 36 (n 30); s = 1,5 e x = 15,5 Na tabela da distribuio normal reduzida encontramos zc = 1,96

    E = zc . n

    s = 1,96 .

    36

    5,1 = 0,49 (margem de erro)

    O intervalo ser: 15,5 0,49 < < 15,5 + 0,49 15,01 < < 15,99 Portanto, com 95% de confiana, podemos dizer que a mdia populacional est entre 15,01 e 15,99.

    Refazer o exerccio anterior para intervalo de 90% e 99% de confiana. (Voc pode usar o valor de zc de acordo com a tabela de propores selecionadas de rea sob a curva representada na p.36) Nota: Quando a populao finita e a amostra constitui mais de 5% da populao, devemos aplicar o fator de correo finita para modificar os desvios padres das frmulas:

    E = zc . n

    .

    1N

    nN

    e E = zc . n

    s.

    1N

    nN

    8. Tamanho da amostra O tamanho da amostra para estimar a mdia, depende do grau de confiana desejado, da quantidade de disperso entre os valores individuais da populao e certa quantidade especfica de erro tolervel. Para um nvel de confiana c e um erro mximo E, podemos obter o tamanho mnimo da amostra necessria para estimar a mdia populacional a partir da frmula do erro, ou seja:

    E = zc . n

    n =

    E

    .zc ( )2n = 2

    c

    E

    .z

    n =

    2c

    E

    .z

    Exemplo 1 Que tamanho de amostra ser necessrio para produzir um intervalo de 90% de confiana para a verdadeira mdia populacional, com erro de 1,0 em qualquer dos sentidos, se o desvio padro da populao 10? Soluo: Temos: E = 1,0; = 10; c = 90% = 0,90 zc =

    2z = 1,645

    n = 2

    c

    E

    .z

    =

    2

    1

    10 . 645,1

    = 272,25 n 273

    Obs.: quando necessrio n ser arredondado para o prximo inteiro.

    zc 0.00 --- 0.06

    1.9 0.4032 --- 0.4750 z = 0 zc zc z

    47,5% = 0,4750

    c = 95%

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    38

    Exemplo 2 Uma populao aproximadamente normal forneceu mdia x = 15,5 e desvio-padro de 1,5. Determinar o tamanho requerido de uma amostra para assegurar que, com confiana de 95%, a mdia amostral esteja dentro do intervalo 0,25 da mdia populacional. Soluo: Temos: E = 0,25; s = 1,5 ; c = 95% = 0,95 zc = 1,96

    n = 2

    c

    E

    s .z

    =

    2

    0,25

    1,5 . 96,1

    = 138,2976 n 139

    Exemplo 3 Um comprador potencial deseja estimar o valor mdio das compras por cliente em uma loja de brinquedos em um aeroporto. Com base em dados de outros aeroportos similares, o desvio padro de tais valores de venda estimado em cerca de = $ 0,80. Qual o tamanho mnimo que deveria ter uma amostra aleatria se a distribuio das vendas no for considerada normal e ele desejar estimar a mdia dos valores dentro de $ 0,50 com uma confiana de 99%? Soluo: Temos: E = 0,50; = 0,80 ; c = 99% = 0,9 zc = 2,575

    n = 2

    c

    E

    .z

    =

    2

    0,50

    0,80 . 575,2

    = 16,97 n 17

    Contudo, uma vez que a populao no pode ser considerada como normalmente distribuda, o tamanho mnimo da amostra n = 30, de tal forma que o Teorema do Limite Central possa ser invocado para usar-se a distribuio normal de probabilidade para construir o intervalo de confiana.

    9. Intervalos de confiana para a mdia (amostras pequenas) Nos casos em que n < 30 e o desvio-padro populacional (ou, a varincia populacional 2) conhecido, o intervalo de confiana c ou (1 ) o mesmo para grandes amostras, isto :

    x E < < x + E, onde E = zc . n

    Exemplo 1 De uma populao normalmente distribuda, com = 2, tiramos uma amostra de 20 elementos e obtemos x = 5,2. Determinar um intervalo de 90% de confiana para a mdia populacional . Soluo: Temos: = 2; x = 5,2; n = 20; c = 90% = 0,9 zc = 1,645

    I) E = zc . n

    = 1,645 .

    20

    2 = 0,7

    II) x E < < x + E 5,2 0,7 < < 5,2 + 0,7 4,5 < < 5,9

    Portanto, com 90% de confiana, podemos dizer que a mdia populacional est entre 4,5 e 5,9.

  • Estatstica Indutiva para os cursos de Engenharia e Informtica. Anotaes de Aula Eurpedes MACHADO Rodrigues

    39

    Exemplo 2 Suponha que o desvio padro da vida til de uma determinada marca de tubo de imagem de TV conhecido e igual a = 500 horas, mas que a mdia da vida til desconhecida. Supe-se que a vida til dos tubos de imagem tem uma distribuio aproximadamente normal. Para uma amostra de n = 15, a mdia da vida til x = 8.900 horas de operao. Construir um intervalo de confiana de 95% para estimar a mdia da populao. Soluo: Temos: = 500; x = 8900; n = 15; c = 95% = 0,95 zc = 1,96 (p.36)

    A distribuio normal de probabilidade pode ser usada neste caso porque a populao normalmente distribuda e o conhecido.

    I) E = zc . n

    = 1,96 .

    15

    500 = 253

    II) x E < < x + E 8900 253 < < 8900 + 253 8647 < < 9153 Portanto, com 95% de confiana, podemos estimar a mdia populacional como estando entre 8.647 horas e 9.153 horas.

    Nota: Em muitos casos desconhecemos o valor do desvio-padro populacional e tambm no conseguimos uma amostra com (n 30). Nestes casos, se a populao for normalmente distribuda, construmos um intervalo de confiana para a mdia utilizando a distribuio t de Student.

    Distribuio t de Student (ou Distribuio T)

    O criador da distribuio t foi William S. Gossett (1876 1937), empregado de uma cervejaria irlandesa chamada Guinnes, no incio do sculo XX ele precis