class: center, middle, inverse, title-slide # Variância e Desvio-padrão ###
Prof. Steven Dutt Ross
Atividades
Aulas
Livro
--- <style type="text/css"> @import url('https://fonts.googleapis.com/css?family=Chilanka&display=swap'); @import url('https://fonts.googleapis.com/css2?family=Gloria+Hallelujah&display=swap'); .myfont { color: #fff; font-family: 'Gloria Hallelujah', cursive; font-size: 80px; } .preto { color: black; font-size: 30px; } </style> # Imagine que temos duas ruas na cidade. <br> <br> ## Em cada uma dessas ruas temos cinco prédios com alturas diferentes. ## Temos prédios altos e prédios baixos. --- class: center, middle background-image: url(https://raw.githubusercontent.com/DATAUNIRIO/CSS/master/img/desviopadrao/Slide2.PNG) background-size: 900px --- class: center, middle <br> <br> <br> # Qual seria a altura média dos prédios dessa rua? --- class: center, middle background-image: url(https://raw.githubusercontent.com/DATAUNIRIO/CSS/master/img/desviopadrao/Slide3.PNG) background-size: 900px --- class: center, middle <br> <br> <br> # Já na rua azul, temos os seguintes prédios: --- class: center, middle background-image: url(https://raw.githubusercontent.com/DATAUNIRIO/CSS/master/img/desviopadrao/Slide4.PNG) background-size: 900px --- class: center, middle <br> <br> <br> # Qual seria a altura média dos prédios da rua azul? --- class: center, middle background-image: url(https://raw.githubusercontent.com/DATAUNIRIO/CSS/master/img/desviopadrao/Slide5.PNG) background-size: 900px --- class: center, middle <br> <br> # Se eles têm a mesma média, eles são iguais? <br> # Qual a diferença entre os prédios azuis e os prédios vermelhos? --- class: center, middle <br> <br> # A diferença é na variabilidade (diversidade das alturas dos prédios). <br> ## Qual rua tem maior variabilidade em torno da média? --- class: center, middle <br> <br> # Poderíamos criar uma estatística para representar essa variabilidade das alturas dos prédios? --- # Definição: Variância amostral ### A variância de uma amostra de n elementos é definida como a soma ao quadrado dos desvios dos elementos em relação à sua média dividido por (n-1). Ou seja, a variância amostral é dada por: $$s^2 = \frac{1}{n-1}\sum\limits_{i = 1}^n {\left( {x_i - \bar x} \right)^2 } $$ --- # Definição: Desvio padrão amostral ### O desvio padrão amostral de um conjunto de dados é igual à raiz quadrada da variância amostral. Desta forma, o desvio padrão amostral é dado por: $$s = \sqrt{\frac{1}{n-1}\sum\limits_{i = 1}^n {\left( {x_i - \bar x} \right)^2 } } $$ --- class: center, middle background-image: url(https://raw.githubusercontent.com/DATAUNIRIO/CSS/master/img/desviopadrao/desvioP.jpg) background-size: 900px --- class: center, middle # Vamos utilizar a formula para encontrar a variância e o desvio-padrão dos prédios azuis. --- class: center, bottom, preto background-image: url(https://raw.githubusercontent.com/DATAUNIRIO/CSS/master/img/desviopadrao/Slide12.PNG) background-size: 900px Dentro do circulo azul temos os valores ao quadrado. --- # Faça a soma e divida por número de observações – 1 `\(Variância = ( 9 + 4 + 144 + 9 + 64 )/ 4\)` `\(Variância = 230 / 4\)` `\(Variância = 57,5\)` # O desvio-padrão (DP) será a raiz quadrada da variância: `\(DP=\sqrt{Variância}\)` `\(DP=7,58\)` --- # Atividades ### 1. Encontre a variância e o desvio-padrão dos prédios vermelhos. ### 2. Qual das duas variâncias (azuis ou vermelhos) é maior? ### 3. Isso faz sentido? Está de acordo com a sua análise do gráfico? --- # Chega de fazer conta na mão # Vamos refazer esse resultado com o no <svg style="height:50;fill:steelblue;" viewBox="0 0 581 512"><path d="M581 226.6C581 119.1 450.9 32 290.5 32S0 119.1 0 226.6C0 322.4 103.3 402 239.4 418.1V480h99.1v-61.5c24.3-2.7 47.6-7.4 69.4-13.9L448 480h112l-67.4-113.7c54.5-35.4 88.4-84.9 88.4-139.7zm-466.8 14.5c0-73.5 98.9-133 220.8-133s211.9 40.7 211.9 133c0 50.1-26.5 85-70.3 106.4-2.4-1.6-4.7-2.9-6.4-3.7-10.2-5.2-27.8-10.5-27.8-10.5s86.6-6.4 86.6-92.7-90.6-87.9-90.6-87.9h-199V361c-74.1-21.5-125.2-67.1-125.2-119.9zm225.1 38.3v-55.6c57.8 0 87.8-6.8 87.8 27.3 0 36.5-38.2 28.3-87.8 28.3zm-.9 72.5H365c10.8 0 18.9 11.7 24 19.2-16.1 1.9-33 2.8-50.6 2.9v-22.1z"/></svg> --- ```r variancia <- ( 9 + 4 + 144 + 9 + 64 )/ 4 dp <- sqrt(variancia) # Azul azul<-c(70,65,55,70,75) media_azul<-mean(azul) var_azul<-var(azul) dp_azul<-sd(azul) # Vermelho vermelho<-c(40,95,55,80,65) media_vermelho<-mean(vermelho) variancia_vermelho<-var(vermelho) dp_vermelho<-sd(vermelho) ``` --- class: center, middle # Nota: a média não é suficiente. Ela precisa vir acompanhada de uma medida de dispersão. --- class: middle # Vamos fazer em um banco de dados! --- class: middle, bottom Referência [https://www.facebook.com/rtrainings/](https://www.facebook.com/rtrainings/) [http://www.portalaction.com.br/estatistica-basica/22-medidas-de-dispersao](http://www.portalaction.com.br/estatistica-basica/22-medidas-de-dispersao) [http://metrologia-thiagokyamamoto.blogspot.com/2017/01/desvio-padrao.html](http://metrologia-thiagokyamamoto.blogspot.com/2017/01/desvio-padrao.html)