O que é desvio padrão? Entenda com um exemplo
Desvio padrão é um conceito básico em estatística, mas nem sempre claro para todos. Matematicamente, desvio padrão é uma estatística que fornece informação sobre a dispersão dos dados e mede o quanto em média seus dados estão distantes da média. Difícil, né? Essa definição é muito complicada de ser compreendida, mas vamos tratar com um exemplo para ficar mais claro para o leitor.
Neste post vamos entender o desvio padrão com um exemplo prático envolvendo distâncias e o que essa distância da média quer dizer. Para isso, vamos introduzir como exemplo uma viagem de carro.
Exemplo: uma viagem de carro
Imagine que você mora na cidade do Rio de Janeiro e viaje bastante para São Paulo a trabalho e para Cabo Frio, onde você tem uma casa de descanso, e que você quer avaliar para quão longe do Rio você está viajando e se compensa se mudar para um lugar mais próximo de onde vai com frequência. Veremos em breve como isso tem relação com o desvio padrão.
Considere que São Paulo fica a aproximadamente 500km a esquerda do Rio de Janeiro e que Cabo Frio fica a 150km a direita da cidade maravilhosa. Matematicamente, consideramos que viagens para a esquerda são negativas. Então, se eu vou para São Paulo partindo do Rio, eu viajo -500km. Veja na figura abaixo uma ilustração.
Suponha que em uma semana eu tenha ido e voltado de São Paulo duas vezes e ido e voltado de Cabo Frio uma vez, sempre tomando como referência o ponto zero, o Rio de Janeiro. A viagem de ida para São Paulo dá 500km para a esquerda (-500) e 500km de volta para a direita (+500). Para ir para Cabo Frio eu percorro 150km a direita (+150) e para voltar mais 150km para a esquerda (-150km). Então, temos os seguintes dados
Viagem | Distância |
---|---|
São Paulo (ida) | -500 |
São Paulo (volta) | +500 |
Cabo Frio (ida) | +150 |
Cabo Frio (volta) | -150 |
São Paulo (ida) | -500 |
São Paulo (volta) | +500 |
Agora eu quero avaliar o quão longe eu estou indo viajar em média da minha casa, no Rio de Janeiro. Essa noção de “quão longe estou viajando em média” é o quanto você se afasta do Rio em média quando você viaja. Como calcular isso?
Calculando a distância média percorrida
Se eu fosse apenas pegar uma média dessas distâncias eu teria zero porque as viagens de ida e volta se cancelam. Então eu preciso arrumar um jeito para que essas distâncias não se cancelem quando eu tiro a média. Para isso, elevamos todas as distâncias ao quadrado e tudo fica positivo. (Vale lembrar que também poderíamos considerar o módulo ou valor absoluto, mas o quadrado tem propriedades matemáticas mais legais e por isso o utilizamos.). Assim, eu tenho uma nova tabela com todos os valores ao quadrado.
Viagem | Distância | Distância ao quadrado |
---|---|---|
São Paulo (ida) | -500 | 250000 |
São Paulo (volta) | +500 | 250000 |
Cabo Frio (ida) | +150 | 22500 |
Cabo Frio (volta) | -150 | 22500 |
São Paulo (ida) | -500 | 250000 |
São Paulo (volta) | +500 | 250000 |
Média | 0 | 174166.7 |
Note que tomando a média diretamente das distâncias ao quadrado a escala será em km². Porém, estamos interessados quantos km estamos nos afastando em média de nossa casa, não quantos km². Por isso que não apenas somamos todas as distâncias ao quadrado e dividimos pelo número de viagens. O fluxo de etapas para calcular essa estatística a qual estamos interessados é
- Elevar todas as distâncias ao quadrado.
- Somar todas as medidas obtidas acima.
- Dividir pelo número de viagens menos um (n-1). Vamos explicar em breve porque divide por n-1…
- Tirar a raiz quadrada do valor obtido acima.
Assim, obtemos a medida de desvio padrão na escala de nosso interesse, em km, não em km². Com isso, posso observar o quanto em média eu estou me afastando de casa ao longo de uma semana e decidir se preciso me mudar ou não, por exemplo. Neste caso, o valor obtido foi de 457,16. Então, ao longo de uma semana eu viajo 457.16 quilômetros para longe da minha casa em média.
Relacionando o exemplo com Desvio Padrão
O que acabamos de fazer foi calcular um desvio padrão. Neste caso, calculamos em média o quanto nos afastamos do Rio de Janeiro ao longo de uma semana. Se interpretarmos o Rio de Janeiro como nossa média, temos uma estatística que mede o quanto nossos dados se afastam da média. Isso é exatamente o que nos diz um desvio padrão: o quanto meus dados estão distantes da minha média.
Perguntas frequentes sobre Desvio Padrão
Qual a relação entre desvio padrão e variância?
A relação é simplesmente quadrática. A variância é o quadrado do desvio padrão. Ou seja, se quisermos obter o desvio padrão, basta tirar a raiz quadrada da variância. Se quisermos obter a variância, basta elevar o desvio padrão ao quadrado.
Por que divido por (n-1) e não n, o número de observações?
Isso é um fator mais técnico. Falando a um nível mais simples de entendimento, ao dividir por (n-1) estamos dando uma medida mais precisa da dispersão dos dados, principalmente quando temos poucos dados. Porém, se você tem um número grade de observações, por exemplo 500 indivíduos observados, dividir por 500 ou 499 não irá fazer diferença.
Pra que serve desvio padrão?
Como já mencionamos, o desvio padrão serve para medir a dispersão dos seus dados. Tecnicamente, ele mede o quanto seus dados se afastam da média. Portanto, é uma estatística interessante que mostra se seus dados estão bem concentrados ou se estão dispersos.
Posso obter desvio padrão maior que minha média?
Pode e não tem problema nenhum. Por exemplo, suponha que você está medindo algum tipo de erro e esperamos que a média esteja próxima de zero (ou seja, em média, não estamos errando). Se o que você está estudando está descalibrado ou não tem uma precisão adequada, então seu desvio padrão será alto e talvez até maior que a média observada. Isso pode ser um indício para olhar com maior cuidado para o processo em questão e verificar se não precisa ser melhorado.
Posso obter desvio padrão e variância negativos?
Não.
Se você tem mais alguma dúvida sobre desvio padrão, deixe seu comentário logo abaixo. Não se esqueça de curtir nossa página no Facebook e se inscrever em nossa lista de emails.
3 comentários
Gostei
Gostei
Muito obrigada pelo post! Estou fazendo vestibular pra Medicina e me preocupo em aprender bem os conceitos dos assuntos. Mas esse eu realmente não tava conseguindo entender, MAS AGORA ENTENDIII. O que tinha mais dúvidas era com relação à Variância, e vcs já responderam, de forma muito clara! Obrigada mais uma vez por proporcionarem conhecimento acessível pra gente!