8 dicas de como ser um péssimo estatístico
O mercado está implorando por estatísticos que usem sua metodologia para extrair informações de seus conjuntos de dados e melhorar a tomada de decisões das empresas. Nossa profissão está em alta e cabe a você decidir se vai virar uma máquina de apertar F3 no SAS ou se será um profissional diferenciado que realmente compreende o pensamento estatístico.
Siga essas 8 “dicas” e seja um péssimo estatístico, aquele reclamão que usa termos em inglês para parecer mais inteligente, mas que no fundo não sabe porque está rodando aquele modelo de regressão.
Reclame que seu curso foi muito teórico
Saia falando para todo mundo que seu curso é teórico e que você não aprendeu nada na prática. Inclusive, reforce isso na sua entrevista de emprego. Além de mostrar que você é um reclamão, isso expõe que você em momento algum buscou alternativas para isso. São muitas: empresa júnior, projetos particulares, grupos de estudos e a internet. É surpreendente a quantidade de material para aplicar estatística disponível online que pode lhe ajudar a entender seu curso na prática. (Realmente, é muito teórico, mas você não precisa nem levantar o bumbum da cadeira pra mudar isso).
Não explore os dados antes de modelar
Pra que ver média e desvio padrão, não é mesmo? Pra que buscar outliers? Pra que fazer gráficos de exploração cruzando variáveis? Porque isso é parte do trabalho de exploração que familiariza você com os dados. Quanto mais familiarizado, melhor seu conhecimento para selecionar as variáveis e não ficar refém dos testes enlatados soltos pelos grandes softwares pagos de estatística.
Ignore o conhecimento prévio de algum especialista
Por que ouvir aquele biólogo que lhe pediu para analisar seus dados? Ele não sabe nada de estatística e por isso veio até você. Porque ele tem o conhecimento sobre o assunto que você não tem. A intuição de um especialista pode valer mais do que horas de exploração. É o mesmo benefício da análise exploratório mencionada acima.
Despreze Machine Learning e diga que é coisa de engenheiro
“Machine Learning é coisa de engenheiro, eles nem sabem o que estão fazendo!” Quem nunca ouviu isso em sala de aula, não é? Pois a verdade é que muitos podem até não saber como o método funciona, mas tem funcionado para eles e estão tomando espaço tanto no mercado quanto na pesquisa. As técnicas de Machine Learning estão aí para serem exploradas e estudadas pelos estatísticos. Só falta descer do trono do ego e reconhecer que estão fazendo um bom trabalho e temos muito a contribuir também.
Não pense antes de aplicar. Faça o que todo mundo faz
Pra que pensar se seu colega da cadeira ao lado trabalhou com o mesmo problema um ano atrás e já tem todo a estratégia de análise prontinha? Porque dados nos surpreendem. Dados podem ser mal coletados. Dados podem esconder informação que não são percebidas em uma simples saída de software. A probabilidade de você ser surpreendido diminui ao pensar melhor no problema e entender porque está utilizando determinada metodologia irá lhe ajudar a ser um melhor estatístico no futuro e não apenas uma máquina de ajustar dados (para isso temos softwares muito melhores).
Use p-valor como verdade absoluta
Se um resultado der significativo, então meus problemas estão resolvidos, certo? Não. Como mencionado anteriormente, o conhecimento prévio do problema e uma exploração pode lhe blindar contra significâncias suspeitas. Se você só observa o p-valor e não faz o exercício de verificar se a decisão sobre a hipótese faz sentido, você pode estar cometendo erro tipo I ou sendo refém de grande volume de dados. Afinal, para milhares de observações uma diferença de 0,00001 pode ser muito significativa. Mas será que essa diferença é relevante? Para entender melhor sobre essa crítica ao uso do p-valor, leia este post.
Desconheça sobre a metodologia de processos estocásticos
Este inclusive é um erro que eu cometo: conheço pouco sobre processos estocásticos. A falta de conhecimento nos leva a abordar a maioria dos problemas considerando independência entre observações e nem sempre isso é verdade. Modelos que respeitam a estrutura de dependência do problema tem resultados fantásticos e faz de você um estatístico diferenciado.
Não se atualize
Tudo o que você aprendeu na graduação basta, certo? Lógico que não. E não espere que seus professores tragam novas metodologias para a sala de aula. Isso é raro. As ementas das disciplinas obrigatórias nos cursos de estatística abordam um conteúdo de meados do século XX e muito das vezes ignoram as metodologias de Machine Learning. Porém, você pode resolver com uma simples busca na internet sobre o que está acontecendo de mais moderno com a estatística.