Tamanho amostral: 4 coisas que você deveria saber
Tamanho amostral é sempre uma preocupação para quem trabalha com dados em sua pesquisa. Inclusive, o pesquisador despreocupado ou desinformado só passa a dar importância ao assunto após questionarem sobre qual o critério utilizado para definir o tamanho da sua amostra. E não tem problema nenhum dizer que foi o máximo que você pode coletar, contanto que você esteja ciente das consequências que este tamanho tem na precisão e confiabilidade dos seus resultados.
Em resumo, o tamanho amostral interfere na confiabilidade da pesquisa em termos de poder dos testes de hipóteses. Tamanhos amostrais maiores fazem com que os testes de hipótese sejam mais poderosos no sentido de que são mais sensíveis para identificar diferenças significativas, por exemplo. Em um entendimento macroscópico do assunto, tamanho amostral e confiabilidade andam juntos e são diretamente relacionados, em que quanto mais observações você tem em mãos, maior será a confibilidade.
Porém, não se preocupe se há alguma limitação que o(a) impede de coletar um milhão de dados. O pouco de informação que você tem pode lhe ajudar a pelo menos levantar as primeiras evidências da sua pesquisa.
1) Se preocupe com o tamanho amostral ANTES de começar a pesquisa
SIM! Você não deveria se preocupar com o tamanho da amostra só depois que seu professor perguntar ou depois que seu artigo voltar da revisão. Tamanho amostral é uma das coisas mais subestimadas na ciência. O número de observações com que você irá trabalhar diz muito sobre a precisão e a confiabilidade de seus resultados. Por mais que seu p-valor tenha dado muito significativo, você pode estar cometendo o famoso erro tipo 2, não rejeitando a hipótese, sendo que ela é na verdade falsa.
Antes de começar sua pesquisa, invista alguns minutos nem que seja para sentar com sua equipe para decidir se aquele número de observações que vocês tem em mãos é razoável. Uma prática muito simples, mas que já lhe dá uma ideia se o tamanho amostral que você tem em mãos é adequado é observar trabalhos similares que já fizeram um estudo amostral. Inclusive, observe como foi feito o estudo amostral e não se contente com um parágrafo mal escrito sobre isso. Se preciso, entre em contato com os autores.
Se você tem tempo disponível pode pesquisar material na internet sobre como calcular o tamanho amostral ideal para sua pesquisa ou consultar um estatístico. Muitos estatísticos não cobram pela consultoria se você quiser apenas tirar dúvidas. Aproveite aquele seu contato e peça indicações.
2) O tamanho amostral afeta o poder do teste
Sem entrar em termos matemáticos, vamos discutir apenas a ideia deste tópico. Suponha que você tenha uma tabela em seu estudo e você quer testar se as duas variáveis dispostas possuem relação ou não fazendo um teste Chi Quadrado de Pearson. O número de observações usado para construir a tabela, ou seja, seu tamanho amostral, é diretamente ligado ao poder do teste de Pearson.
Poder de um teste é a probabilidade de você rejeitar a hipótese, dado que ela é realmente falsa. No caso do teste de Pearson acima, a probabilidade de você dizer que há relação entre as duas variáveis quando realmente existe. Por mais significativo que seja seu p-valor, de nada adianta sua significância se a sua probabilidade de rejeitar uma hipótese falsa for baixa. Isso afeta diretamente a confiabilidade do seu estudo e toda aquela sua discussão linda pode ser uma grande mentira que pode ser facilmente desmascarada em um estudo semelhante.
3) Dá pra trabalhar com amostras pequenas
Antes de qualquer coisa, pequeno tem o limite do bom senso. Uma pesquisa com duas pessoas obviamente é irrelevante do ponto de vista estatístico porque precisamos de informação para estudar a variabilidade do que está sendo estudado.
Existem duas situações em que temos tamanho amostral pequeno:
- Pouca variabilidade em que não é necessário uma amostra grande.
- Falta de recursos ou limitação de custos (financeiros, tempo, etc).
O primeiro caso seria o sonho de todo pesquisador, mas para isso ele precisaria ter uma informação muito concreta de que o que ele está estudando é bem homogêneo e que poucas observações são o suficiente para atingir seus objetivos. Um exemplo, quando temos um estudo piloto (discutido melhor posteriormente) em que temos informação que dão indícios sobre como a população varia ao longo das amostras. Se a variabilidade das respostas for baixa, quando for calcular o seu tamanho amostral verá que o “n” necessário é pequeno.
Não desanime se você só pode coletar algumas poucas observações. Seus estudos ainda podem ser relevantes como um estudo piloto para levantar evidências a favor do resultado que deseja provar ou até mesmo um estudo piloto. No entanto, tenha em mente que o poder dos testes usados para analisar seus dados será menor e isso deve ser levado em consideração na sua discussão. Se seu tamanho amostral é pequeno, cuidado com conclusões muito assertivas.
Apesar da maioria dos testes serem desenvolvidos a nível assintótico, ou seja, quando o tamanho amostral é imenso, alguns testes de hipótese são exatos e não precisam de um tamanho amostral muito grande. O exemplo mais clássico é o teste exato de Fisher.
4) Use uma amostra piloto para economizar
Acho que até este tópico conseguimos convencê-lo da importância de um estudo amostral bem feito para aumentar a confiabilidade do seu estudo. Portanto, busque todas as informações possíveis do que você está estudando para que com esse conhecimento seja possível justificar o tamanho amostral que está utilizando.
Por exemplo, em uma revisão bibliográfica foi observado que estudos similares ao seu, que trabalham com a mesma população e características semelhantes, tem resultados relevantes e todos trabalham com um tamanho amostral em torno de 50 indivíduos. Além de apenas citar os estudos em questão é possível consultar porque utilizaram esse número de observações e entrar em contato com os autores para maiores informações. Inclusive, se for consultar um estatístico essa informação referente a outros estudos é de muita valia na hora de trabalharem juntos para construírem seu estudo amostral.
5 comentários
Ola, sou um entusiasta das estatísticas e das probabilidades. Fiz algumas contas, simples, de analise combinatória sobre combinações de jogos de loteria, porem não se se estão corretas, não sei se estou analisando corretamente.
Vou descrever, se puder me ajudar, ficarei muito agradecido, do contrario, sei que é alguém muito ocupado e este não é o foco do seu blog: Tirar duvidas de leigos a respeito de assuntos diversos.
No jogo de loteria com 60 dezena para 6 serem sorteadas, então: C(60,6)=50063860 de possibilidades de combinar.
Para acertar 4 dezenas com uma aposta de 6 números, exitem: C(54,2)*C(6,2)=21465 combinações. || Essa parte peguei no site da Caixa
Existem 487635 formas de combinar 60 elementos 4 a 4. C(60,4)=487635 || essa combinação esta certa?
Minha duvida é: Com um jogo de 6 dezenas, eu tenho 21465 combinações para acertar quatro números, e existem 487635 combinações de 60 elementos, tomados 4 a 4. Eu posso afirmar que a chance de acertar 4 números com uma aposta de 6 números é de 21465/487635= 1/22,7176?
Não sei se estou analisando isso certo, pois estou observando uma probabilidade, meio, alta para acertar a quadra. O site da Caixa informa uma probabilidade de acertar quatro números como sendo 1/2332= 21465/50063860. Porem eu não sei se essas 50 milhões se referem à quadra.
Oi, Marcos.
A resposta é muito mais simples do que imagina. Não tem como você apostar apenas 4 números na mega sena, então você sempre deve considerar palpites com 6 apostas ou mais. Se você tivesse que escolher só 4 números para apostar aí seria uma história completamente diferente.
Hum, entendo, obrigado! 😀
Olá Gabriel,
Muito esclarecedora a postagem sobre amostragem. Mas, gostaria de uma orientação mais específica para definir o tamanho da amostra. Sei que o bom senso e o conhecimento do comportamento das variáveis analisadas são fundamentais.
Com isso, como posso definir quantas amostras coletar em um experimento, que técnica devo usar? Que prerrogativas devo considerar? Por exemplo:
– Pretendo avaliar o desenvolvimento de acidez ao longo de um processo de fabricação, pois existe um valor aceitável para esta variável. O processo é contínuo, não há fabricação de pequenas unidades, o lote de fabricação considera um ciclo de produção que pode ser de algumas horas ou até um dia.
Obrigado.
Oi, Leonardo.
Amostragem é um grande “depende”. Como no seu caso é um processo contínuo e interrompê-lo pode não ser uma opção, a amostragem é muito importante. Porém, depende de como você quer fazer essa avaliação. Se o interesse for definir um nível de acidez com certa precisão, talvez seja interessante considerar um processo de amostragem considerando que a acidez média da produção segue uma distribuição normal. Tem fórmulas prontas para isso.
No entanto, lembre-se que é preciso avaliar diretinho qual o problema que tem em mãos e se as suposições do método que está utilizando são satisfeitas.
Um abraço.
Gabriel.