Estatística Aplicada - Aula 06
MEDIDAS DE DISPERSÃO E VARIABILIDADE
Fundamentos Conceituais
Importância das Medidas de Dispersão
As medidas de dispersão constituem um componente fundamental da análise estatística, complementando as medidas de posição (como média, mediana e moda). Em um processo produtivo ou análise de dados, conhecer apenas a média não proporciona informação suficiente sobre a distribuição dos valores. A dispersão permite quantificar a variabilidade dos dados em torno da medida central.
Em um processo de produção, saber apenas a média não é suficiente para afirmar que a produção está ocorrendo adequadamente. É necessário analisar cada máquina que faz parte do processo para verificar se há muita ou pouca dispersão.
Principais Medidas Estudadas
- Amplitude Total (ha)
- Variância (s²)
- Desvio Padrão (s)
- Coeficiente de Variação (CV)
Amplitude Total
Definição: Diferença entre o maior e o menor valor observado em um conjunto de dados.
Fórmula: ha = Ls - Li
Onde:
- ha = amplitude total
- Ls = limite superior (maior valor)
- Li = limite inferior (menor valor)
Exemplos:
- Conjunto X: 70, 70, 70, 70, 70 → ha = 70 - 70 = 0
- Conjunto Y: 69, 68, 71, 70, 72 → ha = 72 - 68 = 4
- Conjunto Z: 50, 15, 5, 160, 120 → ha = 160 - 5 = 155
Limitações: A amplitude considera apenas os valores extremos da sequência, ignorando todos os valores intermediários. Por essa razão, os estatísticos desenvolveram outras medidas mais robustas como a variância.
Variância
Definição: Média dos quadrados dos desvios em relação à média aritmética.
Para Dados Não Agrupados
Fórmula: $$s^2 = \frac{1}{n-1}\left[\sum(x_i)^2 - \frac{(\sum x_i)^2}{n}\right]$$
Exemplo Aplicado: Para as temperaturas 20, 18, 24, 23, 21, 21, 20°C:
- Soma = 147
- Soma dos quadrados = 3111
- Aplicando a fórmula: s² = 4°C²
Para Dados Agrupados Não em Classes
Fórmula: $$s^2 = \frac{1}{n-1}\left[\sum(x_i \times f_i) - \frac{(\sum x_i \times f_i)^2}{\sum f_i}\right]$$
Característica: A variância eleva ao quadrado todos os valores originais, resultando em uma unidade de medida diferente da original.
Desvio Padrão
Definição: Raiz quadrada da variância, retornando à unidade de medida original.
Fórmula: $$s = \sqrt{s^2}$$
Exemplo:
- Se s² = 4°C², então s = 2°C
Interpretação: O desvio padrão indica quanto, em média, os valores se afastam da média do conjunto de dados. Quanto menor o desvio padrão, menor a dispersão e mais homogêneos são os dados.
Coeficiente de Variação (CV)
Estatística Aplicada - Aula 07Definição: Medida relativa de dispersão que expressa a variabilidade dos dados em relação à média.
Fórmula: $$CV = \frac{s}{\bar{x}} \times 100%$$
Onde:
- s = desvio padrão
- x̄ = média aritmética
Classificação da Dispersão
- CV < 15%: Baixa dispersão (distribuição homogênea)
- 15% ≤ CV < 30%: Média dispersão
- CV ≥ 30%: Alta dispersão (distribuição heterogênea)
Importância e Aplicação
O coeficiente de variação foi desenvolvido para possibilitar comparações entre distribuições com diferentes unidades de medida ou magnitudes, superando as limitações do desvio padrão, que é uma medida absoluta.
Exemplo Comparativo:
- Professor A: 80 votos de 200 alunos = 40%
- Professor B: 50 votos de 80 alunos = 62,5%
Sem a relativização proporcionada pelo CV, incorreríamos no erro de considerar o Professor A como superior (80 > 50). No entanto, ao considerar as proporções, verifica-se que o Professor B obteve melhor desempenho relativo.
Exemplo Numérico
Para dados com média 161 cm e desvio padrão 5,57 cm: $$CV = \frac{5,57}{161} \times 100% = 3,45%$$
Classificação: Baixa dispersão, indicando conjunto de dados bastante homogêneo.
Interpretação Prática do Desvio Padrão
Na análise estatística, o desvio padrão permite identificar quais valores estão dentro da normalidade e quais podem ser considerados atípicos. Esta interpretação é fundamental para a tomada de decisões em diversos contextos, como controle de qualidade industrial, análises financeiras e pesquisas científicas.
Notas Complementares
¹ As medidas de dispersão são essenciais para compreender a homogeneidade ou heterogeneidade de um conjunto de dados.
² O Coeficiente de Variação é particularmente útil quando se deseja comparar a variabilidade de conjuntos de dados com diferentes unidades de medida ou magnitudes significativamente diferentes.
³ Em análises estatísticas mais complexas, outras medidas de dispersão podem ser utilizadas, como o desvio médio absoluto e a amplitude interquartil.
Referências Bibliográficas
- Material 6 das aulas do Prof. Mestre Fideli (2025)
- Notas de aula compartilhadas sobre Medidas de Dispersão