Skip to main content dev:Coelho

Estatística Aplicada - Aula 06

MEDIDAS DE DISPERSÃO E VARIABILIDADE

Fundamentos Conceituais

Importância das Medidas de Dispersão

As medidas de dispersão constituem um componente fundamental da análise estatística, complementando as medidas de posição (como média, mediana e moda). Em um processo produtivo ou análise de dados, conhecer apenas a média não proporciona informação suficiente sobre a distribuição dos valores. A dispersão permite quantificar a variabilidade dos dados em torno da medida central.

Em um processo de produção, saber apenas a média não é suficiente para afirmar que a produção está ocorrendo adequadamente. É necessário analisar cada máquina que faz parte do processo para verificar se há muita ou pouca dispersão.

Principais Medidas Estudadas

  1. Amplitude Total (ha)
  2. Variância (s²)
  3. Desvio Padrão (s)
  4. Coeficiente de Variação (CV)

Amplitude Total

Definição: Diferença entre o maior e o menor valor observado em um conjunto de dados.

Fórmula: ha = Ls - Li

Onde:

  • ha = amplitude total
  • Ls = limite superior (maior valor)
  • Li = limite inferior (menor valor)

Exemplos:

  • Conjunto X: 70, 70, 70, 70, 70 → ha = 70 - 70 = 0
  • Conjunto Y: 69, 68, 71, 70, 72 → ha = 72 - 68 = 4
  • Conjunto Z: 50, 15, 5, 160, 120 → ha = 160 - 5 = 155

Limitações: A amplitude considera apenas os valores extremos da sequência, ignorando todos os valores intermediários. Por essa razão, os estatísticos desenvolveram outras medidas mais robustas como a variância.

Variância

Definição: Média dos quadrados dos desvios em relação à média aritmética.

Para Dados Não Agrupados

Fórmula: $$s^2 = \frac{1}{n-1}\left[\sum(x_i)^2 - \frac{(\sum x_i)^2}{n}\right]$$

Exemplo Aplicado: Para as temperaturas 20, 18, 24, 23, 21, 21, 20°C:

  • Soma = 147
  • Soma dos quadrados = 3111
  • Aplicando a fórmula: s² = 4°C²

Para Dados Agrupados Não em Classes

Fórmula: $$s^2 = \frac{1}{n-1}\left[\sum(x_i \times f_i) - \frac{(\sum x_i \times f_i)^2}{\sum f_i}\right]$$

Característica: A variância eleva ao quadrado todos os valores originais, resultando em uma unidade de medida diferente da original.

Desvio Padrão

Definição: Raiz quadrada da variância, retornando à unidade de medida original.

Fórmula: $$s = \sqrt{s^2}$$

Exemplo:

  • Se s² = 4°C², então s = 2°C

Interpretação: O desvio padrão indica quanto, em média, os valores se afastam da média do conjunto de dados. Quanto menor o desvio padrão, menor a dispersão e mais homogêneos são os dados.

Coeficiente de Variação (CV)

Estatística Aplicada - Aula 07

Definição: Medida relativa de dispersão que expressa a variabilidade dos dados em relação à média.

Fórmula: $$CV = \frac{s}{\bar{x}} \times 100%$$

Onde:

  • s = desvio padrão
  • x̄ = média aritmética

Classificação da Dispersão

  • CV < 15%: Baixa dispersão (distribuição homogênea)
  • 15% ≤ CV < 30%: Média dispersão
  • CV ≥ 30%: Alta dispersão (distribuição heterogênea)

Importância e Aplicação

O coeficiente de variação foi desenvolvido para possibilitar comparações entre distribuições com diferentes unidades de medida ou magnitudes, superando as limitações do desvio padrão, que é uma medida absoluta.

Exemplo Comparativo:

  • Professor A: 80 votos de 200 alunos = 40%
  • Professor B: 50 votos de 80 alunos = 62,5%

Sem a relativização proporcionada pelo CV, incorreríamos no erro de considerar o Professor A como superior (80 > 50). No entanto, ao considerar as proporções, verifica-se que o Professor B obteve melhor desempenho relativo.

Exemplo Numérico

Para dados com média 161 cm e desvio padrão 5,57 cm: $$CV = \frac{5,57}{161} \times 100% = 3,45%$$

Classificação: Baixa dispersão, indicando conjunto de dados bastante homogêneo.

Interpretação Prática do Desvio Padrão

Na análise estatística, o desvio padrão permite identificar quais valores estão dentro da normalidade e quais podem ser considerados atípicos. Esta interpretação é fundamental para a tomada de decisões em diversos contextos, como controle de qualidade industrial, análises financeiras e pesquisas científicas.

Notas Complementares

¹ As medidas de dispersão são essenciais para compreender a homogeneidade ou heterogeneidade de um conjunto de dados.

² O Coeficiente de Variação é particularmente útil quando se deseja comparar a variabilidade de conjuntos de dados com diferentes unidades de medida ou magnitudes significativamente diferentes.

³ Em análises estatísticas mais complexas, outras medidas de dispersão podem ser utilizadas, como o desvio médio absoluto e a amplitude interquartil.


Referências Bibliográficas

  • Material 6 das aulas do Prof. Mestre Fideli (2025)
  • Notas de aula compartilhadas sobre Medidas de Dispersão