Skip to main content dev:Coelho

Estatística Aplicada - Aula 03

Distribuição de Frequência

“Uma Distribuição de Frequência é um um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores).”

O principal objetivo é tornar os dados brutos mais compreensíveis e identificar padrões.

As distribuições de frequência são uma ferramenta essencial para a organização, resumo e análise de dados em estatística. Ao condensar grandes quantidades de dados em formatos mais manejáveis, as distribuições de frequência permitem a identificação de padrões, tendências e insights valiosos. O conhecimento dos componentes, tipos e métodos de construção de distribuições de frequência é fundamental para qualquer pessoa que trabalhe com análise de dados.

Dados Brutos

São os dados soltos, avulsos e isolados, sem contexto senão pelo motivo ao qual eles existem. Num exemplo apresentado de dados brutos foi uma tabela com 28 notas de um concurso.

Rol

São os dados organizados (ordem crescente ou decrescente). Para uma melhor realização à mão deste rol, sobretudo em listas de dados grandes, é utilizar o padrão de “Ramos e Folhas”, onde o primeiro (ramo) é a casa das dezenas e o segundo (folha) a casa das unidades.

Dados Brutos
6673
1459
6566
6752
5914

No exemplo acima, a tabela mostra dados de 0-100. Mas são dados desorganizados, para isso é necessário organizar em um Rol.

Rol
1465
1466
5266
5967
5973

A ordem, acima apresentada, foi feita pela coluna, mas pode ser organizado pela linha também.

Em caso de números com casa nas centenas, você deverá escolher se os ramos farão parte somente da casa das centenas, deixando as dezenas e unidades como folhas, ou a casa das centenas com dezenas para ramos e unidades para folha.

Ex: 123

12, 3
ou
1, 23

Amplitude Amostral

A amplitude amostral é mencionada como um termo estatístico. A amplitude da distribuição é calculada como a diferença entre o limite superior (Ls) e o limite inferior (Li), representada pela fórmula ha = Ls - Li.

  • A amplitude total dos dados é a diferença entre o maior e o menor valor em um conjunto de dados organizados (rol).
  • A amplitude de classe é a diferença entre os limites reais superior e inferior de uma classe. Por exemplo, se os limites de classe são 150 e 154, a amplitude da classe é 4 (154 – 150 = 4).
  • Em um exemplo com dados de alturas, a amplitude total (ha) é calculada como 174 – 150 = 24.

Amplitude da Distribuição

A amplitude da distribuição é a diferença entre o limite superior (Ls) e o limite inferior (Li), calculada através da fórmula ha = Ls - Li.

  • A amplitude total dos dados é a diferença entre o maior e o menor valor em um conjunto de dados organizados.
  • A amplitude de classe é a diferença entre os limites reais superior e inferior de uma classe. Por exemplo, se os limites de classe são 150 e 154, a amplitude da classe é 4 (154 – 150 = 4).
  • Em um exemplo com dados de alturas, a amplitude total (ha) é calculada como 174 – 150 = 24.

Amplitude de Classe

A amplitude de classe é a diferença entre os limites reais superior e inferior de uma classe. Por exemplo, se os limites de classe são 150 e 154, a amplitude da classe é 4 (154 – 150 = 4).

Observação: Na prova e no trabalho, o professor coloca qual a amplitude que ele quer que utilize

Itens necessários em uma tabela de Distribuição

Uma tabela de distribuição de frequência precisa ter os seguintes elementos:

  • Classes: As classes, ou alturas, representam os intervalos nos quais os dados são agrupados. A amplitude de classe é a diferença entre os limites superior e inferior da classe.
  • Ponto médio (Pm): É o ponto central de uma classe, calculado somando o limite inferior ao limite superior da classe e dividindo por 2.
  • Frequência absoluta (fi): Indica o número de vezes que um valor ocorre dentro de uma determinada classe ou categoria.
  • Frequência acumulada absoluta (Fiac): É a soma das frequências absolutas de uma classe e de todas as classes anteriores.
  • Frequência relativa (fr): Mostra a proporção de vezes que uma pontuação ocorre em relação ao total de frequências. É calculada dividindo a frequência de uma pontuação pelo número total de frequências.
  • Frequência relativa percentual (fr%): É a frequência relativa expressa em porcentagem.
  • Frequência relativa acumulada percentual (Fr%ac): É a soma das frequências relativas percentuais de uma classe e de todas as classes anteriores.
OrdemAlturasPmFiFiacFrFr%Fr%ac
150 |-154152440.10010.010

Tipos de Distribuição de Frequência

De acordo com algumas fontes, existem três tipos de distribuição de frequência:

Categórica

  • Para dados qualitativos ou nominais (ex: tipo sanguíneo)

Agrupada

  • Para dados quantitativos agrupados em intervalos (ex: faixa de idade)

Não Agrupada

  • Para dados quantitativos onde cada valor é listado individualmente.

Exercícios

Gabriel Coelho Soares

  1. a. São os dados soltos, avulsos e isolados, sem contexto senão pelo motivo ao qual eles existem.

b. Rol são os Dados Brutos organizados de modo crescente ou decrescente, a partir de uma.

c. Tamanho de amostra é a quantidade total dos dados brutos, enquanto a amplitude é a diferença entre o maior e o menor valor dos dados.

d. Amplitude total é a diferença entre o maior e menor valor da amostra
Amplitude de distribuição é Diferença entre o maior e menor valor dentro de uma tabela de frequência
Amplitude de Classe é a diferença entre os limites inferior e superior de cada classe.

e. Absoluta é a quantidade exata que os dados daquela ordem/classe ocorrem. A Relativa é a quantidade em relação ao total de dados.

f. Sim.

g. Utilizando classes além do necessário pode gerar uma disproporção nas ordens, podendo até ter ordens vazias ou com poucas observações, fragmentando a distribuição e dificultando a identificação de padrões gerais.

h. Similar a colocal muitas, ao reduzirmos o número de classes, podemos ter ordens robustas excessivamente, com muitos dados, tornando numa análise mais “grosseira” e perdendo detalhes relevantes para a análise.

i. Não está correta. Na ogiva, o eixo y representa as frequências acumuladas e não as frequências absolutas.

j. Não está correta. Nos histogramas, os retângulos representam as frequências (absolutas ou relativas) de cada classe.

  1. Referência

Imagem de Referência de 80 notas em universidade

  • Ramos e folhas
RamosFolhasTotal por ramo
33,5,5,94
41,1,2,5,7,86
50,2,3,4,5,5,6,7,99
60,1,3,4,4,5,5,5,6,6,7,7,8,8,8,916
71,1,3,3,3,3,3,4,4,5,6,6,7,8,8,8,817
80,0,1,2,2,3,4,4,5,5,6,6,6,6,8,8,917
90,1,2,4,4,4,4,5,5,6,811
4+6+9+16+17+17+11 = 80
  1. Rol

Imagem do Rol realizado

  1. Tabela de Distribuição

A raiz quadrada de 80 é 8,944 - assumirei 9 ordens/classes.

OrdemClassesPmFiFiacFrFr%Fr%ac
3,0|–3,83,4330.0383.7503.750
3,8|– 4,64,2580.0636.25010.00
4,6|– 5,45,05130.0636.25016.25
5,4|– 6,25,88210.10010.0026.25
6,2|– 7,06,614350.17517.5043.75
7,0|– 7,87,413480.16316.2560.00
7,0|– 8,68,214620.17517.5077.50
8,6|– 9,49,010720.12512.5090.00
9,4|– 10,09,78800.10010.00100.0
Total801.000100.0
  1. deixar em branco

  2. deixar em branco

  3. a) 5 alunos b) 35 alunos c) 45 alunos
    d) 43.75% e) 56.25% f) 33.75%
    g) 27 alunos h) 67 alunos seriam aprovados i) 13 seriam reprovados
    j) 90%