Estatística Aplicada - Aula 03
Distribuição de Frequência
“Uma Distribuição de Frequência é um um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores).”
O principal objetivo é tornar os dados brutos mais compreensíveis e identificar padrões.
As distribuições de frequência são uma ferramenta essencial para a organização, resumo e análise de dados em estatística. Ao condensar grandes quantidades de dados em formatos mais manejáveis, as distribuições de frequência permitem a identificação de padrões, tendências e insights valiosos. O conhecimento dos componentes, tipos e métodos de construção de distribuições de frequência é fundamental para qualquer pessoa que trabalhe com análise de dados.
Dados Brutos
São os dados soltos, avulsos e isolados, sem contexto senão pelo motivo ao qual eles existem. Num exemplo apresentado de dados brutos foi uma tabela com 28 notas de um concurso.
Rol
São os dados organizados (ordem crescente ou decrescente). Para uma melhor realização à mão deste rol, sobretudo em listas de dados grandes, é utilizar o padrão de “Ramos e Folhas”, onde o primeiro (ramo) é a casa das dezenas e o segundo (folha) a casa das unidades.
Dados Brutos | |
---|---|
66 | 73 |
14 | 59 |
65 | 66 |
67 | 52 |
59 | 14 |
No exemplo acima, a tabela mostra dados de 0-100. Mas são dados desorganizados, para isso é necessário organizar em um Rol.
Rol | |
---|---|
14 | 65 |
14 | 66 |
52 | 66 |
59 | 67 |
59 | 73 |
A ordem, acima apresentada, foi feita pela coluna, mas pode ser organizado pela linha também.
Em caso de números com casa nas centenas, você deverá escolher se os ramos farão parte somente da casa das centenas, deixando as dezenas e unidades como folhas, ou a casa das centenas com dezenas para ramos e unidades para folha.
Ex: 123
12, 3
ou
1, 23
Amplitude Amostral
A amplitude amostral é mencionada como um termo estatístico. A amplitude da distribuição é calculada como a diferença entre o limite superior (Ls) e o limite inferior (Li), representada pela fórmula ha = Ls - Li.
- A amplitude total dos dados é a diferença entre o maior e o menor valor em um conjunto de dados organizados (rol).
- A amplitude de classe é a diferença entre os limites reais superior e inferior de uma classe. Por exemplo, se os limites de classe são 150 e 154, a amplitude da classe é 4 (154 – 150 = 4).
- Em um exemplo com dados de alturas, a amplitude total (ha) é calculada como 174 – 150 = 24.
Amplitude da Distribuição
A amplitude da distribuição é a diferença entre o limite superior (Ls) e o limite inferior (Li), calculada através da fórmula ha = Ls - Li.
- A amplitude total dos dados é a diferença entre o maior e o menor valor em um conjunto de dados organizados.
- A amplitude de classe é a diferença entre os limites reais superior e inferior de uma classe. Por exemplo, se os limites de classe são 150 e 154, a amplitude da classe é 4 (154 – 150 = 4).
- Em um exemplo com dados de alturas, a amplitude total (ha) é calculada como 174 – 150 = 24.
Amplitude de Classe
A amplitude de classe é a diferença entre os limites reais superior e inferior de uma classe. Por exemplo, se os limites de classe são 150 e 154, a amplitude da classe é 4 (154 – 150 = 4).
Observação: Na prova e no trabalho, o professor coloca qual a amplitude que ele quer que utilize
Itens necessários em uma tabela de Distribuição
Uma tabela de distribuição de frequência precisa ter os seguintes elementos:
- Classes: As classes, ou alturas, representam os intervalos nos quais os dados são agrupados. A amplitude de classe é a diferença entre os limites superior e inferior da classe.
- Ponto médio (Pm): É o ponto central de uma classe, calculado somando o limite inferior ao limite superior da classe e dividindo por 2.
- Frequência absoluta (fi): Indica o número de vezes que um valor ocorre dentro de uma determinada classe ou categoria.
- Frequência acumulada absoluta (Fiac): É a soma das frequências absolutas de uma classe e de todas as classes anteriores.
- Frequência relativa (fr): Mostra a proporção de vezes que uma pontuação ocorre em relação ao total de frequências. É calculada dividindo a frequência de uma pontuação pelo número total de frequências.
- Frequência relativa percentual (fr%): É a frequência relativa expressa em porcentagem.
- Frequência relativa acumulada percentual (Fr%ac): É a soma das frequências relativas percentuais de uma classe e de todas as classes anteriores.
Ordem | Alturas | Pm | Fi | Fiac | Fr | Fr% | Fr%ac |
---|---|---|---|---|---|---|---|
1ª | 150 |-154 | 152 | 4 | 4 | 0.100 | 10.0 | 10 |
Tipos de Distribuição de Frequência
De acordo com algumas fontes, existem três tipos de distribuição de frequência:
Categórica
- Para dados qualitativos ou nominais (ex: tipo sanguíneo)
Agrupada
- Para dados quantitativos agrupados em intervalos (ex: faixa de idade)
Não Agrupada
- Para dados quantitativos onde cada valor é listado individualmente.
Exercícios
Gabriel Coelho Soares
- a. São os dados soltos, avulsos e isolados, sem contexto senão pelo motivo ao qual eles existem.
b. Rol são os Dados Brutos organizados de modo crescente ou decrescente, a partir de uma.
c. Tamanho de amostra é a quantidade total dos dados brutos, enquanto a amplitude é a diferença entre o maior e o menor valor dos dados.
d. Amplitude total é a diferença entre o maior e menor valor da amostra
Amplitude de distribuição é Diferença entre o maior e menor valor dentro de
uma tabela de frequência
Amplitude de Classe é a diferença entre os limites inferior e superior de
cada classe.
e. Absoluta é a quantidade exata que os dados daquela ordem/classe ocorrem. A Relativa é a quantidade em relação ao total de dados.
f. Sim.
g. Utilizando classes além do necessário pode gerar uma disproporção nas ordens, podendo até ter ordens vazias ou com poucas observações, fragmentando a distribuição e dificultando a identificação de padrões gerais.
h. Similar a colocal muitas, ao reduzirmos o número de classes, podemos ter ordens robustas excessivamente, com muitos dados, tornando numa análise mais “grosseira” e perdendo detalhes relevantes para a análise.
i. Não está correta. Na ogiva, o eixo y representa as frequências acumuladas e não as frequências absolutas.
j. Não está correta. Nos histogramas, os retângulos representam as frequências (absolutas ou relativas) de cada classe.
- Referência
- Ramos e folhas
Ramos | Folhas | Total por ramo | |
---|---|---|---|
3 | 3,5,5,9 | 4 | |
4 | 1,1,2,5,7,8 | 6 | |
5 | 0,2,3,4,5,5,6,7,9 | 9 | |
6 | 0,1,3,4,4,5,5,5,6,6,7,7,8,8,8,9 | 16 | |
7 | 1,1,3,3,3,3,3,4,4,5,6,6,7,8,8,8,8 | 17 | |
8 | 0,0,1,2,2,3,4,4,5,5,6,6,6,6,8,8,9 | 17 | |
9 | 0,1,2,4,4,4,4,5,5,6,8 | 11 | |
4+6+9+16+17+17+11 = 80 |
- Rol
- Tabela de Distribuição
A raiz quadrada de 80 é 8,944 - assumirei 9 ordens/classes.
Ordem | Classes | Pm | Fi | Fiac | Fr | Fr% | Fr%ac |
---|---|---|---|---|---|---|---|
1ª | 3,0|–3,8 | 3,4 | 3 | 3 | 0.038 | 3.750 | 3.750 |
2ª | 3,8|– 4,6 | 4,2 | 5 | 8 | 0.063 | 6.250 | 10.00 |
3ª | 4,6|– 5,4 | 5,0 | 5 | 13 | 0.063 | 6.250 | 16.25 |
4ª | 5,4|– 6,2 | 5,8 | 8 | 21 | 0.100 | 10.00 | 26.25 |
5ª | 6,2|– 7,0 | 6,6 | 14 | 35 | 0.175 | 17.50 | 43.75 |
6ª | 7,0|– 7,8 | 7,4 | 13 | 48 | 0.163 | 16.25 | 60.00 |
7ª | 7,0|– 8,6 | 8,2 | 14 | 62 | 0.175 | 17.50 | 77.50 |
8ª | 8,6|– 9,4 | 9,0 | 10 | 72 | 0.125 | 12.50 | 90.00 |
9ª | 9,4|– 10,0 | 9,7 | 8 | 80 | 0.100 | 10.00 | 100.0 |
Total | 80 | 1.000 | 100.0 |
deixar em branco
deixar em branco
a) 5 alunos b) 35 alunos c) 45 alunos
d) 43.75% e) 56.25% f) 33.75%
g) 27 alunos h) 67 alunos seriam aprovados i) 13 seriam reprovados
j) 90%