Fale conosco

Box plot: o que é e para que serve?

8/09/2022
7 min. de leitura

Box plot é uma ferramenta gráfica utilizada para representar e ilustrar um conjunto de dados distribuídos em cinco diferentes medidas, que possibilitam diversos tipos de observações em uma única análise.

Você já ouviu falar de Box plot? Sabe o que é e para que serve? Neste artigo, vamos esclarecer os principais pontos dessa ferramenta que a OPENCADD também oferece para você.

Acompanhe!

O que é o Box Plot?

O Box Plot, também chamado diagrama de caixa, é uma ferramenta gráfica utilizada para ilustrar um conjunto de dados. Por meio dele, é possível visualizar a distribuição de dados com base em cinco estatísticas: 

  • o mínimo;

  • o primeiro quartil (Q1);

  • a mediana;

  • o terceiro quartil (Q3);

  • o máximo.

Esses valores também são conhecidos como resumo dos cinco números.

Ele também pode informar os valores discrepantes (outliers) dos dados, oferecendo uma medida complementar para o desenvolvimento de perspectivas sobre as informações passadas através dos dados. 

Além disso, o Box Plot pode informar a posição dos dados, sua simetria, dispersão, cumprimento da cauda de distribuição e se estão ou não distorcidos.

No gráfico do Box Plot, a haste vertical é interpretada de baixo para cima, sendo que a parte inferior indica o mínimo e a superior indica o máximo, sempre desconsiderando possíveis outliers.

O retângulo central da haste possui três linhas que estão na horizontal: a linha de baixo, representada pelo contorno externo inferior do retângulo, indica o primeiro quartil. A linha de cima, que é o contorno externo superior do retângulo, indica o terceiro quartil. Já a linha interna indica a mediana ou o chamado segundo quartil.

Valores discrepantes, outliers e extremos são representados por asteriscos ou pontos, e indicam pontos atípicos no gráfico.

 

Box Plot: para que são usados?

Os diagramas criados pelo Box plot possibilitam diversos tipos de observações e análises. Isso porque eles oferecem diferentes nuances, já que os outliers permitem enxergar os dados de outra perspectiva, influenciando assim na tomada de decisão.

Para isso, é fundamental que cada um dos dados apresentados no resumo de 5 números seja considerado e analisado de forma correta, a fim de evitar interpretações erradas.

O diagrama de caixa também é muito usado para apresentação estatística e cálculos fundamentados em dados, tornando-se assim uma ferramenta gráfica para representar a variação de dados existentes em uma variável numérica, representada por meio dos quartis.

Veja também: Análise Preditiva: O Que É e Qual Sua Importância?

Normalmente, os gráficos tipo Box plot são úteis em três cenários:

Cenário 1: visualizar a distribuição de valores em conjuntos de dados

Um gráfico tipo Box plot permite visualizar rapidamente a distribuição de valores em um conjunto de dados e ver onde estão localizadas as cinco estatísticas de resumo numéricos.

Cenário 2: comparar duas ou mais distribuições

Com o Box plot é possível fazer comparações e visualizar as diferenças entre duas ou mais distribuições de dados, analisando os valores medianos e a dispersão entre cada um dos resultados apresentados nesses dados.

Cenário 3: Para identificar outliers

Nos gráficos Box Plot, os valores atípicos são normalmente representados por pequenos círculos que se estendem acima ou abaixo do retângulo que representa os quartis e a mediana. 

Uma observação é definida como um outlier se atender a um dos seguintes critérios:

  • Uma observação é menor do que Q1 – 1,5* (intervalo interquartil)

  • Uma observação é maior do que Q3 + 1,5* (intervalo interquartil)

Ao criar um gráfico tipo Box Plot, é possível ver rapidamente se uma distribuição de dados tem ou não valores discrepantes.

Veja também: Para que serve a manutenção preditiva?

Box plot

Box plot no MATLAB

O MATLAB é a ferramenta capaz de facilitar a produção de gráficos do tipo Box Plot que a OPENCADD oferece aos clientes. Para se plotar um gráfico tão robusto como este, basta simplesmente usar o comando boxplot. Isso porque o software possui uma linguagem de fácil entendimento e uma plataforma intuitiva e flexível, que podem ser usados para resolver quaisquer tipos de problemas e desenvolver projetos de todos os níveis.

Veja também: O que é Machine Learning?

Ao criar um diagrama de caixa no MATLAB, você tem a possibilidade de configurar da maneira que preferir. O MATLAB permite que você altere as cores e o tamanho do contorno da caixa, o estilo da mediana, o tamanho do gráfico, o estilo do gráfico, o status do entalhe, entre outras possibilidades.

Como podemos ver, são inúmeras alternativas e modificações de gráficos que o software do MATLAB permite criar.

Se você deseja criar gráficos Box Plot de maneira descomplicada, a OPENCADD convida você a conhecer o MATLAB. Acesse o site e faça um teste grátis de 30 dias.

QUERO FAZER O TESTE GRATUITO