- Blog
- Box plot: o que é e para que serve?
Sumário
Box plot: o que é e para que serve?
Box plot é uma ferramenta gráfica utilizada para representar e ilustrar um conjunto de dados distribuídos em cinco diferentes medidas, que possibilitam diversos tipos de observações em uma única análise.
Você já ouviu falar de Box plot? Sabe o que é e para que serve? Neste artigo, vamos esclarecer os principais pontos dessa ferramenta que a OPENCADD também oferece para você.
Acompanhe!
O que é o Box Plot?
O Box Plot, também chamado diagrama de caixa, é uma ferramenta gráfica utilizada para ilustrar um conjunto de dados. Por meio dele, é possível visualizar a distribuição de dados com base em cinco estatísticas:
-
o mínimo;
-
o primeiro quartil (Q1);
-
a mediana;
-
o terceiro quartil (Q3);
-
o máximo.
Esses valores também são conhecidos como resumo dos cinco números.
Ele também pode informar os valores discrepantes (outliers) dos dados, oferecendo uma medida complementar para o desenvolvimento de perspectivas sobre as informações passadas através dos dados.
Além disso, o Box Plot pode informar a posição dos dados, sua simetria, dispersão, cumprimento da cauda de distribuição e se estão ou não distorcidos.
No gráfico do Box Plot, a haste vertical é interpretada de baixo para cima, sendo que a parte inferior indica o mínimo e a superior indica o máximo, sempre desconsiderando possíveis outliers.
O retângulo central da haste possui três linhas que estão na horizontal: a linha de baixo, representada pelo contorno externo inferior do retângulo, indica o primeiro quartil. A linha de cima, que é o contorno externo superior do retângulo, indica o terceiro quartil. Já a linha interna indica a mediana ou o chamado segundo quartil.
Valores discrepantes, outliers e extremos são representados por asteriscos ou pontos, e indicam pontos atípicos no gráfico.
Box Plot: para que são usados?
Os diagramas criados pelo Box plot possibilitam diversos tipos de observações e análises. Isso porque eles oferecem diferentes nuances, já que os outliers permitem enxergar os dados de outra perspectiva, influenciando assim na tomada de decisão.
Para isso, é fundamental que cada um dos dados apresentados no resumo de 5 números seja considerado e analisado de forma correta, a fim de evitar interpretações erradas.
O diagrama de caixa também é muito usado para apresentação estatística e cálculos fundamentados em dados, tornando-se assim uma ferramenta gráfica para representar a variação de dados existentes em uma variável numérica, representada por meio dos quartis.
Veja também: Análise Preditiva: O Que É e Qual Sua Importância?
Normalmente, os gráficos tipo Box plot são úteis em três cenários:
Cenário 1: visualizar a distribuição de valores em conjuntos de dados
Um gráfico tipo Box plot permite visualizar rapidamente a distribuição de valores em um conjunto de dados e ver onde estão localizadas as cinco estatísticas de resumo numéricos.
Cenário 2: comparar duas ou mais distribuições
Com o Box plot é possível fazer comparações e visualizar as diferenças entre duas ou mais distribuições de dados, analisando os valores medianos e a dispersão entre cada um dos resultados apresentados nesses dados.
Cenário 3: Para identificar outliers
Nos gráficos Box Plot, os valores atípicos são normalmente representados por pequenos círculos que se estendem acima ou abaixo do retângulo que representa os quartis e a mediana.
Uma observação é definida como um outlier se atender a um dos seguintes critérios:
-
Uma observação é menor do que Q1 – 1,5* (intervalo interquartil)
-
Uma observação é maior do que Q3 + 1,5* (intervalo interquartil)
Ao criar um gráfico tipo Box Plot, é possível ver rapidamente se uma distribuição de dados tem ou não valores discrepantes.
Veja também: Para que serve a manutenção preditiva?
Box plot no MATLAB
O MATLAB é a ferramenta capaz de facilitar a produção de gráficos do tipo Box Plot que a OPENCADD oferece aos clientes. Para se plotar um gráfico tão robusto como este, basta simplesmente usar o comando boxplot. Isso porque o software possui uma linguagem de fácil entendimento e uma plataforma intuitiva e flexível, que podem ser usados para resolver quaisquer tipos de problemas e desenvolver projetos de todos os níveis.
Veja também: O que é Machine Learning?
Ao criar um diagrama de caixa no MATLAB, você tem a possibilidade de configurar da maneira que preferir. O MATLAB permite que você altere as cores e o tamanho do contorno da caixa, o estilo da mediana, o tamanho do gráfico, o estilo do gráfico, o status do entalhe, entre outras possibilidades.
Como podemos ver, são inúmeras alternativas e modificações de gráficos que o software do MATLAB permite criar.
Se você deseja criar gráficos Box Plot de maneira descomplicada, a OPENCADD convida você a conhecer o MATLAB. Acesse o site e faça um teste grátis de 30 dias.