Boxplot: Como interpretar?
Вставка
- Опубліковано 6 лют 2025
- O boxplot ou diagrama de caixa é uma ferramenta gráfica que permite visualizar a distribuição e valores discrepantes (outliers) dos dados, fornecendo assim um meio complementar para desenvolver uma perspectiva sobre o caráter dos dados. Além disso, o boxplot também é uma disposição gráfica comparativa.
As medidas de estatísticas descritivas como o mínimo, máximo, primeiro quartil, segundo quartil ou mediana e o terceiro quartil formam o boxplot.
O software R é livre, gratuito e está disponível para Windows e MacOS.
Você já conhece o Statplace? Siga nossas redes sociais para se informar sobre Estatística e Data Science:
Site: statplace.com.br
Instagram: / statplace
Linkedin: / statplace
#boxplot #plot #rstats #media #mediana #estatística #datascience
Nunca assisti uma explicação sobre esse assunto tão boa quanto essa, com edição fantástica.
Valeu, José! Ficamos muito felizes com isso, obrigado pelo elogio! 🥰
Ficou perfeita mesma!!!! Parabéns pelo trabalho
Didática impressionante, edição do video maravilhosa também, parabéns!
Obrigado, Marcos! Ficamos felizes com seu comentário 😁😁
Imagino o trabalhção que deve ter dado fazer todas essas animações. Parabéns e obrigado pelo empenho e generosidade em compartilhar esse conhecimento didatizado.
Excelente vídeo e excelente canal de Estatística Descritiva!! 👏📉📈📊👍
Ficamos muito felizes com o elogio!! 🥰
Excelente! Conseguiu definir tudo sobre "Boxplot" em pouquíssimo tempo! Ganhou +1 like e +1 inscrito!
Valeu, Rafael!! Ficamos muito feliz que tenha gostado 😁😁
Vídeo extremamente didático, consegui aprender muito facilmente sobre o boxplot. Mas deixo um destaque especial pra edição, muito linda
Agradecemos muito pelo elogio, Guilherme! 😄😄
Obrigado! O melhor vídeo que já assisti sobre o tema.
Assistindo na sala de aula e entendendo bulhufas, mas chegando em casa vai dar certo de entender. Desde já, muito bom o vídeo!😅
Vídeo excelente,demonstra a descrepancia dos elementos que compõem o blox pot
video bom dms, slk
Valeu, Caio!!
Caraca que vídeo foda, muito bem explicado e desenhado, foi fácil de entender assim! Muito obrigado.
Valeu, Daniel! Ficamos muito felizes que o nosso vídeo te ajudou a entender o assunto! 😀😀
Excelente didatica!!! Amei
Valeu, Alexandre, ficamos muito felizes com o comentário!!
Explicação fantástica!!! Abordou todos os tópicos e análises para ser feito referente ao boxplor. Sensacional, muito obrigada!!!
Valeu, Laura!! Ficamos muito felizes que o nosso vídeo está ajudando muitas pessoas! 😀😀
Excelente vídeo
Valeu, Vitor!!
vídeo perfeito!!!!! salvou muitooo, explicação clara e objetiva
Excelente apresentação, didática direta e impecável. Parabéns!!!
Agradecemos muito! 🥰
Excelente vídeo, bem produzido e não deixa espaço para dúvidas! Muito obrigado!
Oi Amaurí, que ótimo saber que não ficou nenhuma dúvida! 😁😁
Muito bom, me ajudou bastante, vcs são ótimos
Valeu, Jonathan!!
Adorei a didática e a explicação!
Valeu, Robson!!
Muito bom o material, parabéns!
Valeu, Thiago!!
Excelente explicação.
Valeu, Edleide!!
Explicação ótima.
Valeu, Jailson!!
excelente explicação
Valeu, Gabriel!
Excelente. Prático e didático.
Valeu, Mauri!!
video muito bom s2
Valeu, Davi! 🚀🚀
Didática simples e objetiva. Obrigado!!!
Valeu, Wilson!!
Parabéns pelo trabalho!
Obrigado, Nicolas! 😁😁
❤❤ explicação boa e rápida. O vídeo está lindo
Nós agradecemos muito pelo comentário! (((:
Excelente vídeo! Parabéns!!
Muito obrigada, Danielle!! 😃😃
ótimo vídeo!!!!
Valeu!! 😁😁
fico pensando em quem inventou isso, essa pessoa teve que viajar muito! hahah ai deus
Nossa, sim, pra quê
Sensacional! 👌
Obrigado! Ficamos contentes com o seu comentário e por ter gostado do conteúdo!
Fantastico gostei muito, sempre tive dificuldades para entender isso, agora ficou claro, parabens!
Que bom, Renato! Se tiver alguma dúvida ficamos felizes em responder! 😁😁
Uau! Simplesmente amei
Obrigado, Anna! Ficamos muito felizes com seu comentário!❤️
Ótima explicação. Parabéns pela didática.
Que bom que gostou do vídeo! Ficamos felizes com seu comentário
Maravilhosa apresentação e explicação...bem didático! Muito obrigada!
Que bom que gostou, Priscila!! Ficamos muito felizes 😁😁
mais didático que isso impossível rsrs...sensacional 👏👏👏
Valeu, michel!! Ficamos muito felizes com comentários assim!
@@Statplace eu que agradeço, que trabalho incrível que vocês fazem aqui...vou divulgar o trabalho de vocês pra que chegue a outras pessoas! Obrigado! 🙏🏽
@@michelcesar85 tentamos sempre levar conteúdos complexos de maneira mais simples possível! Temos instagram e lá postamos conteúdo toda semana também, além de lembrar quando sai novos vídeos aqui! E fique ligado que mês que vêm lançaremos mais um vídeo animado! 😁💙
Sensacional! Muito obrigado!
A gente que agradece, Alex! 😁
Vídeo incrível! Muito obrigado, ajudaou bastante...
Valeu, Lucas! 🚀
perfeito
Parabens pelo video muito bem feito
Agradecemos muito o comentário!
Excelente!
Muito bom!!
Obrigado! Ficamos contentes com o seu comentário e por ter gostado do conteúdo!
O que fica entre o limite inferior e o primeiro quartial também é o primeiro quartil^:. To mais em dúvida , entedi que isso seriam as caudas mas tmb que tudo ali na parte "de baixo" e de "cima" são o proprio primeiro e quarto quartil , faz sentido isso. Fora isso bem explicado!
Bom dia! Em um boxplot, a área entre o limite inferior (ou mínimo) e o primeiro quartil (Q1) não representa o próprio Q1.
O limite inferior, ou mínimo, é o menor valor da distribuição que não é considerado um outlier, sendo indicado pela extremidade inferior da linha que se estende a partir da caixa.
O primeiro quartil (Q1), por sua vez, é o valor abaixo do qual estão 25% dos dados. Ele marca o ponto onde termina o primeiro quarto da distribuição.
Os valores entre o limite inferior e o Q1 fazem parte da distribuição, mas não são o Q1. O Q1 é um ponto específico que representa o valor no qual 25% dos dados estão abaixo dele.
Resumindo: o Q1 delimita a primeira parte da distribuição, mas os valores entre o mínimo e o Q1 não devem ser confundidos com o próprio quartil.
@@Statplace perfeito, eu vi algum outro canal em inglês explicando que o limite calculado baseado na diferença inter quartil não deve ser considerado como o limite em si mas sim o ultimo valor nesse intervalo, faz sentido? E tudo que esta fora dos limites sao outliers mas se o limite inferior e superior necessariamente precisa ser um ponto (amostra) algo assim. Eu to muito confuso se foi isso que entendi. Obrigado!
@@hflx No boxplot, o "limite" a que você se refere é baseado na amplitude interquartil (AIQ), que é a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1), ou seja, AIQ = Q3 − Q1. A partir disso, os limites inferior e superior são definidos para ajudar na identificação de outliers.
No entanto, esses limites não correspondem necessariamente ao menor e maior valor observados no conjunto de dados. Eles servem como referências para identificar potenciais outliers. Assim, o "limite" visível no boxplot não é exatamente o valor calculado, mas sim o último valor dentro desse intervalo. Valores fora desses limites, se existirem, são exibidos como pontos, representando os outliers.
Muito bom, Obrigado!!!!
Que bom que gostou! Ficamos felizes com o comentário!
muito bom gente, obrigada
show
muito bom
Valeu, Gabriel!!
Fantástico
Obrigado, George!
Boa tarde. Tenho uma duvida. Essa Variabilidade que é maior, observou-se pelo tamanho dos boxplots ou pela diferença das medianas?
Que programa vcs usam pra essa edição? muito boa
Oi, gustavo! O vídeo foi feito pelo After Effects. 😀
👋👋👋👌
Vocês sabem dizer se esse tipo de gráfico pode ser feito com dados muito heterogêneos, que vão de 0 a 17500, por exemplo, de forma heterogênea? Eu estou com uns dados que acaba que todos os valores são outliers, pois todos distoam muito da média!
Oi, Roberta! Pode ser construído o gráfico boxplot para identificar algumas informações como a distribuição dos dados (mínimo, primeiro quartil, mediana, terceiro quartil e máximo). E a partir disso você poderá ter uma noção dessas informações e realizar análise para identificar se são outliers ou valores extremos (nem todo valor extremo é um outlier).
Uma possibilidade é verificar quais variáveis ou dados possuem 3 desvios-padrão (ou 6 ou 9 a depender) maiores ou menores do que a média.
Quando a mediana está mais perto do 3o quartil, isso significa que a maior parte dos dados estão abaixo da mediana? Não estou entendendo direito
Oi Roberta! Quando a linha da mediana está próxima ao primeiro quartil, os dados são assimétricos positivos e quando a posição da linha da mediana é próxima ao terceiro quartil, os dados são assimétricos negativos.
O valor do 3 quartil é o valor que delimita os 25% maiores valores. Ou seja, 75% dos valores estão abaixo desse valor, enquanto que 25% estão acima.
Como retiro os Outliers? Estou com esse problema, mas não sei se realmente é outliers.
Oi Fabio, tudo bem?
Os outliers são dados que se diferenciam dos demais no conjunto de dados, ou seja, é um valor atípico e que pode enviesar os resultados obtidos através das análises.
Se tivermos um conjunto de dados pequeno, é fácil de identificar esse valor atípico, basta verificar o valor que se difere dos demais. Entretanto, no caso de um conjunto de dados grande, essa maneira não é recomendável. Diante disso, o uso da análise gráfica é fundamental, pois ao plotarmos o boxplot conseguimos observar se há ou não possíveis outliers.
Antes de tentar remover um outlier, é preciso verificar se esse valor atípico se dá por erro de digitação ou qualquer outro erro (amostragem, medida, processamento de dados, etc). Usando a função (summary()) para obter os resultados referentes as medidas de tendência central (média, mediana, mínimo, máximo, etc,) é possível encontrar o valor máximo e mínimo e verificar se são esses valores que estão como outliers.
Caso seja apenas um único valor e o conjunto de dados seja grande o suficiente, é possível a remoção desse valor atípico (removendo de acordo com a coluna e linha do conjunto de dados) e a realização novamente das análises, sendo feita a comparação dos resultados para entender se a remoção desse outlier prejudica ou não na pesquisa.
Entretanto, caso a quantidade de outliers seja relativamente grande, será necessário o uso de outras análises com ênfase nesse valores, como por exemplo modelagem e a verificação de valores extremos, transformação logarítmica (se fizer sentido para a pesquisa e se for possível) e entre outros métodos.
Se tiver ficado mais alguma dúvida fique a vontade para perguntar!