Imagino o trabalhção que deve ter dado fazer todas essas animações. Parabéns e obrigado pelo empenho e generosidade em compartilhar esse conhecimento didatizado.
O que fica entre o limite inferior e o primeiro quartial também é o primeiro quartil^:. To mais em dúvida , entedi que isso seriam as caudas mas tmb que tudo ali na parte "de baixo" e de "cima" são o proprio primeiro e quarto quartil , faz sentido isso. Fora isso bem explicado!
Bom dia! Em um boxplot, a área entre o limite inferior (ou mínimo) e o primeiro quartil (Q1) não representa o próprio Q1. O limite inferior, ou mínimo, é o menor valor da distribuição que não é considerado um outlier, sendo indicado pela extremidade inferior da linha que se estende a partir da caixa. O primeiro quartil (Q1), por sua vez, é o valor abaixo do qual estão 25% dos dados. Ele marca o ponto onde termina o primeiro quarto da distribuição. Os valores entre o limite inferior e o Q1 fazem parte da distribuição, mas não são o Q1. O Q1 é um ponto específico que representa o valor no qual 25% dos dados estão abaixo dele. Resumindo: o Q1 delimita a primeira parte da distribuição, mas os valores entre o mínimo e o Q1 não devem ser confundidos com o próprio quartil.
@@Statplace perfeito, eu vi algum outro canal em inglês explicando que o limite calculado baseado na diferença inter quartil não deve ser considerado como o limite em si mas sim o ultimo valor nesse intervalo, faz sentido? E tudo que esta fora dos limites sao outliers mas se o limite inferior e superior necessariamente precisa ser um ponto (amostra) algo assim. Eu to muito confuso se foi isso que entendi. Obrigado!
@@hflx No boxplot, o "limite" a que você se refere é baseado na amplitude interquartil (AIQ), que é a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1), ou seja, AIQ = Q3 − Q1. A partir disso, os limites inferior e superior são definidos para ajudar na identificação de outliers. No entanto, esses limites não correspondem necessariamente ao menor e maior valor observados no conjunto de dados. Eles servem como referências para identificar potenciais outliers. Assim, o "limite" visível no boxplot não é exatamente o valor calculado, mas sim o último valor dentro desse intervalo. Valores fora desses limites, se existirem, são exibidos como pontos, representando os outliers.
@@Statplace eu que agradeço, que trabalho incrível que vocês fazem aqui...vou divulgar o trabalho de vocês pra que chegue a outras pessoas! Obrigado! 🙏🏽
@@michelcesar85 tentamos sempre levar conteúdos complexos de maneira mais simples possível! Temos instagram e lá postamos conteúdo toda semana também, além de lembrar quando sai novos vídeos aqui! E fique ligado que mês que vêm lançaremos mais um vídeo animado! 😁💙
Vocês sabem dizer se esse tipo de gráfico pode ser feito com dados muito heterogêneos, que vão de 0 a 17500, por exemplo, de forma heterogênea? Eu estou com uns dados que acaba que todos os valores são outliers, pois todos distoam muito da média!
Oi, Roberta! Pode ser construído o gráfico boxplot para identificar algumas informações como a distribuição dos dados (mínimo, primeiro quartil, mediana, terceiro quartil e máximo). E a partir disso você poderá ter uma noção dessas informações e realizar análise para identificar se são outliers ou valores extremos (nem todo valor extremo é um outlier). Uma possibilidade é verificar quais variáveis ou dados possuem 3 desvios-padrão (ou 6 ou 9 a depender) maiores ou menores do que a média.
Oi Fabio, tudo bem? Os outliers são dados que se diferenciam dos demais no conjunto de dados, ou seja, é um valor atípico e que pode enviesar os resultados obtidos através das análises. Se tivermos um conjunto de dados pequeno, é fácil de identificar esse valor atípico, basta verificar o valor que se difere dos demais. Entretanto, no caso de um conjunto de dados grande, essa maneira não é recomendável. Diante disso, o uso da análise gráfica é fundamental, pois ao plotarmos o boxplot conseguimos observar se há ou não possíveis outliers. Antes de tentar remover um outlier, é preciso verificar se esse valor atípico se dá por erro de digitação ou qualquer outro erro (amostragem, medida, processamento de dados, etc). Usando a função (summary()) para obter os resultados referentes as medidas de tendência central (média, mediana, mínimo, máximo, etc,) é possível encontrar o valor máximo e mínimo e verificar se são esses valores que estão como outliers. Caso seja apenas um único valor e o conjunto de dados seja grande o suficiente, é possível a remoção desse valor atípico (removendo de acordo com a coluna e linha do conjunto de dados) e a realização novamente das análises, sendo feita a comparação dos resultados para entender se a remoção desse outlier prejudica ou não na pesquisa. Entretanto, caso a quantidade de outliers seja relativamente grande, será necessário o uso de outras análises com ênfase nesse valores, como por exemplo modelagem e a verificação de valores extremos, transformação logarítmica (se fizer sentido para a pesquisa e se for possível) e entre outros métodos.
Oi Roberta! Quando a linha da mediana está próxima ao primeiro quartil, os dados são assimétricos positivos e quando a posição da linha da mediana é próxima ao terceiro quartil, os dados são assimétricos negativos. O valor do 3 quartil é o valor que delimita os 25% maiores valores. Ou seja, 75% dos valores estão abaixo desse valor, enquanto que 25% estão acima.
Nunca assisti uma explicação sobre esse assunto tão boa quanto essa, com edição fantástica.
Valeu, José! Ficamos muito felizes com isso, obrigado pelo elogio! 🥰
Ficou perfeita mesma!!!! Parabéns pelo trabalho
Didática impressionante, edição do video maravilhosa também, parabéns!
Obrigado, Marcos! Ficamos felizes com seu comentário 😁😁
Imagino o trabalhção que deve ter dado fazer todas essas animações. Parabéns e obrigado pelo empenho e generosidade em compartilhar esse conhecimento didatizado.
video bom dms, slk
Valeu, Caio!!
Obrigado! O melhor vídeo que já assisti sobre o tema.
Assistindo na sala de aula e entendendo bulhufas, mas chegando em casa vai dar certo de entender. Desde já, muito bom o vídeo!😅
Vídeo excelente,demonstra a descrepancia dos elementos que compõem o blox pot
Excelente! Conseguiu definir tudo sobre "Boxplot" em pouquíssimo tempo! Ganhou +1 like e +1 inscrito!
Valeu, Rafael!! Ficamos muito feliz que tenha gostado 😁😁
Excelente vídeo e excelente canal de Estatística Descritiva!! 👏📉📈📊👍
Ficamos muito felizes com o elogio!! 🥰
Vídeo extremamente didático, consegui aprender muito facilmente sobre o boxplot. Mas deixo um destaque especial pra edição, muito linda
Agradecemos muito pelo elogio, Guilherme! 😄😄
vídeo perfeito!!!!! salvou muitooo, explicação clara e objetiva
fico pensando em quem inventou isso, essa pessoa teve que viajar muito! hahah ai deus
Nossa, sim, pra quê
Excelente didatica!!! Amei
Valeu, Alexandre, ficamos muito felizes com o comentário!!
Caraca que vídeo foda, muito bem explicado e desenhado, foi fácil de entender assim! Muito obrigado.
Valeu, Daniel! Ficamos muito felizes que o nosso vídeo te ajudou a entender o assunto! 😀😀
Excelente vídeo
Valeu, Vitor!!
Explicação fantástica!!! Abordou todos os tópicos e análises para ser feito referente ao boxplor. Sensacional, muito obrigada!!!
Valeu, Laura!! Ficamos muito felizes que o nosso vídeo está ajudando muitas pessoas! 😀😀
Excelente apresentação, didática direta e impecável. Parabéns!!!
Agradecemos muito! 🥰
Excelente vídeo, bem produzido e não deixa espaço para dúvidas! Muito obrigado!
Oi Amaurí, que ótimo saber que não ficou nenhuma dúvida! 😁😁
Explicação ótima.
Valeu, Jailson!!
Muito bom, me ajudou bastante, vcs são ótimos
Valeu, Jonathan!!
excelente explicação
Valeu, Gabriel!
Excelente explicação.
Valeu, Edleide!!
Espetacular!
Didática simples e objetiva. Obrigado!!!
Valeu, Wilson!!
Excelente. Prático e didático.
Valeu, Mauri!!
Adorei a didática e a explicação!
Valeu, Robson!!
Muito bom o material, parabéns!
Valeu, Thiago!!
❤❤ explicação boa e rápida. O vídeo está lindo
Nós agradecemos muito pelo comentário! (((:
Excelente vídeo! Parabéns!!
Muito obrigada, Danielle!! 😃😃
Parabéns pelo trabalho!
Obrigado, Nicolas! 😁😁
Parabens pelo video muito bem feito
Agradecemos muito o comentário!
ótimo vídeo!!!!
Valeu!! 😁😁
video muito bom s2
Valeu, Davi! 🚀🚀
Ótima explicação. Parabéns pela didática.
Que bom que gostou do vídeo! Ficamos felizes com seu comentário
Fantastico gostei muito, sempre tive dificuldades para entender isso, agora ficou claro, parabens!
Que bom, Renato! Se tiver alguma dúvida ficamos felizes em responder! 😁😁
Uau! Simplesmente amei
Obrigado, Anna! Ficamos muito felizes com seu comentário!❤️
Maravilhosa apresentação e explicação...bem didático! Muito obrigada!
Que bom que gostou, Priscila!! Ficamos muito felizes 😁😁
Sensacional! 👌
Obrigado! Ficamos contentes com o seu comentário e por ter gostado do conteúdo!
Sensacional! Muito obrigado!
A gente que agradece, Alex! 😁
O que fica entre o limite inferior e o primeiro quartial também é o primeiro quartil^:. To mais em dúvida , entedi que isso seriam as caudas mas tmb que tudo ali na parte "de baixo" e de "cima" são o proprio primeiro e quarto quartil , faz sentido isso. Fora isso bem explicado!
Bom dia! Em um boxplot, a área entre o limite inferior (ou mínimo) e o primeiro quartil (Q1) não representa o próprio Q1.
O limite inferior, ou mínimo, é o menor valor da distribuição que não é considerado um outlier, sendo indicado pela extremidade inferior da linha que se estende a partir da caixa.
O primeiro quartil (Q1), por sua vez, é o valor abaixo do qual estão 25% dos dados. Ele marca o ponto onde termina o primeiro quarto da distribuição.
Os valores entre o limite inferior e o Q1 fazem parte da distribuição, mas não são o Q1. O Q1 é um ponto específico que representa o valor no qual 25% dos dados estão abaixo dele.
Resumindo: o Q1 delimita a primeira parte da distribuição, mas os valores entre o mínimo e o Q1 não devem ser confundidos com o próprio quartil.
@@Statplace perfeito, eu vi algum outro canal em inglês explicando que o limite calculado baseado na diferença inter quartil não deve ser considerado como o limite em si mas sim o ultimo valor nesse intervalo, faz sentido? E tudo que esta fora dos limites sao outliers mas se o limite inferior e superior necessariamente precisa ser um ponto (amostra) algo assim. Eu to muito confuso se foi isso que entendi. Obrigado!
@@hflx No boxplot, o "limite" a que você se refere é baseado na amplitude interquartil (AIQ), que é a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1), ou seja, AIQ = Q3 − Q1. A partir disso, os limites inferior e superior são definidos para ajudar na identificação de outliers.
No entanto, esses limites não correspondem necessariamente ao menor e maior valor observados no conjunto de dados. Eles servem como referências para identificar potenciais outliers. Assim, o "limite" visível no boxplot não é exatamente o valor calculado, mas sim o último valor dentro desse intervalo. Valores fora desses limites, se existirem, são exibidos como pontos, representando os outliers.
Muito bom!!
Obrigado! Ficamos contentes com o seu comentário e por ter gostado do conteúdo!
Vídeo incrível! Muito obrigado, ajudaou bastante...
Valeu, Lucas! 🚀
Boa tarde. Tenho uma duvida. Essa Variabilidade que é maior, observou-se pelo tamanho dos boxplots ou pela diferença das medianas?
Excelente!
muito bom gente, obrigada
mais didático que isso impossível rsrs...sensacional 👏👏👏
Valeu, michel!! Ficamos muito felizes com comentários assim!
@@Statplace eu que agradeço, que trabalho incrível que vocês fazem aqui...vou divulgar o trabalho de vocês pra que chegue a outras pessoas! Obrigado! 🙏🏽
@@michelcesar85 tentamos sempre levar conteúdos complexos de maneira mais simples possível! Temos instagram e lá postamos conteúdo toda semana também, além de lembrar quando sai novos vídeos aqui! E fique ligado que mês que vêm lançaremos mais um vídeo animado! 😁💙
Que programa vcs usam pra essa edição? muito boa
Oi, gustavo! O vídeo foi feito pelo After Effects. 😀
muito bom
Valeu, Gabriel!!
Muito bom, Obrigado!!!!
Que bom que gostou! Ficamos felizes com o comentário!
Vocês sabem dizer se esse tipo de gráfico pode ser feito com dados muito heterogêneos, que vão de 0 a 17500, por exemplo, de forma heterogênea? Eu estou com uns dados que acaba que todos os valores são outliers, pois todos distoam muito da média!
Oi, Roberta! Pode ser construído o gráfico boxplot para identificar algumas informações como a distribuição dos dados (mínimo, primeiro quartil, mediana, terceiro quartil e máximo). E a partir disso você poderá ter uma noção dessas informações e realizar análise para identificar se são outliers ou valores extremos (nem todo valor extremo é um outlier).
Uma possibilidade é verificar quais variáveis ou dados possuem 3 desvios-padrão (ou 6 ou 9 a depender) maiores ou menores do que a média.
Fantástico
Obrigado, George!
show
Como retiro os Outliers? Estou com esse problema, mas não sei se realmente é outliers.
Oi Fabio, tudo bem?
Os outliers são dados que se diferenciam dos demais no conjunto de dados, ou seja, é um valor atípico e que pode enviesar os resultados obtidos através das análises.
Se tivermos um conjunto de dados pequeno, é fácil de identificar esse valor atípico, basta verificar o valor que se difere dos demais. Entretanto, no caso de um conjunto de dados grande, essa maneira não é recomendável. Diante disso, o uso da análise gráfica é fundamental, pois ao plotarmos o boxplot conseguimos observar se há ou não possíveis outliers.
Antes de tentar remover um outlier, é preciso verificar se esse valor atípico se dá por erro de digitação ou qualquer outro erro (amostragem, medida, processamento de dados, etc). Usando a função (summary()) para obter os resultados referentes as medidas de tendência central (média, mediana, mínimo, máximo, etc,) é possível encontrar o valor máximo e mínimo e verificar se são esses valores que estão como outliers.
Caso seja apenas um único valor e o conjunto de dados seja grande o suficiente, é possível a remoção desse valor atípico (removendo de acordo com a coluna e linha do conjunto de dados) e a realização novamente das análises, sendo feita a comparação dos resultados para entender se a remoção desse outlier prejudica ou não na pesquisa.
Entretanto, caso a quantidade de outliers seja relativamente grande, será necessário o uso de outras análises com ênfase nesse valores, como por exemplo modelagem e a verificação de valores extremos, transformação logarítmica (se fizer sentido para a pesquisa e se for possível) e entre outros métodos.
Se tiver ficado mais alguma dúvida fique a vontade para perguntar!
Quando a mediana está mais perto do 3o quartil, isso significa que a maior parte dos dados estão abaixo da mediana? Não estou entendendo direito
Oi Roberta! Quando a linha da mediana está próxima ao primeiro quartil, os dados são assimétricos positivos e quando a posição da linha da mediana é próxima ao terceiro quartil, os dados são assimétricos negativos.
O valor do 3 quartil é o valor que delimita os 25% maiores valores. Ou seja, 75% dos valores estão abaixo desse valor, enquanto que 25% estão acima.
👋👋👋👌