- 117
- 304 746
Universidade dos Dados
Brazil
Приєднався 5 вер 2013
Quer se tornar um analista de dados com menos de R$1,00/dia? Participe do Clube de Assinaturas: www.universidadedosdados.com!
Meu nome é Yukio, sou Matemático, mestre em Economia e atuo como cientista de dados.
Sou ex-Itaú, HSBC, Vivo, GetNinjas e Digital House. Na internet, falo do tema desde 2016.
Comecei no blog www.estatsite.com.br.
Depois comecei a escrever no Twitter, @unidosdados.
Agora, além dessas redes, tenho postado muito conteúdo no Instagram, @universidadedosdados.
Em todas as redes, o foco é falar de Ciência de Dados, Machine Learning, Inteligência Artificial, Python, R, SQL e SAS. Enfim, tudo que gira em torno deste universo dos dados.
Todos os conteúdos são gratuitos.
Meu nome é Yukio, sou Matemático, mestre em Economia e atuo como cientista de dados.
Sou ex-Itaú, HSBC, Vivo, GetNinjas e Digital House. Na internet, falo do tema desde 2016.
Comecei no blog www.estatsite.com.br.
Depois comecei a escrever no Twitter, @unidosdados.
Agora, além dessas redes, tenho postado muito conteúdo no Instagram, @universidadedosdados.
Em todas as redes, o foco é falar de Ciência de Dados, Machine Learning, Inteligência Artificial, Python, R, SQL e SAS. Enfim, tudo que gira em torno deste universo dos dados.
Todos os conteúdos são gratuitos.
SQL: Qual a diferença de UNION e UNION ALL?
Vamos falar mais uma vez da ferramenta mais utilizada por um profissional de dados, independente dele ser engenheiro de dados ou analista de dados, o SQL!
O vídeo de hoje é mais um daqueles conceitos básicos que acabam sendo cobrados durante processos seletivos. Como já disse anteriormente, o mais comum é termos provas práticas de SQL, onde você extrairá algumas respostas de uma tabela qualquer que te enviaram. No entanto, alguns conceitos básicos acabam sendo pedidos por certos gestores, por entender que eles sejam tão essenciais, que decorá-los é uma obrigação.
Dito tudo isto, bora para a aula!
Queries que criaram as tabelas A e B: github.com/yukioandre/SQL_UA-cam
E se você quiser aprender SQL e outras ferramentas necessárias para se tornar um analista de dados, experimente nosso Clube de Assinaturas! Temos trilhas completas, muitas aulas práticas, muitas dicas de portfólios, tudo isso por menos de 1 real por dia: www.universidadedosdados.com
Este preço é válido para 2024. Dependendo do momento em que você está assistindo este vídeo, o valor pode ter sido ajustado!
O vídeo de hoje é mais um daqueles conceitos básicos que acabam sendo cobrados durante processos seletivos. Como já disse anteriormente, o mais comum é termos provas práticas de SQL, onde você extrairá algumas respostas de uma tabela qualquer que te enviaram. No entanto, alguns conceitos básicos acabam sendo pedidos por certos gestores, por entender que eles sejam tão essenciais, que decorá-los é uma obrigação.
Dito tudo isto, bora para a aula!
Queries que criaram as tabelas A e B: github.com/yukioandre/SQL_UA-cam
E se você quiser aprender SQL e outras ferramentas necessárias para se tornar um analista de dados, experimente nosso Clube de Assinaturas! Temos trilhas completas, muitas aulas práticas, muitas dicas de portfólios, tudo isso por menos de 1 real por dia: www.universidadedosdados.com
Este preço é válido para 2024. Dependendo do momento em que você está assistindo este vídeo, o valor pode ter sido ajustado!
Переглядів: 177
Відео
SQL: Qual a diferença de HAVING e WHERE?
Переглядів 16914 днів тому
SQL é essencial para analistas e cientistas de dados, isso, creio eu, todos já sabem. Embora a gente espere mais provas práticas durante os processos seletivos, como cases enviados para casa, ainda temos diversos testes que envolvem apenas conhecer as sintaxes e responder perguntas teóricas. Não é que você tenha que decorar todas as sintaxes e comandos, mas existe um grupo mais básico disso que...
Previsões de Séries Temporais com XGBoost
Переглядів 666Місяць тому
A maioria dos iniciantes já está familiarizada com modelos feito para dados cross-sectional. Aqueles modelos como Regressão Logística, Random Forest, Árvore de Decisão, aqueles que a gente aplica quando se tem uma foto de certos dados em um dado momento. Porém, lidar com eventos onde o tempo é relevante são diferentes e precisam de alguns cuidados. Hoje, vou mostrar como adaptar esses modelos t...
Truques com Print e Input no Python!
Переглядів 2752 місяці тому
Neste vídeo, apresentamos um tutorial completo sobre as diversas maneiras de utilizar a função print() e como receber informações do usuário com input(). Exploramos desde conceitos básicos, como exibir mensagens simples e concatenar strings, até recursos avançados, incluindo formatação de números e uso de f-strings para tornar seu código mais eficiente e legível. E se você quiser ter acesso à p...
Introdução a Programação Linear com Python
Переглядів 8032 місяці тому
Neste vídeo, apresento um tutorial prático sobre como resolver problemas de otimização utilizando Python e a biblioteca OR-Tools do Google. Abordamos um caso simples de uma fábrica de roupas que precisa determinar a quantidade ideal de camisetas, calças e blusas a serem produzidas para maximizar o lucro, considerando as restrições de seus insumos. Ao longo do vídeo, você aprenderá a modelar o p...
Como processar grandes conjuntos de dados no Python?
Переглядів 5082 місяці тому
Se você está trabalhando com data science ou análise de dados e já se deparou com datasets enormes que deixam o seu código lento, este vídeo é para você! Hoje, vou te mostrar como utilizar a biblioteca Polars, uma alternativa ao Pandas, para lidar com grandes volumes de dados de forma muito mais eficiente e rápida. Hoje, você vai aprender: - Como carregar datasets gigantes em Python. - Como a b...
Medidas estatísticas que poucos analistas de dados conhecem
Переглядів 7942 місяці тому
Você talvez já conheça a média e a mediana, mas e quando queremos calcular uma média de produtividade, de taxa de crescimento, você usa apenas a tradicional média aritmética? Você sabia que há medidas melhores para essas situações? Poucos analistas e cientistas de dados conhecem a média geométrica e a média harmônica, o que as torna um conhecimento valioso para você se diferenciar! Bora para ma...
Como tratar datas no Python
Переглядів 2832 місяці тому
Qualquer analista de dados, ou cientista, já recebeu ou acessou um conjunto de dados onde o formato de data não veio como deveria. Às vezes chega como string, às vezes é numérica, pode vir como 20200101, ou como 01/01/2020. Datas dão trabalho mesmo, mas tem ficado cada vez mais fácil lidar com elas por conta de toda evolução que as bibliotecas tiveram. No caso do Pandas, você vai ver que é bem ...
É possível usar comandos de SQL dentro do R!
Переглядів 1112 місяці тому
É possível usar comandos de SQL dentro do R!
Como gerar gráficos com o melhor pacote do R!
Переглядів 1632 місяці тому
Como gerar gráficos com o melhor pacote do R!
Reagindo a Youtubers Falando de Inteligência Artificial
Переглядів 4563 місяці тому
Reagindo a UA-camrs Falando de Inteligência Artificial
Gráficos Essenciais para Análise de Dados (em Python)
Переглядів 1,5 тис.3 місяці тому
Gráficos Essenciais para Análise de Dados (em Python)
Como usar uma árvore de decisão para fazer previsões!
Переглядів 6753 місяці тому
Como usar uma árvore de decisão para fazer previsões!
Análise de Dados com Árvores de Decisão
Переглядів 1,3 тис.3 місяці тому
Análise de Dados com Árvores de Decisão
Exercícios de SQL para Analistas de Dados
Переглядів 1,3 тис.3 місяці тому
Exercícios de SQL para Analistas de Dados
Este é o trabalho do cientista de dados!
Переглядів 2,7 тис.3 місяці тому
Este é o trabalho do cientista de dados!
O salário de um profissional de dados é bom?
Переглядів 4,1 тис.3 місяці тому
O salário de um profissional de dados é bom?
Questão de SQL para Analistas de Dados da Amazon
Переглядів 2,2 тис.3 місяці тому
Questão de SQL para Analistas de Dados da Amazon
É assim que trabalha um analista de dados!
Переглядів 3,3 тис.3 місяці тому
É assim que trabalha um analista de dados!
Trabalhando como Analista de Dados (com SQL)
Переглядів 3,9 тис.4 місяці тому
Trabalhando como Analista de Dados (com SQL)
Probabilidade para Analistas de Dados
Переглядів 8064 місяці тому
Probabilidade para Analistas de Dados
Estatística para Analistas de Dados (com Python)
Переглядів 1,1 тис.4 місяці тому
Estatística para Analistas de Dados (com Python)
Vamos trabalhar como um analista de dados!
Переглядів 63 тис.4 місяці тому
Vamos trabalhar como um analista de dados!
Como escolher as features para seu modelo de Machine Learning?
Переглядів 1,1 тис.4 місяці тому
Como escolher as features para seu modelo de Machine Learning?
Estatística Descritiva e Gráficos no Excel
Переглядів 1,3 тис.5 місяців тому
Estatística Descritiva e Gráficos no Excel
O Linkedin está prejudicando sua carreira!
Переглядів 1,1 тис.6 місяців тому
O Linkedin está prejudicando sua carreira!
Criando um perfil atraente no Linkedin!
Переглядів 1,3 тис.6 місяців тому
Criando um perfil atraente no Linkedin!
Até aqui?! 😂😂😂😂😂 Vi no Insta e fiquei 10 dias seguidos cantando essa rima pesada 😂😂😂😂
Poxa, Samy Dana? Aquele cara que errou TODAS as previsões na pandemia?
Tenho interesse,mas nao sei nem usar excel...e a matemática??? É possível?? 😢
A trilha que criamos no Clube eu acredito que parta muito do zero, tanto que eu explico tudo, até as notações. Mas tem um período de teste pela Hotmart. Se não gostar, pode pedir o reembolso
irmão, o que acha de criar um discord pra quem é da área de dados, como se fosse uma comunidade? eu com certeza entraria, pois poderiamos uns ajudar os outros, tirar dúvidas, conversar, divulgas vagas de emprego, etc! aqui deixo minha sugestão, Deus abençoe!
cara, sou um grande entusiasta da área de dados, mas tenho uma pergunta que eu gostaria muito que você me respondesse. eu ouço muito se falar sobre portifólio de dados, mas sempre que eu procuro um vídeo sobre portifólio, não fica esclarecido para mim. por exemplo, um portifólio de dev é armazenado no github e/ou deployado num site para que os recrutadores possam ver, mas onde que eu armazenaria esse portifólio de dados? como exibir? e como fazer o portifólio, por exemplo, eu buscaria uma base de dados fictícia para que eu pudesse criar meu projeto para o portifólio? ficarei grato se puder me ajudar
A parte de sair perguntando qual o campo, qual tabela de qual banco é muito real ! Quase nunca há um catálogo ou dicionário de dados atualizado.
Era este exemplo que eu queria ver de Análise de Dados. Obrigado
Boa tarde
Top
Gostei muito desse estilo do seu vídeo. ajuda demais a termos uma noçao de como é o trabalho do dia a dia de um analista de dados... tira uma duvida no seu curso tem muitos videos nesse estilo? e tipo eu posso passar planilhas para vocês corrigirem para eu poder comparar o que errei???? Me inscrevi no canal!!!
Cara que conteudo top!!! Tem algum video postado falando de sua historia?? Gostaria de saber como foi sua tragetoria, o que estudou, como estudou, quanto tempo para conseguir trampo..... um video completo mesmo!!!!!!!!! Parabéns pelo ótimo conteudo.👏👏👏👏👏👏👏
é normal o [total de samples] variar entre cada nó da árvore ? por exemplo: o total da árvore é 9000, a árvore da direita teria 3568 elementos... mas o samples abaixo desse nó varia para 5357, 1081, 4276...
Obrigado
¡Qué buen video! Siempre me confundía con UNION y UNION ALL, pero ahora lo entiendo mejor. 🤓 Una vez en un proyecto, olvidé usar UNION ALL y me volví loco buscando el error. 😂 Estoy empezando con cоdigо herое y me está gustando mucho.
Cara, peguei uma matéria de Pesquisa Operacional na Graduação e hoje estou pegando Simulação (que utiliza Matlab para fazer essas simulações, gostaria de fazer em python) que nos apresenta esse mundo de programação linear, simplex, teoria das filas, markov, fico de cara como isso não é tão aplamente difundido no mercado. Existem as grandes empresas de consultoria que prestam esse tipo de serviço para outras grandes empresas (área de logística, petrolíferas, por exemplo), mas não vejo isso pro mercado comum. Ficaria animado demais de acompanhar seus conteúdos sobre esse assunto, acho muito rico.
Muito obrigado. Precisava desta aula na prática
15:00 minutos de pura baléla. tu tem que te organizar para fazer os videos , te achei muito perdido nesses 15 minutos...
Parabéns pelo conteúdo. Muito rico
eu entendia q o having era um "where" que só poderia ser usado para as funções de agregação. Estaria errado no caso né?
Tá certinho, mano! =)
Muito bom o video. To maratonado o canal e me inscrevi ontem. Parabéns pelo conteúdo 👏🏽👏🏽👏🏽
Você é o CARA !!!! Cinco anos perdendo tempo com loc e iloc. Melhor aula de filtros que eu assiti em cinco anos. PARABÉNS !!!!!
37 ? kkk pensei que tinha uns 25 kk
Mano, não tem nada mais raíz que isso no dia-a-dia do profissional. Obrigado por compartilhar!
Feliz que vocês tão curtindo esses videos! Vou fazer mais uns e explicar até como nossas soluções agregam valor na empresa. Curti essa dinamica tb
Por favor, o que vc indica de curso para começar a estudar sobre análise de dados? Estava pra me inscrever no EBAC
Clube de Assinaturas da Universidade dos Dados, www.universidadedosdados.com. Menos de 1 real por dia
cara, depois de aprender o básico do sql eu queria saber exatamente isso, muito obrigado!
tão bom que até me inscrevi
Sobre a features, eu não entendi bem os lags, reassiste essa parte e ainda não entendi, mas o uso de janelas temporais também é uma opção né?
Ele busca encontrar um padrão de consumo no dia da semana basicamente. Se por exemplo ele tem um dado de uma quarta feira, ele criou features para olhar o valor da target na quarta feira da semana passada (7 dias atrás), semana retrasada (14 dias atrás) e assim vai.
Flerto com essa área a alguns anos, hoje adquiri o clube na hotmart e pretendo voltar a comentar aqui sobre meu primeiro trabalho na área rs. Abraços Yukio.
Fala amigo, adquiriu o curso? Como está sendo?
Não encontrei o dataframe amigo, pode me ajudar?
Eu não achei mais no Kaggle, tem um outro mas diferente. O que eu recomendo: pegue qualquer outro dataset que dá para replicar numa boa, carrega igual eu fiz e vai aplicando nas colunas existentes
Parabéns pelo vídeo! Uma dúvida em relação a séries temporais e especificamente usando o XGBoost: O menor dado de Lag são 7 dias. É possível fazer previsões para janelas de tempo maior que 7 dias? Pq para lag7, a partir de 7 dias quais são os dados que vão ser utilizados como base pro modelo? O mesmo se aplica a lag14. A partir de 14 dias, quais serão os dados utilizados no modelo? E assim sucessivamente... Nesse caso, como o dataset é completo, temos todos os dados de Lag no dataset de treino e a previsão acontece normalmente. Mas para fazer previsões de fato para o futuro, como fica esse aspecto? Porque para mais de 7 dias não temos dados, e assim sucessivamente como foi falado no parágrafo 2. Como funciona para o modelo fazer essas previsões?
Otimização é a cara da microeconomia, rs! Muito legal saber aplicação disso com a programação também
Mestrão, se traçasse uma linha de tendência no primeiro gráfico ia ficar show!
Mentira que você tem 37 anos kkkkkkkkkkk, achei que você tinha uns 25 anos kkkkkkkkkk
Kkkkkkkkkk quem dera, ja se foi minha juventude
Depois de passar dias a procura dos dados, quando vc encontra, precisa começar a saga do vaqueiro no query para tratamento desses dados, que é 90% de excel preenchido por centenas de pessoas diferentes. kkkkkk
38 mil visualizações e 14,7 mil inscritos. Tá de zoa. Vamos se inscrever galera.
Valeu pelo apoio, mano!🙏
Algoritmo, eu preciso de mais videos assim, obrigado!
Muito bom achei interessante a estrategia de feature selection. XGBoost é um baita algoritmo, tanto pra regressão, quanto pra classificação, mas nunca usei em séries temporais. Nesse caso o R² deve ter dado esse valor, justamente com o MAE e o MSE ambos muito alto, pois muito provavelmente os dados não são estacionários, um teste de Dickey Fuller aumentado ia ajudar a ver isso, daí uma transformação logarítmica ou aplicar um diff() ia ajudar. Sei que o vídeo é mais pra mostrar o modelo para séries temporais e como aplicar, pois a ordem importa dos dados importa nas séries, mas fazer limpeza de dados e o feature selection antes do split não geraria data leakege? Só uma dúvida sincera mesmo. Abraços!
Depende de qual limpeza. Por exemplo, num problema de dados cross sectional não poderia imputar missing antes do split, porque ele usaria informações do teste no treino. No caso ali, eu peguei a informação da lag só, entao não teria problema, ao meu ver
Ahhh sim! Agora entendi, realmente faz muito sentido, muito obrigado pela explicação!
Rapaz acertou logo no meu tema favorito kkkkkkkkkkkkkkkk, ótimo conteúdo como sempre Yukio, e esse vídeo tirou algumas dúvidas que eu tava tendo e que tavam me travando em um projeto que estou pra lançar. Muito obrigadooooo
Muito obrigado pelos vídeos, a prática é fundamental para quem é iniciante 🙌🏻🙌🏻👍🏻👍🏻
maluco vc foi um dos poucos q explica os metodos em python pra rodar um modelo de ML... oq vc flw e verdade ta, tem mt cientista q nao consegue explicar o .fit() por exemplo... ate ai blz pq no mercado de trabalho oq importa e entregar resultado, mas andei percebendo q tem mto curso q a pessoa q esta lecionando nao explica oq acontece por detras em um modelo de ML PQ ELES N SABEM
Sim, você tem razão! Tem mais, você verá alguns tutoriais e profissionais explicando algum conceito totalmente equivocado. Meio que as coisas se propagam, mesmo quando erradas.
Excelente material, parabéns !!!
Conteúdo show demais!
👏👏
O mais legal da área de dados é que você consegue usar para qualquer coisa na sua vida, jogos, saúde, esportes, é simplesmente fantástico.
Sim! É muito incrível haha
1. É comum ocorrer análise multivariada? 2. A análise bivariada é feita com todas as variáveis em relação a variável alvo?
Boa noite. Tem como Baixar oa arquivos da aula professor
A pratica geral da profissão consiste em analise de dados assim ou a pratica geral são analises mais complexas?