Consultoria de Ciência de Dados #02
Вставка
- Опубліковано 19 вер 2024
- Nesse vídeo, eu fiz uma consultoria de Ciência de Dados para o projeto do Paulo Reis, estudante de Análise de Sistemas na UFPE.
=================================================
Conheça a Comunidade DS:
bit.ly/3BAvGoj
Curso gratuito de Python para iniciantes:
bit.ly/2Ze8495
Grupo de Estudos do Telegram:
t.me/meigaromds
=================================================
Fique por dentro de conteúdos diárias e dicas de estudos
Instagram: @meigarom
LinkedIn: /
Meigarom, seu trabalho é simplesmente sensacional. Sua dedicação em aplicar conhecimento é digna de reconhecimento. Obrigado por ser um profissional incrível.
Muito obrigado pelas palavras Joabe!
O tempo é aquilo que temos de mais importante, e você dedicar um pouco do seu tempo, para assistir meus vídeos e escrever um comentário aqui, já é o maior reconhecimento que eu poderia ter.
Muito obrigado pelo seu tempo!
Ou odaliscas
Yuan gente tonturasn
Muito bom. Obrigado por ajudar a todos que querem se tornar um cientista de dados.
Parabéns pelo canal, excelente tutor.
Muito bom. Gostei de todas as orientações.
Muito obrigado Eliana!!
Fico feliz que tenha gostado da Consultoria DS.
Eu fiquei bastante feliz em poder ajudar o Paulo, muito legal acompanhar a evolução do pessoal.
Bons estudos!
Muito bom o projeto desse rapaz. Obrigado pela oportunidade, Meigarom!
Grande Carlos, tudo bom?
Ficou bem legal o projeto do Paulo, é bastante desafiador, tem muitas habilidades diferentes envolvidas para aprender e é uma solução muito útil, principalmente para corretoras de imóveis.
Grande abraço!
Muito top. To aprendendo muito.
Meigarom excelente trabalho, novamente muito instrutivo.
Uma coisa que fiquei com duvidas foi durante o cleaning columns nas colunas prices usando o comando
df_rede['prices'] = df_rede['prices'].str.extract( '(\d+)', expand=Flase )
o retorno foram os valores 80, 130, 130, 132... e não os valores 80.000, 130.000...
para que os valores de price fiquem corretos 80000, 130000 ou 80.000, 130.000... é preciso tratar da mesma maneira como feito na coluna sqrt_meters, usando o regex, certo?
no tempo de video de 1h00min é possível ver os valores de 80, 130.
Mais uma vez vale elogiar o excelente conteúdo que vc tem disponibilizado para nós.
Mais um vídeo muito bom e esclarecedor. Eu tava com uma idéia de fazer um projeto parecido mas parece que o Paulo já tava um passo na minha frente hehe. Realmente o webscraping e o tratamento de dados é muito trabalhoso, mas com esse vídeo eu percebi que isso é algo normal mesmo
Meigarom, como resolvemos o problema de haverem imóveis que aparecem em vários sites, de forma a que não existam imóveis duplicados no dataset final?
Grande Renato, tudo bem?
Esse é um grande desafio, porque não temos um ID único para os Apartamentos, tipo um CPF.
Então usamos outras abordagens com por exemplo, comparar as colunas para encontrar duplicados. Você pode usar a distância Euclidiana para encontrar a distâncias entre os apartamentos e olhar se os apartamentos com a menor distância entre si são o mesmo. São algumas formas, mas é um desafio.!
Grande abraço Renato!
Olá Meigarom, tubo bem (exceto aquilo que não está bem. eheh brincadeira) e consigo? Era muito interessante se resolvesse esse problema num próximo vídeo, recorrendo a processos automatizados ou semi-automatizados. Era muito útil em termos práticos, pois eu estou a pensar em fazer um projeto deste género aqui para a minha zona (Setúbal - Portugal) e fazer isso à mão é uma tarefa gigantesca e impraticável. Grande abraço!
Olá, parabéns pelo seu trabalho e obrigado pelos ensinamentos. Fiz a instalação da extensão do notebook e habilitei a Table of Contents (2) no Nbextensions. A tabela com o menu dos meus headings aparece somente quando seleciono a opção "Download as... HTML with toc" e ai vejo o meu notebook em HTML bem estruturado. No entanto, no próprio .ipynb não aparece o menu, somente as seções enumeradas automaticamente. Além disto quando subo o .ipynb no github ele não mostra o menu e nem as próprias enumerações automáticas das seções através do markdown (#). O que estaria faltando, alguma opção que não habilitei? Meu objetivo é subir o notebook com o menu e com as seção enumeradas automaticamente assim como aparece no arquivo .html na minha máquina.
Fala Tiago, blz?
Obrigado pelo comentário!
Cara, eu não tenho nem idéia do que pode ser seu problema.
Não consigo te ajudar, desculpa! 😐
Meigarom, tenho uma dúvida, você colocou que como soluções é criar um modelo, de ML e Estatístico, poderia me falar qual seria a diferença entre esses dois?
Fala Matheus, blz? Obrigado pela pergunta.
Modelos de Machine Learning usam os dados para aprender uma determinada tarefa, classificar, clusterizar ou prever, ou seja, eles usam os dados para modelar o comportamento.
Os modelos estatísticos modelam a desconhecia fonte geradora dos dados através de distribuição de probabilidades estimadas.
Se você aprende o comportamento através dos dados, você consegue prever o próximo passo.
Se você sabe como é a fonte geradora dos dados original, você também consegue prever o próximo passo.
Respondi sua pergunta Matheus, faz sentido?
Abraço
@@ComunidadeDS Beleza! Muito obrigado pela resposta.
Ele é do IFPE não UFPE meigarom, mas otimo video !
Poxa, eu juro que eu entendi UFPE Redfox!! hahahaah.
Obrigado pela correção!
Abração!
First !
Valeu Heriton!!
Forte abraço!