Consultoria de Ciência de Dados #02

Поділитися
Вставка
  • Опубліковано 19 вер 2024
  • Nesse vídeo, eu fiz uma consultoria de Ciência de Dados para o projeto do Paulo Reis, estudante de Análise de Sistemas na UFPE.
    =================================================
    Conheça a Comunidade DS:
    bit.ly/3BAvGoj
    Curso gratuito de Python para iniciantes:
    bit.ly/2Ze8495
    Grupo de Estudos do Telegram:
    t.me/meigaromds
    =================================================
    Fique por dentro de conteúdos diárias e dicas de estudos
    Instagram: @meigarom
    LinkedIn: / ​

КОМЕНТАРІ • 24

  • @joabe1207
    @joabe1207 4 роки тому +6

    Meigarom, seu trabalho é simplesmente sensacional. Sua dedicação em aplicar conhecimento é digna de reconhecimento. Obrigado por ser um profissional incrível.

    • @ComunidadeDS
      @ComunidadeDS  4 роки тому

      Muito obrigado pelas palavras Joabe!
      O tempo é aquilo que temos de mais importante, e você dedicar um pouco do seu tempo, para assistir meus vídeos e escrever um comentário aqui, já é o maior reconhecimento que eu poderia ter.
      Muito obrigado pelo seu tempo!

    • @moustaphatoure9935
      @moustaphatoure9935 3 роки тому

      Ou odaliscas
      Yuan gente tonturasn

  • @adrianomorrison2
    @adrianomorrison2 Рік тому

    Muito bom. Obrigado por ajudar a todos que querem se tornar um cientista de dados.

  • @renegonzaleshyppolito8845
    @renegonzaleshyppolito8845 3 роки тому +1

    Parabéns pelo canal, excelente tutor.

  • @elianasantos6105
    @elianasantos6105 4 роки тому +1

    Muito bom. Gostei de todas as orientações.

    • @ComunidadeDS
      @ComunidadeDS  4 роки тому +1

      Muito obrigado Eliana!!
      Fico feliz que tenha gostado da Consultoria DS.
      Eu fiquei bastante feliz em poder ajudar o Paulo, muito legal acompanhar a evolução do pessoal.
      Bons estudos!

  • @geofisico2007
    @geofisico2007 4 роки тому +2

    Muito bom o projeto desse rapaz. Obrigado pela oportunidade, Meigarom!

    • @ComunidadeDS
      @ComunidadeDS  4 роки тому

      Grande Carlos, tudo bom?
      Ficou bem legal o projeto do Paulo, é bastante desafiador, tem muitas habilidades diferentes envolvidas para aprender e é uma solução muito útil, principalmente para corretoras de imóveis.
      Grande abraço!

  • @JamesBomdePapo
    @JamesBomdePapo 3 роки тому

    Muito top. To aprendendo muito.

  • @hectorlouis1
    @hectorlouis1 4 роки тому

    Meigarom excelente trabalho, novamente muito instrutivo.
    Uma coisa que fiquei com duvidas foi durante o cleaning columns nas colunas prices usando o comando
    df_rede['prices'] = df_rede['prices'].str.extract( '(\d+)', expand=Flase )
    o retorno foram os valores 80, 130, 130, 132... e não os valores 80.000, 130.000...
    para que os valores de price fiquem corretos 80000, 130000 ou 80.000, 130.000... é preciso tratar da mesma maneira como feito na coluna sqrt_meters, usando o regex, certo?
    no tempo de video de 1h00min é possível ver os valores de 80, 130.
    Mais uma vez vale elogiar o excelente conteúdo que vc tem disponibilizado para nós.

  • @ViniciusLL2
    @ViniciusLL2 4 роки тому

    Mais um vídeo muito bom e esclarecedor. Eu tava com uma idéia de fazer um projeto parecido mas parece que o Paulo já tava um passo na minha frente hehe. Realmente o webscraping e o tratamento de dados é muito trabalhoso, mas com esse vídeo eu percebi que isso é algo normal mesmo

  • @renferpur
    @renferpur 4 роки тому +1

    Meigarom, como resolvemos o problema de haverem imóveis que aparecem em vários sites, de forma a que não existam imóveis duplicados no dataset final?

    • @ComunidadeDS
      @ComunidadeDS  4 роки тому +1

      Grande Renato, tudo bem?
      Esse é um grande desafio, porque não temos um ID único para os Apartamentos, tipo um CPF.
      Então usamos outras abordagens com por exemplo, comparar as colunas para encontrar duplicados. Você pode usar a distância Euclidiana para encontrar a distâncias entre os apartamentos e olhar se os apartamentos com a menor distância entre si são o mesmo. São algumas formas, mas é um desafio.!
      Grande abraço Renato!

    • @renferpur
      @renferpur 4 роки тому

      Olá Meigarom, tubo bem (exceto aquilo que não está bem. eheh brincadeira) e consigo? Era muito interessante se resolvesse esse problema num próximo vídeo, recorrendo a processos automatizados ou semi-automatizados. Era muito útil em termos práticos, pois eu estou a pensar em fazer um projeto deste género aqui para a minha zona (Setúbal - Portugal) e fazer isso à mão é uma tarefa gigantesca e impraticável. Grande abraço!

  • @tiagopinter2365
    @tiagopinter2365 4 роки тому

    Olá, parabéns pelo seu trabalho e obrigado pelos ensinamentos. Fiz a instalação da extensão do notebook e habilitei a Table of Contents (2) no Nbextensions. A tabela com o menu dos meus headings aparece somente quando seleciono a opção "Download as... HTML with toc" e ai vejo o meu notebook em HTML bem estruturado. No entanto, no próprio .ipynb não aparece o menu, somente as seções enumeradas automaticamente. Além disto quando subo o .ipynb no github ele não mostra o menu e nem as próprias enumerações automáticas das seções através do markdown (#). O que estaria faltando, alguma opção que não habilitei? Meu objetivo é subir o notebook com o menu e com as seção enumeradas automaticamente assim como aparece no arquivo .html na minha máquina.

    • @ComunidadeDS
      @ComunidadeDS  4 роки тому

      Fala Tiago, blz?
      Obrigado pelo comentário!
      Cara, eu não tenho nem idéia do que pode ser seu problema.
      Não consigo te ajudar, desculpa! 😐

  • @ae123as
    @ae123as 4 роки тому +1

    Meigarom, tenho uma dúvida, você colocou que como soluções é criar um modelo, de ML e Estatístico, poderia me falar qual seria a diferença entre esses dois?

    • @ComunidadeDS
      @ComunidadeDS  4 роки тому +2

      Fala Matheus, blz? Obrigado pela pergunta.
      Modelos de Machine Learning usam os dados para aprender uma determinada tarefa, classificar, clusterizar ou prever, ou seja, eles usam os dados para modelar o comportamento.
      Os modelos estatísticos modelam a desconhecia fonte geradora dos dados através de distribuição de probabilidades estimadas.
      Se você aprende o comportamento através dos dados, você consegue prever o próximo passo.
      Se você sabe como é a fonte geradora dos dados original, você também consegue prever o próximo passo.
      Respondi sua pergunta Matheus, faz sentido?
      Abraço

    • @ae123as
      @ae123as 4 роки тому

      @@ComunidadeDS Beleza! Muito obrigado pela resposta.

  • @MatheusPessoa2001
    @MatheusPessoa2001 4 роки тому +1

    Ele é do IFPE não UFPE meigarom, mas otimo video !

    • @ComunidadeDS
      @ComunidadeDS  4 роки тому

      Poxa, eu juro que eu entendi UFPE Redfox!! hahahaah.
      Obrigado pela correção!
      Abração!

  • @eheriton
    @eheriton 4 роки тому +1

    First !