Como Usar Python com Apache Spark? Guia Prático de PySpark!

Поділитися
Вставка
  • Опубліковано 18 вер 2024

КОМЕНТАРІ • 31

  • @giovanamarques2074
    @giovanamarques2074 22 дні тому +1

    Eu não costumo comentar vídeos no youtube mas esse vou ter que comentar pq me ajudou MUITO! obrigadA!

  • @Danfc182
    @Danfc182 8 днів тому

    Didática sensacional!!!!

  • @RaphaelArcuri
    @RaphaelArcuri 2 місяці тому +1

    Show narrativa show de bola. Mil vezes melhor que as aulas da ALURA!

  • @SamirMamude
    @SamirMamude Місяць тому

    Parabéns pela aula, sua explicação é perfeita!

  • @profmarcioalencar
    @profmarcioalencar 6 місяців тому +1

    Parabéns Matheus, super aula, super organizado, show de didática

  • @HistoriasdeGuerra-ck1sw
    @HistoriasdeGuerra-ck1sw 3 місяці тому

    Ele fez o assunto parecer tão fácil mais tão fácil que até parece que eu aprendi a ler de novo, parabéns mestre, teu conteúdo é excelente. Mais um inscrito para o seu canal, valeuu!!

  • @dinizleonardo1995
    @dinizleonardo1995 9 місяців тому

    Conteúdo top da DataWay BR! Valeu Rossi!

  • @carlosbarbosa776
    @carlosbarbosa776 9 місяців тому

    Uma verdadeira aula!

  • @rafaelg8238
    @rafaelg8238 9 місяців тому

    Top. Parabens Matheus e sucesso ao canal.

  • @celsodeccache6268
    @celsodeccache6268 2 місяці тому

    Muito obrigado pelo vídeo! Bem didático!

    • @datawaybr
      @datawaybr  2 місяці тому

      Nós que agradecemos!

  • @juliomaia8891
    @juliomaia8891 9 місяців тому

    Muito boa didática!

  • @joaoricardopessoa7410
    @joaoricardopessoa7410 9 місяців тому

    Boa! Parabéns.

  • @heroncarlos7464
    @heroncarlos7464 9 місяців тому

    Excelente

  • @louriveira
    @louriveira 4 місяці тому +1

    Uau, parabéns pelo conteúdo! Muito bom.

  • @nettoflorestal
    @nettoflorestal 5 днів тому

    Muito caprichado o conteúdo! Parabéns! Quais os detalhes para instalar do poetry? Tem que ser em uma venv ou no próprio sistema?

    • @datawaybr
      @datawaybr  3 дні тому +1

      O poetry tem a documentação de instalação dele, mas basicamente o recomendado é instalar ele com o pipx (ele vai isolar o poetry em uma "venv" própria.

    • @nettoflorestal
      @nettoflorestal 3 дні тому

      @@datawaybr Valeu! Deu certo agora e rodou liso. Eu estava instalando global e estava ferrando tudo. kkk

  • @BaierleBR
    @BaierleBR 28 днів тому +1

    Uma duvida amigo, fazer o ETL com Python usando o Google Colab ou Jupyter Notebook não seria bom igual o spark? (Se conseguir me tirar essa duvida)

    • @datawaybr
      @datawaybr  27 днів тому

      Opa @BaierleBR, fazer ETL usando Python no Colab é bem diferente de usar Spark. Enquanto o Python no Colab processa os dados de forma sequencial em uma única máquina, o Spark utiliza paralelismo distribuído, dividindo o trabalho entre vários nós de um cluster. Isso faz com que o Spark seja muito mais eficiente quando se trata de grandes volumes de dados. Em resumo, para pequenos datasets, o Python no Colab pode funcionar bem, mas para lidar com Big Data, o Spark é a escolha mais adequada.

  • @louriveira
    @louriveira 4 місяці тому

    Atualmente, estou aprendendo a trabalhar no ambiente Cloudera Hadoop. Lá utilizamos Hive e Impala para manipulação de dados. Posso também utilizar Apache Spark neste ambiente? Se sim, o curso de vocês "APACHE SPARK PARA ENGENHARIA DE DADOS" já seria suficiente para poder fazer as transformações neste ambiente?

    • @datawaybr
      @datawaybr  4 місяці тому

      Sim @louriveira, você pode usar Apache Spark no ambiente Cloudera Hadoop! O curso "APACHE SPARK PARA ENGENHARIA DE DADOS" é suficiente para aprender a fazer transformações de dados utilizando essa framework, embora não utilizamos esse ambiente, fazemos tudo local, em breve estaremos com conteúdo mais focado no uso do Apache Spark para Cloud.

  • @vanderleibachendorf1174
    @vanderleibachendorf1174 4 місяці тому

    parabéns pelo seu conteúdo, hoje estou tendo problemas com etl de bigdata, penso que o spark pode ajudar

    • @datawaybr
      @datawaybr  4 місяці тому

      Com certeza!!! O Apache Spark é extremamente recomendável para cenários de Big Data

  • @LuizHenrique-sf1ji
    @LuizHenrique-sf1ji 9 місяців тому

    ótima aula , onde eu encontro os links e o fluxo apresentado no vídeo ?

    • @datawaybr
      @datawaybr  9 місяців тому

      Olá
      Você pode encontrar no nosso medium também
      datawaybr.medium.com/do-zero-ao-pyspark-em-1h-4185005771e5

  • @LucasLumertz-b5g
    @LucasLumertz-b5g 2 місяці тому

    Uma dúvida, eu tenho instalado no mac o java 21, é importante ser especificamente a versão 11 como mostra? E se sim, ter mais essa versão não vai atrapalhar a versão já instalada?

    • @datawaybr
      @datawaybr  Місяць тому +1

      Tudo bem? O projeto do spark hoje tem suporte às versões 8/11/17 do Java.
      Você pode ter mais de uma versão instalada, mas precisa configurar suas aplicações para utilizar a versão correta.

  • @user-dn7ub8rh9d
    @user-dn7ub8rh9d 6 місяців тому

    no arquivo faltou o entry de "data" só pra avisar

    • @datawaybr
      @datawaybr  6 місяців тому

      Obrigado! Realmente estava faltando, adicionamos no post agora.
      Agradecemos o feedback 🤩