Como extrair QUALQUER informação de um PDF com o PYTHON em SEGUNDOS!

Поділитися
Вставка
  • Опубліковано 24 лип 2024
  • Como extrair QUALQUER informação de um PDF com o PYTHON em SEGUNDOS! Esse é o tema do vídeo de hoje, aprenda a extrair tabelas, textos e qualquer informação de um pdf.
    ► Entre na lista de espera do CÓDIGO.PY, minha formação completa de Python para finanças: varos.com.br/cursos/codigopy/...
    ► Se inscreva na CARTEIRA FATOR e tenha acesso a um modelo de investimento extremamente LUCRATIVO: varos.com.br/carteiras/fator?...
    ►Como criar DASHBOARDS FINANCEIROS com o Python: varos.com.br/cursos/dashpy/pr...
    ___________________________
    00:00 - Introdução
    00:30 - Importação das bibliotecas
    00:56 - Utilização do Java
    03:00 - Leitura do PDF
    04:49 - Extração e formatação do texto
    06:30 - Extraindo tabelas
    No vídeo de hoje, vou te mostrar como é possível extrair qualquer tipo de informação de um PDF utilizando o poder do Python! Seja texto, imagem, ou qualquer outra coisa que você queira automatizar, programação pode ser a chave para otimizar suas rotinas e facilitar seu dia a dia.
    Vou te guiar, utilizando os pacotes que vamos utilizar são o PyPDF2, Tabula, e Camelot, cada um com uma função específica.
    É importante garantir que você tenha o Java instalado no seu computador, já que o Tabula utiliza essa linguagem. Caso não tenha, basta fazer o download do Java e reiniciar o computador para reconhecimento.
    Com o PyPDF2, conseguimos abrir e ler informações sobre o PDF. Utilizando o Tabula, podemos extrair tabelas específicas do PDF. Se quiser extrair texto, é possível fazer isso também. E o Camelot nos ajuda na extração de tabelas com uma formatação mais amigável.
    Além disso, vou te mostrar como melhorar a formatação do texto extraído e como manipular essas informações de forma mais eficiente. Com essas técnicas, você pode automatizar a extração de dados de relatórios, facilitando análises e agilizando processos.
    Espero que esse vídeo te ajude e se você gostou considere se inscrever no canal para continuar recebendo conteúdo gratuito sempre, e não esqueça de deixar o seu like pra ajudar esse vídeo a chegar para mais pessoas.
    ___________________________
    Para acompanhar a gente e receber mais conteúdos de alta qualidade, nos siga em:
    ► Instagram: / ​
    ► Twitter: / brennosullivan
    ► Linkedin: / brenno-sullivan-662372185
    #python #programacao #mercadofinanceiro #leiturapdf #extrairtextopdf

КОМЕНТАРІ • 6

  • @thiagomoreira3326
    @thiagomoreira3326 4 місяці тому +4

    Excelente explicação, porém gostaria de deixar uma pequena sugestão o audio de background ficou muito alto!

  • @ewerthonvinicius9728
    @ewerthonvinicius9728 11 днів тому

    Ótima explicação. Tem como transferir essas tabelas para excel?

  • @pietrovinicius
    @pietrovinicius 3 місяці тому

    acabou de ganhar um inscrito, ótimo vídeo!

  • @gehhard
    @gehhard 5 місяців тому

    Nossa, eu tava procurando isso e veio em boa hora, mas infelizmente parece q deu um erro no Java, atualizei a versão do meu note, mas ainda recebo erro qnd tento capturar as tabelas, caso alguém saiba como corrigir, agradeço demais, sabe como é, ne ?! Tiozim de 52 anos se aventurando a aprender a programar ia dar BO, msm rsssss
    tabelaComum = tabula.read_pdf('ExtratoNovoPlano (1).pdf', pages='all', encoding='utf-8')
    JVMNotFoundException: No JVM shared library file (jvm.dll) found. Try setting up the JAVA_HOME environment variable properly.

    • @varos-programacao
      @varos-programacao  5 місяців тому +1

      Quando der esse erro, configura o path do java nas variáveis ambiente do computador. O Python não ta conseguindo achar o java porque ele não está lá. Procura aqui no youtube "como configurar o java nas variáveis de ambiente do Windows" que você vai encontrar mil tutoriais kkk

    • @gehhard
      @gehhard 5 місяців тому

      @@varos-programacao Vlw, Brenão, deu certo aqui, ja ta qse conseguindo um aluno pro Códigopy rsss