Como extrair QUALQUER informação de um PDF com o PYTHON em SEGUNDOS!

Поділитися
Вставка
  • Опубліковано 6 лют 2025

КОМЕНТАРІ • 14

  • @LuizReis1310
    @LuizReis1310 3 дні тому

    Amigo, você pode me ajudar com uma dúvida?
    Aqui na empresa, tenho um PDF com 100 páginas. Em cada página, há dois horários registrados:
    Exemplo:
    Horário de início: "08:00:00"
    Horário de fim: "08:00:05"
    Preciso extrair todos esses horários (início e fim) de cada página e organizá-los em duas colunas verticais:
    Uma coluna com todos os horários de início.
    Outra coluna com todos os horários de fim.
    Será que é possível fazer isso usando Python?

  • @rayelemoreira1487
    @rayelemoreira1487 5 місяців тому

    Como comparar arquivos que estão em idiomas diferentes e identificar as similaridades entre eles?

  • @thiagomoreira3326
    @thiagomoreira3326 10 місяців тому +8

    Excelente explicação, porém gostaria de deixar uma pequena sugestão o audio de background ficou muito alto!

  • @pietrovinicius
    @pietrovinicius 10 місяців тому

    acabou de ganhar um inscrito, ótimo vídeo!

  • @ewerthonvinicius9728
    @ewerthonvinicius9728 6 місяців тому

    Ótima explicação. Tem como transferir essas tabelas para excel?

  • @MarcosVinicius-rd3zj
    @MarcosVinicius-rd3zj 5 місяців тому

    É possível extrair equações? Colocando em formato LaTeX

  • @cesin9
    @cesin9 4 місяці тому

    E quando o pdf não for pesquisável? tem como converter para pesquisável ?

    • @varos-programacao
      @varos-programacao  4 місяці тому

      Ele vai extrair o texto, se o PDF for uma imagem você pode usar alguma IA que extrai texto de foto

  • @gehhard
    @gehhard Рік тому

    Nossa, eu tava procurando isso e veio em boa hora, mas infelizmente parece q deu um erro no Java, atualizei a versão do meu note, mas ainda recebo erro qnd tento capturar as tabelas, caso alguém saiba como corrigir, agradeço demais, sabe como é, ne ?! Tiozim de 52 anos se aventurando a aprender a programar ia dar BO, msm rsssss
    tabelaComum = tabula.read_pdf('ExtratoNovoPlano (1).pdf', pages='all', encoding='utf-8')
    JVMNotFoundException: No JVM shared library file (jvm.dll) found. Try setting up the JAVA_HOME environment variable properly.

    • @varos-programacao
      @varos-programacao  Рік тому +1

      Quando der esse erro, configura o path do java nas variáveis ambiente do computador. O Python não ta conseguindo achar o java porque ele não está lá. Procura aqui no youtube "como configurar o java nas variáveis de ambiente do Windows" que você vai encontrar mil tutoriais kkk

    • @gehhard
      @gehhard Рік тому

      @@varos-programacao Vlw, Brenão, deu certo aqui, ja ta qse conseguindo um aluno pro Códigopy rsss

  • @luizlima6678
    @luizlima6678 Місяць тому

    ]excelente. Recomendo retirar o fundo musical.