👨💻 Получаем текст из read-only PDF. OCR для PDF. Как обычно, все просто и удобно )
Вставка
- Опубліковано 15 чер 2023
- А можно ли получить текст из pdf файла, который закрыт для копирования.
Можно, причем очень легко и просто
на гите
github.com/AndrewVolkova/Pyth...
#python #ocr #programming
Спасибо
Привет! Спасибо за программки и за отзывчивость.
пожалуйста 🙂
РАБОТАЕЕЕЕТ! Только я код написал с помощью Chat GPT 3.5. Сам я и пары "слов" не свяжу на питоне, хы. Просто чтобы контент из учебников тырить на изи и просить GPT помочь выучить. Спасибо огромное
В современном python есть альтернативный метод написания путей к файлу, через конструктор path, чтобы не надо было экранировать слэши:
file_to_open = Path("c:") / "books" / "some_text.txt"
Специально показал тот вариант, чтобы не попали на указанную ситуацию
@@PythonGuru_ я понял. Я к тому, что можно показать еще альтернативный синтаксис, который сейчас считается менее error-prone
Это, да. Спасибо. Я поэтому ваш ответ лайкнул. Если кто комменты будет читать, увидят альтернативные решения. Это приветствуется )
попробуй EasyOCR, пишут что получше будет распознавать
👌
Здравствуйте, у меня проблема (я рукожоп). Надо спарсить данные с веб сайта использую библиотеку requests и получая get заброс у меня это - {'success': False, 'code': 400, 'message': 'Parameter error', 'data': None, 'extend': None}. Вместо {success: true, code: 200, message: "Успешно",…}
code
:
200
data
:
[{cryptoAsset: {name: "USDT", fullName: "Tether", symbol: "", scale: 6},…},…]
extend
:
null
message
:
"Успешно"
success
:
true
А задача у меня научиться нормально собирать данные с сайтов, но я уже все гайды пересмотрел и ничего не выходит
Готовлю курс по этой теме.
А пока не выложил, дайте ваш код и что пытаетесь спарсить, могу глянуть
@@PythonGuru_ Здравствуйте, идёт пост запрос, где сам курс валюты храниться и там явно нужно использовать не bs4.