Распознавание текста с картинки. Python Tesseract ORC + OpenCV
Вставка
- Опубліковано 3 чер 2024
- Как распознать текст с фото? За счет языка Python и библиотеки OpenCV + Tesseract ORC это можно сделать за несколько строк кода. За урок мы разработаем систему для считывания данных из любого фото.
🚀 🚀 🚀
Ссылка на бесплатный интенсив «Как выбрать направление ИИ» от GeekBrains: geekbrains.ru/link/_oOuMN
🚀 🚀 🚀
✅ Полезные ссылки:
🏛 Плейлист по нейронным сетям: • Изучение нейронных сет...
✏️ Официальный сайт Tesseract: tesseract-ocr.github.io/tessd...
📺 Tesseract для Windows: tesseract-ocr.github.io/tessd...
🔑 Языки для Tesseract: tesseract-ocr.github.io/tessd...
✏️ Статья с кодом: itproger.com/news/raspoznavan...
🕰 Тайм-коды:
00:00 - Начало
00:30 - Что мы сделаем за урок?
01:19 - Установка библиотеки
02:19 - Создание проекта
03:03 - Работа с OpenCV
04:45 - Считывание данных
05:35 - Формирование надписей
07:07 - Заключительная часть
✔ Сообщество программистов: itproger.com/
✔ -------------
Вступай в группу Вк - prog_life 🚀
Группа FaceBook - goo.gl/XW0aaP
Инстаграм itProger: / itproger_official
Instagram: / gosha_dudar
Telegram: t.me/itProger_official
Twitter - / goshadudar
- Уроки от #GoshaDudar 👨🏼💻
- Все уроки по хештегу #goshaLessons
Нету файла для скачивания pytesseract ocr на сайте пишет что нет актуальной версии для установки что делать?
Круто новое видео от Гоши)
можно поступить проще: в терминале(cmd) установить pip и написать: pip install tesseract
pip install opencv-python
@@musa_usmanov Так тоже ожно)
Это не так работает. Нужно проинсталлировать библиотеку + установить tesseract на компьютер
Спасибо все супер. Скажи можно ли из js передать картинку в питон который обрабатывает фото и результат отдаёт назад в js?
Гоша. скинь пжл ссылки на репозиторий, тех программ которые ты использовал в качестве примера при работе с OpenCV
Спасибо
Может кто подсказать, в AWS Textract можно написать price и он выведет только стоимость если она указана, т.е. сопоставляет данные и выводит именно тот текст, который нам нужен. В tesseract есть такое?
Спасибо.
Гоша, красавчег👍
Это даже не он сделал - ua-cam.com/video/6DjFscX4I_c/v-deo.html
Сделай курс по data science на python или про ИИ на python. В крайнем случае про нейросеть.
Жду видео про template matching
Ты супер! Продолдай в томже духе
ого круто.
помогите пж, нужно создавать скрины определённой области, загружать их в скрипт, находить символы и их-же писать (как send в ahk, не в командную строку)
Того файла на сайте нету про Tesseract
Гоша, сделай пожалуйста видео на тему интеграции оплаты в телеграм бота! Нигде нет инфы на эту тему
Есть.
@@Cloudy-zq5yx линк?
@@konstbespr619 physics is simple aiogram набери
Может там как в ВК боте?
Я просто не помню, давно этим не интересовался
Давай видос по считыванию потокового видео с программы и распознавании собственных объектов
а можно с нескольких картинок собирать данные в Excel
А как сканировать баркоды через Django?
Гоша, сделай пожалуйста видео на тему Перенос HTML сайта на WordPress ?
OCR же, OCR!
Гошаааа видео супер но у меня проблема. Тесеракт поставился а вот с opencv проблемы. При написании просто в терминале пайчарма через pip выдаёт ошибку. Проблема с логами. Я не особо сведующий в логировании да и вообще в программировании. Прошу помощи либо у тебя либо друзья подписчики подскажите что сделать чтобы установить opencv. Заранее спасибо
получилось?
Ребят подскажите что делать вылазит вот эта ошибка
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
cv2.error: OpenCV(4.4.0) /private/var/folders/nz/vv4_9tw56nv9k3tkvyszvwg80000gn/T/pip-req-build-2rx9f0ng/opencv/modules/imgproc/src/color.cpp:182: error: (-215:Assertion failed) !_src.empty() in function 'cvtColor'
фотку название файла обрежь коротким название сделай типо temp.png
@@hinomuratomisaburo4901 не получилось
тоже самое, ты если понял как это сделать скажи мне пожалуйста
вообщем я понял, там к нему нужно путь написать
Круто, у меня вчера была идея сделать комментатор бота ВК с искусственным интеллектом который считывает данные с поста и пишет наиболее подходящий коммент и через определенное время проверять сколько лайков набралось и в зависимости от кол-ва лайков менять веса и другие параметры нейросети, но я конечно же отказался от этой идеи, так как не знал считывать текст с картинки и множество других проблем, вот и решена одна проблема, если другие тоже сами по себе решатся, то может сделаю)
Зачем тебе тогда нейросеть? Парсер странички нужен для получения данных, так быстрее, точнее и менее ресурсозатратнее. Не быть тебе программистом)
И уж даже если ты и накодишь нейронку (Даже через тот же tensor) то тебе этого не хватит (Она все равно будет тупой, сколько бы ты данных не вливал) А данных для обучения нужно больше чем пару тысяч фраз...
судя по твоему комменту, не особо ты сечешь, как работает нс, бот и т.д. Чтобы считать текст из поста вообще нвхрен не нужен computervision c tesseractom.
@@NeuralAIM лол нейросеть из видео нужен, чтобы разпознать текст из картинок, а в ВК большинство постов в виде картинки. И я написал в комменте что ещё много заморочек кроме этого, но для генерации комментария GMT2 или 3, который может генерировать текст или статью а не то что коммент, просто если ему дать тему. Или можно ещё что то самому придумать.
@@puturoi лол, я же написал в "ВК", в ВК много постов в виде картинки, и там текст в картинке и либа с этого видео только для того что распознать текст с постов в виде картинки. И я ещё я дополнил что много проблем кроме распознавания текстов и ТД. И я хоть и практический не делал нормальные проекты с нейросетями, но знаю как сделать перцептрон и обратное распространение ошибки, и знаю какие ограничения у вк, у официального или у неофициальных VK API для бота и с ними тоже работал, делал разных ботов ВК
@@baukaalimgazy2989 а, ты тип хочешь быть самым первым комментатором под постами чи шо
Параметры запуска тессеракта абсолютно не за то отвечают, что ты сказал. Oem - способ распознавания, psm (page segmentation mode) - режим сегментации страницы (в основном тессеракт с документами работает, при выщове помощи можно просмотреть все режимы сегментации)
Вместо enumerate и проверку индекса можно было сделать срез, так как нам всё равно необходимо будет хранить считанные данные в памяти, нет смысла пытаться сохратить итератор
Больше всего меня удивило, что автор использует аббревиатуру ORC, хотя общепринятой является OCR (о чем автор даже в названии библиотеки мог увидеть).
круть
А как распознать символы типо "·ê ·Ë· »ê ³ ·³¼ ·Ë"?
@Гоша Дударь, попробуй сделать урок по numba
6:02 ну зачем? Делается слайс [1:] и всё.
Здравствуйте! А подскажите, можно ли этим методом распознавать цифры из потока видео? Например спортивное электронное табло с временем, время минуты +секунды?
Метод показанный в видео работает с картинками, если ты разработаешь программу которая будет делать скриншоты и вставлять для считывания, то вполне возможно.
где ссылка на виндовс инсталер
Запишы курс по rust.
как быть с 4 строчкой на линуксе?
Не нужна
Уху питон 🐍
Блен ты прям вот во время как раз пишу прошу для бота в игре
Всё это будет работать пока фон под текстом не будет пёстрым
Всё конечно очень круто, но до того, чтобы понять, мне далековато. :)
Хочу тоже этому научиться (создавать нейросети), но пока чёт не очень получается, но ничего!
Для начало изучи основы
@@rustc2p256 , стараюсь.
Это сложно, но вот курс по которому я пытался изучать tensorflow: ua-cam.com/play/PLtPJ9lKvJ4oiz9aaL_xcZd-x0qd8G0VN_.html
@@kirillusenko , спасибо!
Когда будет видио про создания игр?
У него этих видео жопой ешь
Как сделать что бы распознавал русский текст ?
Он же сказал что надо выбрать при загрузке и русский
@@the..egoisto скачал а где подключить
Подключаю после конфига выдает ошибку
@@stariy_bog Там где конфиг он подключал пишешь , lang='rus'. Перед эти закидываешь файл с языком в папку tessdata с самим тессерактом
А она может комбинировать языки? К примеру код естественно написан на английском языке ,но у него есть комментарии на русском.
Да, можно. На C#, если воспользоваться библиотекой для тессеракта, ты можешь при инициализации тессеракта указать, например, RUS+ENG, но качество OCR будет чуть ниже.
Видео о том как взломать чужой компьютер - ua-cam.com/video/XtMgEfcZgZo/v-deo.html
ОэрСи, боже, чувак не может три буквы OCR прочитать в правильном порядке...
А по уроку выпадает ошибка:
cv2.error: OpenCV(4.8.1) D:\a\opencv-python\opencv-python\opencv\modules\highgui\src\window.cpp:1272: error: (-2:Unspecified error) The function is not implemented. Rebuild the library with Windows, GTK+ 2.x or Cocoa support. If you are on Ubuntu or Debian, install libgtk2.0-dev and pkg-config, then re-run cmake or configure script in function 'cvShowImage'
А ты не лучше, почитать ошибку можешь а не в комы вставлять. Переустанови библиотеку блять умник
digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.02-20180621.exe возможно вот этот файл нужный
Cnacubo
Сами же говорите оптикал кхеректал рекгнишн, а потом аббревиатура меняет порядок символов на о-эр-си, когда на самом деле оно о-си-ар
И не ORC а правильно OCR
из 7 минутного видео полторы минуты реклама и никчемное вступление, потом еще и посреди ролика впихнул рекламу. топчик
Начал с ORC закончит RAC
PermissionError: [WinError 5] Отказано в доступе
Тессеракт орк
Но ведь не удобно работать с Питоном, гораздо удобней было бы сделать программу с интерфейсом, окном и кнопками .
Тесеракт довольно хреновое решение. Сам им пользуюсь и проблем с ним - полно. Хорошее решение это Yandex Vision, но капец какой дорогой.
Круто!
Неужели ты не любишь его😭😭??? Я про Python. А если и любишь, то почему не подписан на мой канал? Исправь это🤙😎
У тебя как то разрозненно всё. Я не очень люблю питухон, но могу сказать, что нужно тебе делать видео более подробные по нему. Расскажи про всё что знаешь. Smtplib, json, datetime, request, tkinter, socket, os, time. Сними самую подробную серию видео по питухону на рутубе и я думаю добьёш 1млн подписчиков к весне 21!!!
даешь тоже самое только на C#!!
Мой коммент будет явно удален, но что я хочу сказать: Гоша, тебе простительно что ты не ученый в сфере компьютерного зрения и машинного обучения. Но готовься пожалуйста лучше. Многая терминология неточна или неверная + про функции питона немного неверно говоришь)
Плохо работает с русским языком.
твои видео все до единого не рабочие , не заработало не чего .. хз , я уже скоко их не смотрел.. вродь пробелма в опен сиви ... она у твоему коде кривая ..щас комент вставлю что пиет джипити
Кажется, возникла проблема с библиотекой OpenCV, которая используется для отображения изображений. Ошибка указывает на то, что функция cv2.imshow() не реализована. Это может быть вызвано неправильной установкой или версией OpenCV.
Попробуйте переустановить OpenCV или обновить его до последней версии. Возможно, вам также потребуется установить зависимости для поддержки графического интерфейса, если вы используете его на Windows.
дохлый движок он распознает с кракозябрами.. это капитализм.. хорошие движки платные.. тоже с говорилками...про браузеры вообще молчу.. по моему нам слили чтобы началась гражданская война до того раздражает тупизм некоторого ПО ..вместо нормального функционала команд в консоли приходится лезть черт знает куда...