Распознавание текста с картинки. Python Tesseract ORC + OpenCV

Гоша Дударь

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 3 чер 2024
Как распознать текст с фото? За счет языка Python и библиотеки OpenCV + Tesseract ORC это можно сделать за несколько строк кода. За урок мы разработаем систему для считывания данных из любого фото.
🚀 🚀 🚀
Ссылка на бесплатный интенсив «Как выбрать направление ИИ» от GeekBrains: geekbrains.ru/link/_oOuMN
🚀 🚀 🚀
✅ Полезные ссылки:
🏛 Плейлист по нейронным сетям: • Изучение нейронных сет...
✏️ Официальный сайт Tesseract: tesseract-ocr.github.io/tessd...
📺 Tesseract для Windows: tesseract-ocr.github.io/tessd...
🔑 Языки для Tesseract: tesseract-ocr.github.io/tessd...
✏️ Статья с кодом: itproger.com/news/raspoznavan...
🕰 Тайм-коды:
00:00 - Начало
00:30 - Что мы сделаем за урок?
01:19 - Установка библиотеки
02:19 - Создание проекта
03:03 - Работа с OpenCV
04:45 - Считывание данных
05:35 - Формирование надписей
07:07 - Заключительная часть
✔ Сообщество программистов: itproger.com/
✔ -------------
Вступай в группу Вк - prog_life 🚀
Группа FaceBook - goo.gl/XW0aaP
Инстаграм itProger: / itproger_official
Instagram: / gosha_dudar
Telegram: t.me/itProger_official
Twitter - / goshadudar
- Уроки от #GoshaDudar 👨🏼‍💻
- Все уроки по хештегу #goshaLessons

КОМЕНТАРІ • 102

@user-gd6dm2xp1p 3 роки тому ⁺¹¹
Нету файла для скачивания pytesseract ocr на сайте пишет что нет актуальной версии для установки что делать?
@hornylucenro666 3 роки тому ⁺⁴
Круто новое видео от Гоши)
@blwashere 3 роки тому ⁺²⁴
можно поступить проще: в терминале(cmd) установить pip и написать: pip install tesseract
@musa_usmanov 3 роки тому ⁺²
pip install opencv-python
@blwashere 3 роки тому ⁺²
@@musa_usmanov Так тоже ожно)
@timofey-0307 Рік тому
Это не так работает. Нужно проинсталлировать библиотеку + установить tesseract на компьютер
@user-lu8vw1ud1f 3 роки тому ⁺³
Спасибо все супер. Скажи можно ли из js передать картинку в питон который обрабатывает фото и результат отдаёт назад в js?
@konstantin9888 3 роки тому
Гоша. скинь пжл ссылки на репозиторий, тех программ которые ты использовал в качестве примера при работе с OpenCV
@43oiurtjkn9gfds8y98r 3 роки тому ⁺¹
Спасибо
@gennady3935 3 роки тому
Может кто подсказать, в AWS Textract можно написать price и он выведет только стоимость если она указана, т.е. сопоставляет данные и выводит именно тот текст, который нам нужен. В tesseract есть такое?
@user-lm6ch4zi7y 3 роки тому
Спасибо.
@olzhasshabdenov3362 3 роки тому
Гоша, красавчег👍
@msmesh5666 3 роки тому ⁺¹
Это даже не он сделал - ua-cam.com/video/6DjFscX4I_c/v-deo.html
@user-gs6of5vv6r 3 роки тому ⁺¹⁰
Сделай курс по data science на python или про ИИ на python. В крайнем случае про нейросеть.
@YanchikDev 3 роки тому ⁺¹
Жду видео про template matching
@gooddo1852 3 роки тому ⁺³
Ты супер! Продолдай в томже духе
@user-it8bb2zb5q 3 роки тому ⁺²
ого круто.
@TblKBA_Z 2 роки тому
помогите пж, нужно создавать скрины определённой области, загружать их в скрипт, находить символы и их-же писать (как send в ahk, не в командную строку)
@user-hp1xs6jp4z 2 роки тому
Того файла на сайте нету про Tesseract
@konstbespr619 3 роки тому ⁺⁹
Гоша, сделай пожалуйста видео на тему интеграции оплаты в телеграм бота! Нигде нет инфы на эту тему
@Cloudy-zq5yx 3 роки тому
Есть.
@konstbespr619 3 роки тому
@@Cloudy-zq5yx линк?
@Cloudy-zq5yx 3 роки тому
@@konstbespr619 physics is simple aiogram набери
@MrDlop 3 роки тому
Может там как в ВК боте?
@MrDlop 3 роки тому
Я просто не помню, давно этим не интересовался
@MrFog124 3 роки тому
Давай видос по считыванию потокового видео с программы и распознавании собственных объектов
@user-uu9wg1yj2t 2 роки тому
а можно с нескольких картинок собирать данные в Excel
@XEROS282 2 роки тому
А как сканировать баркоды через Django?
@dictatorsupreme5447 3 роки тому
Гоша, сделай пожалуйста видео на тему Перенос HTML сайта на WordPress ?
@villainmadless1503 3 роки тому ⁺³
OCR же, OCR!
@user-gd6dm2xp1p 3 роки тому
Гошаааа видео супер но у меня проблема. Тесеракт поставился а вот с opencv проблемы. При написании просто в терминале пайчарма через pip выдаёт ошибку. Проблема с логами. Я не особо сведующий в логировании да и вообще в программировании. Прошу помощи либо у тебя либо друзья подписчики подскажите что сделать чтобы установить opencv. Заранее спасибо
@vladdarf2356 Рік тому
получилось?
@user-ps9rp7bp3t 3 роки тому
Ребят подскажите что делать вылазит вот эта ошибка
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
cv2.error: OpenCV(4.4.0) /private/var/folders/nz/vv4_9tw56nv9k3tkvyszvwg80000gn/T/pip-req-build-2rx9f0ng/opencv/modules/imgproc/src/color.cpp:182: error: (-215:Assertion failed) !_src.empty() in function 'cvtColor'
@hinomuratomisaburo4901 3 роки тому
фотку название файла обрежь коротким название сделай типо temp.png
@user-ps9rp7bp3t 3 роки тому
@@hinomuratomisaburo4901 не получилось
@imperria392 2 роки тому
тоже самое, ты если понял как это сделать скажи мне пожалуйста
@imperria392 2 роки тому
вообщем я понял, там к нему нужно путь написать
@baukaalimgazy2989 3 роки тому
Круто, у меня вчера была идея сделать комментатор бота ВК с искусственным интеллектом который считывает данные с поста и пишет наиболее подходящий коммент и через определенное время проверять сколько лайков набралось и в зависимости от кол-ва лайков менять веса и другие параметры нейросети, но я конечно же отказался от этой идеи, так как не знал считывать текст с картинки и множество других проблем, вот и решена одна проблема, если другие тоже сами по себе решатся, то может сделаю)
@NeuralAIM 3 роки тому ⁺¹
Зачем тебе тогда нейросеть? Парсер странички нужен для получения данных, так быстрее, точнее и менее ресурсозатратнее. Не быть тебе программистом)
И уж даже если ты и накодишь нейронку (Даже через тот же tensor) то тебе этого не хватит (Она все равно будет тупой, сколько бы ты данных не вливал) А данных для обучения нужно больше чем пару тысяч фраз...
@puturoi 3 роки тому
судя по твоему комменту, не особо ты сечешь, как работает нс, бот и т.д. Чтобы считать текст из поста вообще нвхрен не нужен computervision c tesseractom.
@baukaalimgazy2989 3 роки тому
@@NeuralAIM лол нейросеть из видео нужен, чтобы разпознать текст из картинок, а в ВК большинство постов в виде картинки. И я написал в комменте что ещё много заморочек кроме этого, но для генерации комментария GMT2 или 3, который может генерировать текст или статью а не то что коммент, просто если ему дать тему. Или можно ещё что то самому придумать.
@baukaalimgazy2989 3 роки тому
@@puturoi лол, я же написал в "ВК", в ВК много постов в виде картинки, и там текст в картинке и либа с этого видео только для того что распознать текст с постов в виде картинки. И я ещё я дополнил что много проблем кроме распознавания текстов и ТД. И я хоть и практический не делал нормальные проекты с нейросетями, но знаю как сделать перцептрон и обратное распространение ошибки, и знаю какие ограничения у вк, у официального или у неофициальных VK API для бота и с ними тоже работал, делал разных ботов ВК
@stoparb357 3 роки тому
@@baukaalimgazy2989 а, ты тип хочешь быть самым первым комментатором под постами чи шо
@zemf4you731 3 роки тому ⁺²
Параметры запуска тессеракта абсолютно не за то отвечают, что ты сказал. Oem - способ распознавания, psm (page segmentation mode) - режим сегментации страницы (в основном тессеракт с документами работает, при выщове помощи можно просмотреть все режимы сегментации)
Вместо enumerate и проверку индекса можно было сделать срез, так как нам всё равно необходимо будет хранить считанные данные в памяти, нет смысла пытаться сохратить итератор
@amidl Рік тому ⁺¹
Больше всего меня удивило, что автор использует аббревиатуру ORC, хотя общепринятой является OCR (о чем автор даже в названии библиотеки мог увидеть).
@casuale1200 3 роки тому
круть
@sergozar 2 роки тому
А как распознать символы типо "·ê ·Ë· »ê ³ ·³¼ ·Ë"?
@VladKochetov 3 роки тому
@Гоша Дударь, попробуй сделать урок по numba
@kirill_bykov 3 роки тому ⁺³
6:02 ну зачем? Делается слайс [1:] и всё.
@dmitriy2502 2 роки тому
Здравствуйте! А подскажите, можно ли этим методом распознавать цифры из потока видео? Например спортивное электронное табло с временем, время минуты +секунды?
@unknown_youtube_user 2 роки тому
Метод показанный в видео работает с картинками, если ты разработаешь программу которая будет делать скриншоты и вставлять для считывания, то вполне возможно.
@diasoralbekov6465 3 роки тому
где ссылка на виндовс инсталер
@shadowcode7752 3 роки тому ⁺¹
Запишы курс по rust.
@sunmaxplay6491 3 роки тому
как быть с 4 строчкой на линуксе?
@user-ni9oh7en4d 3 роки тому
Не нужна
@user-tj4we7hk9d 3 роки тому
Уху питон 🐍
@zaralx 3 роки тому
Блен ты прям вот во время как раз пишу прошу для бота в игре
@DictorDialog Рік тому
Всё это будет работать пока фон под текстом не будет пёстрым
@CalmVideo 3 роки тому ⁺¹
Всё конечно очень круто, но до того, чтобы понять, мне далековато. :)
Хочу тоже этому научиться (создавать нейросети), но пока чёт не очень получается, но ничего!
@rustc2p256 3 роки тому
Для начало изучи основы
@CalmVideo 3 роки тому
@@rustc2p256 , стараюсь.
@kirillusenko 3 роки тому
Это сложно, но вот курс по которому я пытался изучать tensorflow: ua-cam.com/play/PLtPJ9lKvJ4oiz9aaL_xcZd-x0qd8G0VN_.html
@CalmVideo 3 роки тому
@@kirillusenko , спасибо!
@user-eq5dp5lj5t 3 роки тому
Когда будет видио про создания игр?
@User-S05 3 роки тому ⁺¹
У него этих видео жопой ешь
@stariy_bog 3 роки тому ⁺³
Как сделать что бы распознавал русский текст ?
@the..egoisto 3 роки тому
Он же сказал что надо выбрать при загрузке и русский
@stariy_bog 3 роки тому
@@the..egoisto скачал а где подключить
Подключаю после конфига выдает ошибку
@Dikobrother 3 роки тому ⁺¹
@@stariy_bog Там где конфиг он подключал пишешь , lang='rus'. Перед эти закидываешь файл с языком в папку tessdata с самим тессерактом
@user-lq6ey5cz3c 3 роки тому ⁺¹
А она может комбинировать языки? К примеру код естественно написан на английском языке ,но у него есть комментарии на русском.
@mikelieber7256 3 роки тому
Да, можно. На C#, если воспользоваться библиотекой для тессеракта, ты можешь при инициализации тессеракта указать, например, RUS+ENG, но качество OCR будет чуть ниже.
@qwer5822 3 роки тому ⁺¹
Видео о том как взломать чужой компьютер - ua-cam.com/video/XtMgEfcZgZo/v-deo.html
@Lucerbius 5 місяців тому ⁺¹
ОэрСи, боже, чувак не может три буквы OCR прочитать в правильном порядке...
А по уроку выпадает ошибка:
cv2.error: OpenCV(4.8.1) D:\a\opencv-python\opencv-python\opencv\modules\highgui\src\window.cpp:1272: error: (-2:Unspecified error) The function is not implemented. Rebuild the library with Windows, GTK+ 2.x or Cocoa support. If you are on Ubuntu or Debian, install libgtk2.0-dev and pkg-config, then re-run cmake or configure script in function 'cvShowImage'
@L3M-carx 22 дні тому
А ты не лучше, почитать ошибку можешь а не в комы вставлять. Переустанови библиотеку блять умник
@a1exlovser136 3 роки тому
digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.02-20180621.exe возможно вот этот файл нужный
@irgendwer234 3 роки тому ⁺¹
Cnacubo
@sergeisuslov773 7 місяців тому
Сами же говорите оптикал кхеректал рекгнишн, а потом аббревиатура меняет порядок символов на о-эр-си, когда на самом деле оно о-си-ар
@KuKuRuuZa 2 роки тому ⁺²
И не ORC а правильно OCR
@dedpihto680 Рік тому ⁺¹
из 7 минутного видео полторы минуты реклама и никчемное вступление, потом еще и посреди ролика впихнул рекламу. топчик
@wad_code 3 роки тому
Начал с ORC закончит RAC
@yes_ss Рік тому
PermissionError: [WinError 5] Отказано в доступе
@pirozhekN 3 роки тому
Тессеракт орк
@nikolaydd6219 3 роки тому ⁺¹
Но ведь не удобно работать с Питоном, гораздо удобней было бы сделать программу с интерфейсом, окном и кнопками .
@nikolaydd6219 3 роки тому ⁺³
Тесеракт довольно хреновое решение. Сам им пользуюсь и проблем с ним - полно. Хорошее решение это Yandex Vision, но капец какой дорогой.
@PythononPapyrusRU 3 роки тому
Круто!
Неужели ты не любишь его😭😭??? Я про Python. А если и любишь, то почему не подписан на мой канал? Исправь это🤙😎
@User-S05 3 роки тому
У тебя как то разрозненно всё. Я не очень люблю питухон, но могу сказать, что нужно тебе делать видео более подробные по нему. Расскажи про всё что знаешь. Smtplib, json, datetime, request, tkinter, socket, os, time. Сними самую подробную серию видео по питухону на рутубе и я думаю добьёш 1млн подписчиков к весне 21!!!
@pavelkross 3 роки тому
даешь тоже самое только на C#!!
@user-qi1hs7jb6t 2 роки тому
Мой коммент будет явно удален, но что я хочу сказать: Гоша, тебе простительно что ты не ученый в сфере компьютерного зрения и машинного обучения. Но готовься пожалуйста лучше. Многая терминология неточна или неверная + про функции питона немного неверно говоришь)
@user-st9hk2pp3o 3 роки тому
Плохо работает с русским языком.
@tarantinPipka 27 днів тому
твои видео все до единого не рабочие , не заработало не чего .. хз , я уже скоко их не смотрел.. вродь пробелма в опен сиви ... она у твоему коде кривая ..щас комент вставлю что пиет джипити
@tarantinPipka 27 днів тому
Кажется, возникла проблема с библиотекой OpenCV, которая используется для отображения изображений. Ошибка указывает на то, что функция cv2.imshow() не реализована. Это может быть вызвано неправильной установкой или версией OpenCV.
Попробуйте переустановить OpenCV или обновить его до последней версии. Возможно, вам также потребуется установить зависимости для поддержки графического интерфейса, если вы используете его на Windows.
@user-jn3ll7ho7q 2 роки тому
дохлый движок он распознает с кракозябрами.. это капитализм.. хорошие движки платные.. тоже с говорилками...про браузеры вообще молчу.. по моему нам слили чтобы началась гражданская война до того раздражает тупизм некоторого ПО ..вместо нормального функционала команд в консоли приходится лезть черт знает куда...

Наступне

Автоматичне відтворення

Изучение Python OpenCV / Урок #2 - Работа с изображениями и видео