Распознавание текста с картинки на Python | Оптическое распознавание символов Tesseract
Вставка
- Опубліковано 9 сер 2020
- В данном видео разбираем как можно распознавать текста на разных языках с картинок при помощи Python и tesseract.
💰 Поддержать проект:
yoomoney.ru/to/410019570956160
🔥 Стать спонсором канала:
/ @pythontoday
****Команды****
Установка tesseract Linux:
sudo apt install tesseract-ocr
Установка tesseract Windows:
tesseract-ocr.github.io/tessd...
Опции конфига tesseract:
help.ubuntu.ru/wiki/tesseract
Разные словари tesseract:
github.com/tesseract-ocr/tess...
Скачать словарь в Linux:
wget github.com/tesseract-ocr/tess...
Переместить словарь в корень tesseract на Linux:
sudo mv -v rus.traineddata /usr/share/tesseract-ocr/4.00/tessdata/
****Ссылки****
Пишем Telegram бота на Python + Загружаем Telegram бота на сервер(хостинг):
• Пишем Telegram бота на...
Плейлист по парсингу сайтов на Python:
• Парсинг/Scraping
Код проекта на github:
github.com/pythontoday/instag...
Telegram: t.me/python2day
****Соц.сети****
Telegram: t.me/python2day
Моя дипломная работа, которую я делал 3 месяца за 4 минуты на ютуб. Спасибо.... я немного шокирован.
:)) Это на ютубе всё быстро, работа кипит за кулисами.
:D
Как же я тебе понимаю, тоже самое... Я когда еще учился в 10 классе, делал школьный проект и почти с нуля писал писал фреймворк для распознавания текста, но в итоге я нашел pytesseract и сэкономил себе много времени.
@@aveomathman5532 Написать с нуля фреймворк для распознавания текста в моих глазах круче, чем использовать готовую библиотеку)
@@user-gx8gk9ur1n ну тогда тебе стоит изобрести велосипед
Благодарю за познавательный контент здесь и в телеграме.
такие видео добавляют мотивации обучаться программированию с огромным интересом) спасибо, Автор! однозначно подписка!
Благодарю за фидбэк! Рад что полезно
отличный урок! спасибо за гайд!👍🤘
Спасибо за фидбэк 👍
Всё просто и понятно, как всегда!)
Благодарю!
Хочу выразить огромную благодарность за данное видео)))) Я начинаю первые шаги в программировании. Ролик 4 мин, я просидела почти 2 часа, вникала, что куда и как, но разобралась и это так приятно))) Спасибо)
Большое спасибо за фидбэк! Рад что было полезно)
Спасибо вам огромное! Вы лучший!
Благодарю за фидбэк!
Качественно. Спасибо.
Спасибо за фидбэк 💪
Круто.... Контент топчик! Так держать
Благодарю за фидбэк
Долго искал решение для распознавания текста с фото. Можно сделать самому камеру + микроконтроллер, там уже вшит чип, но есть свои тонкости. Есть уже готовый софт, платный, но работает только в определенных условиях и с конкретными процессорами. Есть еще камеры за 10-18к евро. А есть вот это видео, где за 4 минуты составляется база для моего решения. Удивительно, благодарю )
Спасибо за фидбэк) Заказал с Ali raspberry pi + камеру, тоже буду практиковаться с распознованием фото/видео 👍
Спасибо!
Как же сильно мне помогло это видео, я долго долбался, чтобы добавить Tesseract в переменную среды PATH, так и не получилось, хотя вроде бы все правильно сделал.. И тут оказывается, что все можно было решить одной строчкой кода, я уже и не верил, что получится, спасибо огромное автору!!!
Большое спасибо за фидбэк! Рад что видео полезно!
автор очень хороший и понятный контент красава
Благодарю 💪
Да. Потрясающе конечно)))
Благодарю 😀
Использовал тессеракт для распознования текста на скриншотах ошибок которые пользователи в жалобах пишут. Это была вторая супень отбора) НА первой ступени был pyimage для определения приложения, где возникала ошибка по шаблону картинки.
Короче хотели сделать ИИ для помощи в решении проблемы, а сделали удобный сепаратор для машрутизаци заявок по проблемам от пользователей.
Ну так ведь получился своего рода тоже ИИ :) А задача с определением приложения по скриншоту заинтересовала. Не задумывался, брал всегда лица, авто, зверей и т.д.
Вот она магия python
Круто 😃👈👍
Благодарю
спасибо
Отличное видео спасибо! только вопрос не совсем могу понять, что такое oem ? и что такое psm я нашел в документации, но psm N - N принимает параметры от 1 до 10, почему на видео было psm 13
очень поверхностно
прикольно.
Видео супер, если всё будет работать без багов, нам не придётся использовать API или ИИ для своего проекта, спасибо огромное
Спасибо за фидбэк. Да вроде багов не наблюлось. Есть настройки которые можно подобрать под себя.
Не первый день смотрю Ваши видео. Начинающий разработчик на python с базой знаний на с++. Подскажите несколько книг по которым Вы обучались. Я лично читаю (автоматизация рутинных задач с помощью python, и скраппинг на python). Просто хотелось бы больше узнавать за модули и их спецификации в работе. Заранее спасибо!)
Привет, лучшей книгой по Python для новичков считаю "Изучаем Python. Программирование игр, визуализация данных, веб-приложения [3-е издание]" Много практики с актуальным кодом.
Ух. Спасибо. А то я почитал файл ридми тессеракта, а там надо билд делать из командной строки, колдовать, бубен найти и всё это так сложно, что я расплакался и сложил лапки
Рад что полезно, благодарю за фидбэк!
Возможно ли при помощи этого обходить капчу селениумом?
Например в Mail
при отдачи команды sudo apt install tesseract-ocr на мак пишет ThЖe operation couldn’t be completed. Unable to locate a Java Runtime that supports apt.
Братишка жду видосы про инстаграм бот, спасибо!
В процессе
Здравствуйте. Нет ли планах записать урок по обучению Tesseract новым шрифтам? Находил в интернете несколько англоязычных уроков, но когда создаю свою обученную модель, качество распознавания практически не улучшается. Возможно есть какие-то особенности для обучения русским шрифтам? Или нужна только определенная версия программы?
Приветствую, не думал об этом. Стараюсь где только можно избегать работы с кириллицей, ибо это боль для всего мира. English 👍
бро, каким текстовым редактором пользуешься? сублайн текст?
Текстовым в смысле IDE? PyCharm one love
Спасибо за видео. Подскажите можно ли картинку закинуть с помощью js в питон, который обработает и результат передаст назад в js?
Спасибо за фидбэк. Можно придумать какое-нить api с бекендом на DRF например, из js отправлять запрос, обрабатывать на python и отдавать результат, js'ом соответственно забирать.
@@PythonToday такой вопрос простые текстовые капчи без шумов. Лучше делать нейронкой? Капча типа 5+3, 6+2, 1+1, 8+7. Они типа рукописного текста надо получить их обычными числами (эти примеры на одной картинке)
Думаю для "текстовые капчи без шумов" вполне подойдет обычный tesseract ocr, зачем грузить систему.
А если текст немного изменён?
Например стёртая линия?
а как сделать правильное распознавание конца строки и абзаца? чтобы текст был сплошной, без ненужных переносов.
в WINDOWS тоже можно скачивать языки и закидывать в папку с языками
как делать так чтоб другой алгоритм или другой модуль мог выплнять при обнаружение, или другими словами как использывать в условиях
Отличный урок!
Может быть Вы знаете как справиться со следующей задачей:
Я хочу найти на изображении определенную фразу, например "Мой компьютер", получить координаты центра этой фразы, чтобы затем кликнуть по ней мышкой.
Это требуется для АВТОКЛИКЕРА по определенным кнопкам. Вы можете спросить - А не проще ли искать кнопку по её изображению? Конечно проще, если изображение кнопки не меняется. Но в некоторых играх изображения кнопок часто меняются, а названия остаются без изменений. Поэтому хотелось бы попробовать искать кнопку через распознавание текста.
Привет спасибо за фидбэк. Я подобного не делал, но это 100% возможно средствами Python. Попробуй почитать про бибилиотеку openCV, возможно там будет решение.
@@PythonToday Благодарю за совет, попробую разобраться с openCV.
Используй библиотеки компьютерного зрения Google cloud vision. Гугл предоставляет API, они не бесплатные. Гугл может распознавать сложные тексты на различных изображениях и возвращать координаты текстовых надписей, к которым можно привязаться. Первые 1000 запросов в месяц бесплатны, далее 1.5$ за каждые 1000 запросов.
@@farinsaifutdinov5534 благодарю, но я уже решил этот вопрос с помощью opencv + pytessaract. Хорошо распознаёт печатный текст и даёт его координаты.
@@autopilot_youtube Возможно ли написать решения для распознавания простой капчи из 4 цифр?
Пайтон тудей лучший!!
Архи полезное видео
Можете помочь? У меня после строки появляется вот такой символ: ♀. Изменения config не помогают
Пожалуйста помоги!!! Как сделать image.open(все изображения из папки)
А где можно найти документацию по созданию своего OCR? Нигде, буквально никто ничего об этом не пишет, просто все толдычат про тессеракт или на форумах про keras-ocr, а это мое задание. С чего начать или как или самое главное что нужно в модель пихать, разительно не понятно, уже в депресссию с этого вхожу...
для каптчи подойдёт?
Привет а как сделать свою модель для англ языка если у тебя кастомный шрифт?
Привет, что значит "сделать свой модуль...". Тесеракт справляется с разными шрифтами, тем более английскими. Кидай пример картинки в чат, посмотрим.
Ребят, подскажите пожалуйста.
TESSERACT пригоден для цели:
Отфоткать на сяомишную смартфонную камеру 5-10 страниц (обычная книга с бумажными страницами) , выложить эти 5-10 файликов в папку и потом пройтись по ним циклом , выполняя попутно распознание текста на фото и его дальнейшую оцифровку (через данную библиотеку) с сохранением в отдельный файл: т.е. на выходе должно получаться 5-10 TXT файлов? Или же есть модули получше?
Поясню - у меня просто сомнения, что этот модуль будет корректно справляться с фото файлом ,в котором изображение целой книжной страницы.
Извините, если вопрос покажется глупым, ни разу просто с подобным не работал. Спасибо)
Пригоден, но есть средства лучше/удобнее. В выходные выйдет ролик.
@@PythonToday это замечательно. Спасибо, буду ждать! )
Виедо топ, но одна проблемка посмотрел его вот только и ссылки для версии на windows нету, что качать то?
Спасибо за фидбэк. Всё там есть, раздел Downloads >> tesseract-ocr.github.io/tessdoc/4.0-with-LSTM >>> Downloads archive on... и выбираешь последний доступный под винду. Но я бы делал на Linux, на винде тоже работало, но там вечно что-то не заводится.
У меня почему-то к определению текста добавляет значок женского пола. По какой причине такое может быть? В интернете такой информации не нашёл!
По ссылке в описании нету binaries для windows пишет что версия устарела где скачать актуальную?
Там в описании есть ссылка на инсталл 5-й версии
Неплохое решение. А если 100 картинок, 1000 картинок?
К примеру, интересует распарсить счёт на оплату. Вытащить из картинки контрагента, наименование позиций, цену, дату. Таких картинок очень много
нашел решение? какой цикл нужен чтобы программа перебирала много фоток в папке?
А как у тебя заработал тессеракт, если ссылка на ехе файл была закомментирована? Во всех туториалах ссылка на него обязательно и у меня без нее ничего не работало
У него мак, ало
'charmap' codec can't encode character '\ufb01' in position 241: character maps to
втф?
Windows?
@@PythonToday да,думаешь перейти на линукс?
😀 Избежишь многих проблем касаемых программирования. Если конечно не любитель unity + c#
@@PythonToday в том то и дело,учу c# ;)
А где ссылка в описании?
Почему-то при указании параметра lang='rus', tesseract вылетает. Прекращена работа программы... Есть у кого такая проблема?
Для этого нужно дополнительно скачать языки
Ты сейчас можешь удалить тессеракт и скачать по новой при этом поставив галочку на "additional language data.... " или что то такое
У меня не распознаёт цифры, только текст, либо в консоли ничего не пишет, либо выдаёт вот такой знак "♀". В чём проблема?
Нужно смотреть код. Кинь ссылку на проект и что за изображение интересно.
@@PythonToday Извините за беспокойство, но я разобрался, поигрался с цифрами "--psm 13", и всё заработало:)
@@plailet6118 Молодцом что сам разобрался 👍
Так и не понял как в Семерке запустить. В виртуальной среде добавлен, путь прописан но кричит на pytesseract.pytesseract, что "Cannot find reference 'pytesseract' in '__init__.py'", а на pytesseract.image_to_string - "Cannot find reference 'image_to_string' in '__init__.py'". Так и не понял, как это все дело запустить. Линукс пока не могу поставить
Не подскажу, не работал в виндоус. В гугле нет ответа?
@@PythonToday для Windows не густо. Потому что, если Python, то надо сидеть на Linux, ну или на Макоси, на худой конец, но не на Windows
Тому, кто столкнулся с той же проблемой, необходимо Tesseract устанавливать командами pip install tesseract, а потом pip install pytesseract. Также Tesseract должен быть установлен в Windows и внесен в виртуальное окружение
где взять исходный код?
В телеграм
Сфоткал крупным планом номер авто. Ничего не распознаёт. При некоторых параметрах может выдать абракадабру. И языки и конфиг менял. всё фигня выходит.
Я б добавил threshold
В документации из описания ничего не сказано про флаг --oem
это режим работы движка, он и так по умолчанию 3, но вот остальные режимы:
0 = Original Tesseract only.
1 = Neural nets LSTM only.
2 = Tesseract + LSTM.
3 = Default, based on what is available.
конечно круто но есть одна маленькая проблема, этот текст нельзя использывать при обнаружение лица
Неплохие видео, но очень трудно читать, особенно при небольшом разрешении. Сделайте шрифт покрупнее и цветовую схему более контрастную - будет гораздо лучше.
Спасибо за фидбэк. Шрифт поставил 16, если сделаю ещё больше, на экране будет по 20 строк отображаться с длиной в 40 символов. Будет совсем не видно и не удобно показывать длинный код.
А тисиракт ето библіотека которая уже сама решает графіческиє задачі
а дизлайк авито поставили)))
Походу 😀
А смысл этой практики на Python если ни одного доработанного решения нет. Где например аналог файнридер? До сих пор пайтон дальше командной строки не пошёл.
А у меня мак что делать?
А в чем проблема? google "How to install tesseract on mac". Вроде ничего сложного
А у меня на винде не работает :( и я не понимаю что не так и как всё должно работать. Хотелось бы более подробный урок
Брось этот кусок г и установи один из дистрибутивов unix, хотя бы на виртуалку. Многих проблем касаемо программирования избежишь в дальнейшем.
у меня завелось. пропиши переменные среды
Пингвинус, это ты?
Шта?
@@PythonToday у тебя голос немного похож на автора канала "пингвинус"
Не, точно не я
не работает
Работает
@@PythonToday
sudo apt install tesseract-ocr-rus. Так работает.
как сделай свой шрифт сдела тутор пожалуйста