Распознавание текста с картинки на Python | Оптическое распознавание символов Tesseract

PythonToday

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 9 сер 2020
В данном видео разбираем как можно распознавать текста на разных языках с картинок при помощи Python и tesseract.
💰 Поддержать проект:
yoomoney.ru/to/410019570956160
🔥 Стать спонсором канала:
/ @pythontoday
****Команды****
Установка tesseract Linux:
sudo apt install tesseract-ocr
Установка tesseract Windows:
tesseract-ocr.github.io/tessd...
Опции конфига tesseract:
help.ubuntu.ru/wiki/tesseract
Разные словари tesseract:
github.com/tesseract-ocr/tess...
Скачать словарь в Linux:
wget github.com/tesseract-ocr/tess...
Переместить словарь в корень tesseract на Linux:
sudo mv -v rus.traineddata /usr/share/tesseract-ocr/4.00/tessdata/
****Ссылки****
Пишем Telegram бота на Python + Загружаем Telegram бота на сервер(хостинг):
• Пишем Telegram бота на...
Плейлист по парсингу сайтов на Python:
• Парсинг/Scraping
Код проекта на github:
github.com/pythontoday/instag...
Telegram: t.me/python2day
****Соц.сети****
Telegram: t.me/python2day

КОМЕНТАРІ • 130

@user-iy6bf5un2m 3 роки тому ⁺⁹¹
Моя дипломная работа, которую я делал 3 месяца за 4 минуты на ютуб. Спасибо.... я немного шокирован.
@PythonToday 3 роки тому ⁺³⁰
:)) Это на ютубе всё быстро, работа кипит за кулисами.
@polunochNY 3 роки тому
:D
@aveomathman5532 2 роки тому
Как же я тебе понимаю, тоже самое... Я когда еще учился в 10 классе, делал школьный проект и почти с нуля писал писал фреймворк для распознавания текста, но в итоге я нашел pytesseract и сэкономил себе много времени.
@user-gx8gk9ur1n 2 роки тому ⁺⁷
@@aveomathman5532 Написать с нуля фреймворк для распознавания текста в моих глазах круче, чем использовать готовую библиотеку)
@Chel1k7 Рік тому
@@user-gx8gk9ur1n ну тогда тебе стоит изобрести велосипед
@creatorwizard383 3 роки тому ⁺¹²
Благодарю за познавательный контент здесь и в телеграме.
@chiklfkif 2 роки тому ⁺⁴
такие видео добавляют мотивации обучаться программированию с огромным интересом) спасибо, Автор! однозначно подписка!
@PythonToday 2 роки тому
Благодарю за фидбэк! Рад что полезно
@GreekkAlex 3 роки тому ⁺²
отличный урок! спасибо за гайд!👍🤘
@PythonToday 3 роки тому
Спасибо за фидбэк 👍
@user-po3sg7vn4y 2 роки тому
Всё просто и понятно, как всегда!)
@PythonToday 2 роки тому
Благодарю!
@user-bw9zg3ko2h 9 місяців тому ⁺²
Хочу выразить огромную благодарность за данное видео)))) Я начинаю первые шаги в программировании. Ролик 4 мин, я просидела почти 2 часа, вникала, что куда и как, но разобралась и это так приятно))) Спасибо)
@PythonToday 9 місяців тому
Большое спасибо за фидбэк! Рад что было полезно)
@tonik5992 3 роки тому
Спасибо вам огромное! Вы лучший!
@PythonToday 3 роки тому
Благодарю за фидбэк!
@user-august84 3 роки тому
Качественно. Спасибо.
@PythonToday 3 роки тому
Спасибо за фидбэк 💪
@lexluter963 3 роки тому
Круто.... Контент топчик! Так держать
@PythonToday 3 роки тому
Благодарю за фидбэк
@0xdeadc0de_Gameplays 3 роки тому ⁺²
Долго искал решение для распознавания текста с фото. Можно сделать самому камеру + микроконтроллер, там уже вшит чип, но есть свои тонкости. Есть уже готовый софт, платный, но работает только в определенных условиях и с конкретными процессорами. Есть еще камеры за 10-18к евро. А есть вот это видео, где за 4 минуты составляется база для моего решения. Удивительно, благодарю )
@PythonToday 3 роки тому
Спасибо за фидбэк) Заказал с Ali raspberry pi + камеру, тоже буду практиковаться с распознованием фото/видео 👍
@caiman101 3 роки тому
Спасибо!
@alexrostov2064 Рік тому
Как же сильно мне помогло это видео, я долго долбался, чтобы добавить Tesseract в переменную среды PATH, так и не получилось, хотя вроде бы все правильно сделал.. И тут оказывается, что все можно было решить одной строчкой кода, я уже и не верил, что получится, спасибо огромное автору!!!
@PythonToday Рік тому
Большое спасибо за фидбэк! Рад что видео полезно!
@senpai3274 3 роки тому
автор очень хороший и понятный контент красава
@PythonToday 3 роки тому
Благодарю 💪
@user-kr6gv7sg2p 3 роки тому
Да. Потрясающе конечно)))
@PythonToday 3 роки тому
Благодарю 😀
@TheSergWolf 3 роки тому ⁺³
Использовал тессеракт для распознования текста на скриншотах ошибок которые пользователи в жалобах пишут. Это была вторая супень отбора) НА первой ступени был pyimage для определения приложения, где возникала ошибка по шаблону картинки.
Короче хотели сделать ИИ для помощи в решении проблемы, а сделали удобный сепаратор для машрутизаци заявок по проблемам от пользователей.
@PythonToday 3 роки тому ⁺²
Ну так ведь получился своего рода тоже ИИ :) А задача с определением приложения по скриншоту заинтересовала. Не задумывался, брал всегда лица, авто, зверей и т.д.
@user-fz5ym3wv1e 3 роки тому ⁺²
Вот она магия python
@hinomuratomisaburo4901 3 роки тому
Круто 😃👈👍
@PythonToday 3 роки тому
Благодарю
@hanckhanck8376 3 роки тому
спасибо
@stannisfoch8746 3 роки тому
Отличное видео спасибо! только вопрос не совсем могу понять, что такое oem ? и что такое psm я нашел в документации, но psm N - N принимает параметры от 1 до 10, почему на видео было psm 13
@jared_aikikijared_aikiki3021 9 місяців тому
очень поверхностно
@pcfixnorth3323 3 роки тому
прикольно.
@_terror_7312 3 роки тому ⁺³
Видео супер, если всё будет работать без багов, нам не придётся использовать API или ИИ для своего проекта, спасибо огромное
@PythonToday 3 роки тому ⁺²
Спасибо за фидбэк. Да вроде багов не наблюлось. Есть настройки которые можно подобрать под себя.
@beatzamshanatoliy1156 3 роки тому ⁺²
Не первый день смотрю Ваши видео. Начинающий разработчик на python с базой знаний на с++. Подскажите несколько книг по которым Вы обучались. Я лично читаю (автоматизация рутинных задач с помощью python, и скраппинг на python). Просто хотелось бы больше узнавать за модули и их спецификации в работе. Заранее спасибо!)
@PythonToday 3 роки тому ⁺⁵
Привет, лучшей книгой по Python для новичков считаю "Изучаем Python. Программирование игр, визуализация данных, веб-приложения [3-е издание]" Много практики с актуальным кодом.
@span4ev Рік тому
Ух. Спасибо. А то я почитал файл ридми тессеракта, а там надо билд делать из командной строки, колдовать, бубен найти и всё это так сложно, что я расплакался и сложил лапки
@PythonToday Рік тому
Рад что полезно, благодарю за фидбэк!
@yosh2525 3 роки тому ⁺¹
Возможно ли при помощи этого обходить капчу селениумом?
Например в Mail
@NikolayN707 3 роки тому ⁺¹
при отдачи команды sudo apt install tesseract-ocr на мак пишет ThЖe operation couldn’t be completed. Unable to locate a Java Runtime that supports apt.
@user-vu7hq4ce4w 3 роки тому ⁺³
Братишка жду видосы про инстаграм бот, спасибо!
@PythonToday 3 роки тому
В процессе
@zapak5491 3 роки тому
Здравствуйте. Нет ли планах записать урок по обучению Tesseract новым шрифтам? Находил в интернете несколько англоязычных уроков, но когда создаю свою обученную модель, качество распознавания практически не улучшается. Возможно есть какие-то особенности для обучения русским шрифтам? Или нужна только определенная версия программы?
@PythonToday 3 роки тому
Приветствую, не думал об этом. Стараюсь где только можно избегать работы с кириллицей, ибо это боль для всего мира. English 👍
@MetamorphosisMetamorphosis-s 3 роки тому
бро, каким текстовым редактором пользуешься? сублайн текст?
@PythonToday 3 роки тому ⁺²
Текстовым в смысле IDE? PyCharm one love
@user-lu8vw1ud1f 3 роки тому
Спасибо за видео. Подскажите можно ли картинку закинуть с помощью js в питон, который обработает и результат передаст назад в js?
@PythonToday 3 роки тому
Спасибо за фидбэк. Можно придумать какое-нить api с бекендом на DRF например, из js отправлять запрос, обрабатывать на python и отдавать результат, js'ом соответственно забирать.
@user-lu8vw1ud1f 3 роки тому
@@PythonToday такой вопрос простые текстовые капчи без шумов. Лучше делать нейронкой? Капча типа 5+3, 6+2, 1+1, 8+7. Они типа рукописного текста надо получить их обычными числами (эти примеры на одной картинке)
@PythonToday 3 роки тому
Думаю для "текстовые капчи без шумов" вполне подойдет обычный tesseract ocr, зачем грузить систему.
@kevinzero8855 3 роки тому
А если текст немного изменён?
Например стёртая линия?
@RailSalimov 3 роки тому
а как сделать правильное распознавание конца строки и абзаца? чтобы текст был сплошной, без ненужных переносов.
@woxaz9076 3 роки тому ⁺¹
в WINDOWS тоже можно скачивать языки и закидывать в папку с языками
@vitalimanjur8563 Рік тому
как делать так чтоб другой алгоритм или другой модуль мог выплнять при обнаружение, или другими словами как использывать в условиях
@autopilot_youtube 3 роки тому
Отличный урок!
Может быть Вы знаете как справиться со следующей задачей:
Я хочу найти на изображении определенную фразу, например "Мой компьютер", получить координаты центра этой фразы, чтобы затем кликнуть по ней мышкой.
Это требуется для АВТОКЛИКЕРА по определенным кнопкам. Вы можете спросить - А не проще ли искать кнопку по её изображению? Конечно проще, если изображение кнопки не меняется. Но в некоторых играх изображения кнопок часто меняются, а названия остаются без изменений. Поэтому хотелось бы попробовать искать кнопку через распознавание текста.
@PythonToday 3 роки тому ⁺¹
Привет спасибо за фидбэк. Я подобного не делал, но это 100% возможно средствами Python. Попробуй почитать про бибилиотеку openCV, возможно там будет решение.
@autopilot_youtube 3 роки тому ⁺¹
@@PythonToday Благодарю за совет, попробую разобраться с openCV.
@farinsaifutdinov5534 3 роки тому
Используй библиотеки компьютерного зрения Google cloud vision. Гугл предоставляет API, они не бесплатные. Гугл может распознавать сложные тексты на различных изображениях и возвращать координаты текстовых надписей, к которым можно привязаться. Первые 1000 запросов в месяц бесплатны, далее 1.5$ за каждые 1000 запросов.
@autopilot_youtube 3 роки тому
@@farinsaifutdinov5534 благодарю, но я уже решил этот вопрос с помощью opencv + pytessaract. Хорошо распознаёт печатный текст и даёт его координаты.
@pixer9994 2 роки тому
@@autopilot_youtube Возможно ли написать решения для распознавания простой капчи из 4 цифр?
@Neko-sr4wz Рік тому
Пайтон тудей лучший!!
@Poriks Рік тому
Архи полезное видео
@fastcode977 2 роки тому
Можете помочь? У меня после строки появляется вот такой символ: ♀. Изменения config не помогают
@Pavlev03 3 роки тому
Пожалуйста помоги!!! Как сделать image.open(все изображения из папки)
@Responsible_Show-off 3 місяці тому
А где можно найти документацию по созданию своего OCR? Нигде, буквально никто ничего об этом не пишет, просто все толдычат про тессеракт или на форумах про keras-ocr, а это мое задание. С чего начать или как или самое главное что нужно в модель пихать, разительно не понятно, уже в депресссию с этого вхожу...
@user-fx3go2ov8y Рік тому
для каптчи подойдёт?
@edwardssms2592 3 роки тому
Привет а как сделать свою модель для англ языка если у тебя кастомный шрифт?
@PythonToday 3 роки тому
Привет, что значит "сделать свой модуль...". Тесеракт справляется с разными шрифтами, тем более английскими. Кидай пример картинки в чат, посмотрим.
@user-ts7ef8fs5g 2 роки тому
Ребят, подскажите пожалуйста.
TESSERACT пригоден для цели:
Отфоткать на сяомишную смартфонную камеру 5-10 страниц (обычная книга с бумажными страницами) , выложить эти 5-10 файликов в папку и потом пройтись по ним циклом , выполняя попутно распознание текста на фото и его дальнейшую оцифровку (через данную библиотеку) с сохранением в отдельный файл: т.е. на выходе должно получаться 5-10 TXT файлов? Или же есть модули получше?
Поясню - у меня просто сомнения, что этот модуль будет корректно справляться с фото файлом ,в котором изображение целой книжной страницы.
Извините, если вопрос покажется глупым, ни разу просто с подобным не работал. Спасибо)
@PythonToday 2 роки тому
Пригоден, но есть средства лучше/удобнее. В выходные выйдет ролик.
@user-ts7ef8fs5g 2 роки тому
@@PythonToday это замечательно. Спасибо, буду ждать! )
@azazel1394 3 роки тому
Виедо топ, но одна проблемка посмотрел его вот только и ссылки для версии на windows нету, что качать то?
@PythonToday 3 роки тому
Спасибо за фидбэк. Всё там есть, раздел Downloads >> tesseract-ocr.github.io/tessdoc/4.0-with-LSTM >>> Downloads archive on... и выбираешь последний доступный под винду. Но я бы делал на Linux, на винде тоже работало, но там вечно что-то не заводится.
@demonstalker_game_developer 3 роки тому
У меня почему-то к определению текста добавляет значок женского пола. По какой причине такое может быть? В интернете такой информации не нашёл!
@user-gd6dm2xp1p 3 роки тому
По ссылке в описании нету binaries для windows пишет что версия устарела где скачать актуальную?
@dfkkg3453 3 роки тому
Там в описании есть ссылка на инсталл 5-й версии
@user-ks4lm9cn4k 2 роки тому ⁺¹
Неплохое решение. А если 100 картинок, 1000 картинок?
К примеру, интересует распарсить счёт на оплату. Вытащить из картинки контрагента, наименование позиций, цену, дату. Таких картинок очень много
@Adam_Blake Рік тому
нашел решение? какой цикл нужен чтобы программа перебирала много фоток в папке?
@kuaranir2440 Рік тому
А как у тебя заработал тессеракт, если ссылка на ехе файл была закомментирована? Во всех туториалах ссылка на него обязательно и у меня без нее ничего не работало
@PleerFol Рік тому
У него мак, ало
@asas7083 3 роки тому
'charmap' codec can't encode character '\ufb01' in position 241: character maps to
втф?
@PythonToday 3 роки тому
Windows?
@asas7083 3 роки тому
@@PythonToday да,думаешь перейти на линукс?
@PythonToday 3 роки тому
😀 Избежишь многих проблем касаемых программирования. Если конечно не любитель unity + c#
@asas7083 3 роки тому
@@PythonToday в том то и дело,учу c# ;)
@cashriser225 2 роки тому
А где ссылка в описании?
@bernardsoul8936 3 роки тому ⁺¹
Почему-то при указании параметра lang='rus', tesseract вылетает. Прекращена работа программы... Есть у кого такая проблема?
@khostq 3 роки тому
Для этого нужно дополнительно скачать языки
Ты сейчас можешь удалить тессеракт и скачать по новой при этом поставив галочку на "additional language data.... " или что то такое
@plailet6118 3 роки тому
У меня не распознаёт цифры, только текст, либо в консоли ничего не пишет, либо выдаёт вот такой знак "♀". В чём проблема?
@PythonToday 3 роки тому
Нужно смотреть код. Кинь ссылку на проект и что за изображение интересно.
@plailet6118 3 роки тому
@@PythonToday Извините за беспокойство, но я разобрался, поигрался с цифрами "--psm 13", и всё заработало:)
@PythonToday 3 роки тому
@@plailet6118 Молодцом что сам разобрался 👍
@python_cheatsheet_by_eugene 2 роки тому
Так и не понял как в Семерке запустить. В виртуальной среде добавлен, путь прописан но кричит на pytesseract.pytesseract, что "Cannot find reference 'pytesseract' in '__init__.py'", а на pytesseract.image_to_string - "Cannot find reference 'image_to_string' in '__init__.py'". Так и не понял, как это все дело запустить. Линукс пока не могу поставить
@PythonToday 2 роки тому
Не подскажу, не работал в виндоус. В гугле нет ответа?
@python_cheatsheet_by_eugene 2 роки тому
@@PythonToday для Windows не густо. Потому что, если Python, то надо сидеть на Linux, ну или на Макоси, на худой конец, но не на Windows
@python_cheatsheet_by_eugene 2 роки тому
Тому, кто столкнулся с той же проблемой, необходимо Tesseract устанавливать командами pip install tesseract, а потом pip install pytesseract. Также Tesseract должен быть установлен в Windows и внесен в виртуальное окружение
@user-uu9wg1yj2t 2 роки тому
где взять исходный код?
@PythonToday 2 роки тому
В телеграм
@user-ng7ok2qo5c 5 місяців тому
Сфоткал крупным планом номер авто. Ничего не распознаёт. При некоторых параметрах может выдать абракадабру. И языки и конфиг менял. всё фигня выходит.
@iamrussiancockeater 3 роки тому
Я б добавил threshold
@nargan1129 2 роки тому
В документации из описания ничего не сказано про флаг --oem
@syrus5854 Рік тому ⁺¹
это режим работы движка, он и так по умолчанию 3, но вот остальные режимы:
0 = Original Tesseract only.
1 = Neural nets LSTM only.
2 = Tesseract + LSTM.
3 = Default, based on what is available.
@vitalimanjur8563 Рік тому
конечно круто но есть одна маленькая проблема, этот текст нельзя использывать при обнаружение лица
@user-vx6mj6ul3n 3 роки тому
Неплохие видео, но очень трудно читать, особенно при небольшом разрешении. Сделайте шрифт покрупнее и цветовую схему более контрастную - будет гораздо лучше.
@PythonToday 3 роки тому
Спасибо за фидбэк. Шрифт поставил 16, если сделаю ещё больше, на экране будет по 20 строк отображаться с длиной в 40 символов. Будет совсем не видно и не удобно показывать длинный код.
@seterbot7201 3 роки тому
А тисиракт ето библіотека которая уже сама решает графіческиє задачі
@rand_name6734 3 роки тому
а дизлайк авито поставили)))
@PythonToday 3 роки тому
Походу 😀
@romanbolgar 6 місяців тому
А смысл этой практики на Python если ни одного доработанного решения нет. Где например аналог файнридер? До сих пор пайтон дальше командной строки не пошёл.
@user-yn1rf1fv7m 3 роки тому ⁺²
А у меня мак что делать?
@PythonToday 3 роки тому ⁺²
А в чем проблема? google "How to install tesseract on mac". Вроде ничего сложного
@serzhik13xxx 3 роки тому
А у меня на винде не работает :( и я не понимаю что не так и как всё должно работать. Хотелось бы более подробный урок
@PythonToday 3 роки тому ⁺¹
Брось этот кусок г и установи один из дистрибутивов unix, хотя бы на виртуалку. Многих проблем касаемо программирования избежишь в дальнейшем.
@LuaNaZakaz 2 роки тому
у меня завелось. пропиши переменные среды
@u5gb619 3 роки тому ⁺¹
Пингвинус, это ты?
@PythonToday 3 роки тому
Шта?
@u5gb619 3 роки тому
@@PythonToday у тебя голос немного похож на автора канала "пингвинус"
@PythonToday 3 роки тому
Не, точно не я
@user-yu3cj2co6j 3 роки тому
не работает
@PythonToday 3 роки тому
Работает
@user-yu3cj2co6j 3 роки тому ⁺¹
@@PythonToday
sudo apt install tesseract-ocr-rus. Так работает.
@SfitiKoks Рік тому
как сделай свой шрифт сдела тутор пожалуйста

Наступне

Автоматичне відтворення

Стеганография Python | Скрываем текст в изображении | Шифрование текста в изображении