Распознавание текста с картинки на Python | Оптическое распознавание символов Tesseract

Поділитися
Вставка
  • Опубліковано 9 сер 2020
  • В данном видео разбираем как можно распознавать текста на разных языках с картинок при помощи Python и tesseract.
    💰 Поддержать проект:
    yoomoney.ru/to/410019570956160
    🔥 Стать спонсором канала:
    / @pythontoday
    ****Команды****
    Установка tesseract Linux:
    sudo apt install tesseract-ocr
    Установка tesseract Windows:
    tesseract-ocr.github.io/tessd...
    Опции конфига tesseract:
    help.ubuntu.ru/wiki/tesseract
    Разные словари tesseract:
    github.com/tesseract-ocr/tess...
    Скачать словарь в Linux:
    wget github.com/tesseract-ocr/tess...
    Переместить словарь в корень tesseract на Linux:
    sudo mv -v rus.traineddata /usr/share/tesseract-ocr/4.00/tessdata/
    ****Ссылки****
    Пишем Telegram бота на Python + Загружаем Telegram бота на сервер(хостинг):
    • Пишем Telegram бота на...
    Плейлист по парсингу сайтов на Python:
    • Парсинг/Scraping
    Код проекта на github:
    github.com/pythontoday/instag...
    Telegram: t.me/python2day
    ****Соц.сети****
    Telegram: t.me/python2day

КОМЕНТАРІ • 130

  • @user-iy6bf5un2m
    @user-iy6bf5un2m 3 роки тому +91

    Моя дипломная работа, которую я делал 3 месяца за 4 минуты на ютуб. Спасибо.... я немного шокирован.

    • @PythonToday
      @PythonToday  3 роки тому +30

      :)) Это на ютубе всё быстро, работа кипит за кулисами.

    • @polunochNY
      @polunochNY 3 роки тому

      :D

    • @aveomathman5532
      @aveomathman5532 2 роки тому

      Как же я тебе понимаю, тоже самое... Я когда еще учился в 10 классе, делал школьный проект и почти с нуля писал писал фреймворк для распознавания текста, но в итоге я нашел pytesseract и сэкономил себе много времени.

    • @user-gx8gk9ur1n
      @user-gx8gk9ur1n 2 роки тому +7

      @@aveomathman5532 Написать с нуля фреймворк для распознавания текста в моих глазах круче, чем использовать готовую библиотеку)

    • @Chel1k7
      @Chel1k7 Рік тому

      @@user-gx8gk9ur1n ну тогда тебе стоит изобрести велосипед

  • @creatorwizard383
    @creatorwizard383 3 роки тому +12

    Благодарю за познавательный контент здесь и в телеграме.

  • @chiklfkif
    @chiklfkif 2 роки тому +4

    такие видео добавляют мотивации обучаться программированию с огромным интересом) спасибо, Автор! однозначно подписка!

    • @PythonToday
      @PythonToday  2 роки тому

      Благодарю за фидбэк! Рад что полезно

  • @GreekkAlex
    @GreekkAlex 3 роки тому +2

    отличный урок! спасибо за гайд!👍🤘

    • @PythonToday
      @PythonToday  3 роки тому

      Спасибо за фидбэк 👍

  • @user-po3sg7vn4y
    @user-po3sg7vn4y 2 роки тому

    Всё просто и понятно, как всегда!)

  • @user-bw9zg3ko2h
    @user-bw9zg3ko2h 9 місяців тому +2

    Хочу выразить огромную благодарность за данное видео)))) Я начинаю первые шаги в программировании. Ролик 4 мин, я просидела почти 2 часа, вникала, что куда и как, но разобралась и это так приятно))) Спасибо)

    • @PythonToday
      @PythonToday  9 місяців тому

      Большое спасибо за фидбэк! Рад что было полезно)

  • @tonik5992
    @tonik5992 3 роки тому

    Спасибо вам огромное! Вы лучший!

    • @PythonToday
      @PythonToday  3 роки тому

      Благодарю за фидбэк!

  • @user-august84
    @user-august84 3 роки тому

    Качественно. Спасибо.

    • @PythonToday
      @PythonToday  3 роки тому

      Спасибо за фидбэк 💪

  • @lexluter963
    @lexluter963 3 роки тому

    Круто.... Контент топчик! Так держать

    • @PythonToday
      @PythonToday  3 роки тому

      Благодарю за фидбэк

  • @0xdeadc0de_Gameplays
    @0xdeadc0de_Gameplays 3 роки тому +2

    Долго искал решение для распознавания текста с фото. Можно сделать самому камеру + микроконтроллер, там уже вшит чип, но есть свои тонкости. Есть уже готовый софт, платный, но работает только в определенных условиях и с конкретными процессорами. Есть еще камеры за 10-18к евро. А есть вот это видео, где за 4 минуты составляется база для моего решения. Удивительно, благодарю )

    • @PythonToday
      @PythonToday  3 роки тому

      Спасибо за фидбэк) Заказал с Ali raspberry pi + камеру, тоже буду практиковаться с распознованием фото/видео 👍

  • @caiman101
    @caiman101 3 роки тому

    Спасибо!

  • @alexrostov2064
    @alexrostov2064 Рік тому

    Как же сильно мне помогло это видео, я долго долбался, чтобы добавить Tesseract в переменную среды PATH, так и не получилось, хотя вроде бы все правильно сделал.. И тут оказывается, что все можно было решить одной строчкой кода, я уже и не верил, что получится, спасибо огромное автору!!!

    • @PythonToday
      @PythonToday  Рік тому

      Большое спасибо за фидбэк! Рад что видео полезно!

  • @senpai3274
    @senpai3274 3 роки тому

    автор очень хороший и понятный контент красава

  • @user-kr6gv7sg2p
    @user-kr6gv7sg2p 3 роки тому

    Да. Потрясающе конечно)))

  • @TheSergWolf
    @TheSergWolf 3 роки тому +3

    Использовал тессеракт для распознования текста на скриншотах ошибок которые пользователи в жалобах пишут. Это была вторая супень отбора) НА первой ступени был pyimage для определения приложения, где возникала ошибка по шаблону картинки.
    Короче хотели сделать ИИ для помощи в решении проблемы, а сделали удобный сепаратор для машрутизаци заявок по проблемам от пользователей.

    • @PythonToday
      @PythonToday  3 роки тому +2

      Ну так ведь получился своего рода тоже ИИ :) А задача с определением приложения по скриншоту заинтересовала. Не задумывался, брал всегда лица, авто, зверей и т.д.

  • @user-fz5ym3wv1e
    @user-fz5ym3wv1e 3 роки тому +2

    Вот она магия python

  • @hinomuratomisaburo4901
    @hinomuratomisaburo4901 3 роки тому

    Круто 😃👈👍

  • @hanckhanck8376
    @hanckhanck8376 3 роки тому

    спасибо

  • @stannisfoch8746
    @stannisfoch8746 3 роки тому

    Отличное видео спасибо! только вопрос не совсем могу понять, что такое oem ? и что такое psm я нашел в документации, но psm N - N принимает параметры от 1 до 10, почему на видео было psm 13

  • @jared_aikikijared_aikiki3021
    @jared_aikikijared_aikiki3021 9 місяців тому

    очень поверхностно

  • @pcfixnorth3323
    @pcfixnorth3323 3 роки тому

    прикольно.

  • @_terror_7312
    @_terror_7312 3 роки тому +3

    Видео супер, если всё будет работать без багов, нам не придётся использовать API или ИИ для своего проекта, спасибо огромное

    • @PythonToday
      @PythonToday  3 роки тому +2

      Спасибо за фидбэк. Да вроде багов не наблюлось. Есть настройки которые можно подобрать под себя.

  • @beatzamshanatoliy1156
    @beatzamshanatoliy1156 3 роки тому +2

    Не первый день смотрю Ваши видео. Начинающий разработчик на python с базой знаний на с++. Подскажите несколько книг по которым Вы обучались. Я лично читаю (автоматизация рутинных задач с помощью python, и скраппинг на python). Просто хотелось бы больше узнавать за модули и их спецификации в работе. Заранее спасибо!)

    • @PythonToday
      @PythonToday  3 роки тому +5

      Привет, лучшей книгой по Python для новичков считаю "Изучаем Python. Программирование игр, визуализация данных, веб-приложения [3-е издание]" Много практики с актуальным кодом.

  • @span4ev
    @span4ev Рік тому

    Ух. Спасибо. А то я почитал файл ридми тессеракта, а там надо билд делать из командной строки, колдовать, бубен найти и всё это так сложно, что я расплакался и сложил лапки

    • @PythonToday
      @PythonToday  Рік тому

      Рад что полезно, благодарю за фидбэк!

  • @yosh2525
    @yosh2525 3 роки тому +1

    Возможно ли при помощи этого обходить капчу селениумом?
    Например в Mail

  • @NikolayN707
    @NikolayN707 3 роки тому +1

    при отдачи команды sudo apt install tesseract-ocr на мак пишет ThЖe operation couldn’t be completed. Unable to locate a Java Runtime that supports apt.

  • @user-vu7hq4ce4w
    @user-vu7hq4ce4w 3 роки тому +3

    Братишка жду видосы про инстаграм бот, спасибо!

  • @zapak5491
    @zapak5491 3 роки тому

    Здравствуйте. Нет ли планах записать урок по обучению Tesseract новым шрифтам? Находил в интернете несколько англоязычных уроков, но когда создаю свою обученную модель, качество распознавания практически не улучшается. Возможно есть какие-то особенности для обучения русским шрифтам? Или нужна только определенная версия программы?

    • @PythonToday
      @PythonToday  3 роки тому

      Приветствую, не думал об этом. Стараюсь где только можно избегать работы с кириллицей, ибо это боль для всего мира. English 👍

  • @MetamorphosisMetamorphosis-s
    @MetamorphosisMetamorphosis-s 3 роки тому

    бро, каким текстовым редактором пользуешься? сублайн текст?

    • @PythonToday
      @PythonToday  3 роки тому +2

      Текстовым в смысле IDE? PyCharm one love

  • @user-lu8vw1ud1f
    @user-lu8vw1ud1f 3 роки тому

    Спасибо за видео. Подскажите можно ли картинку закинуть с помощью js в питон, который обработает и результат передаст назад в js?

    • @PythonToday
      @PythonToday  3 роки тому

      Спасибо за фидбэк. Можно придумать какое-нить api с бекендом на DRF например, из js отправлять запрос, обрабатывать на python и отдавать результат, js'ом соответственно забирать.

    • @user-lu8vw1ud1f
      @user-lu8vw1ud1f 3 роки тому

      @@PythonToday такой вопрос простые текстовые капчи без шумов. Лучше делать нейронкой? Капча типа 5+3, 6+2, 1+1, 8+7. Они типа рукописного текста надо получить их обычными числами (эти примеры на одной картинке)

    • @PythonToday
      @PythonToday  3 роки тому

      Думаю для "текстовые капчи без шумов" вполне подойдет обычный tesseract ocr, зачем грузить систему.

  • @kevinzero8855
    @kevinzero8855 3 роки тому

    А если текст немного изменён?
    Например стёртая линия?

  • @RailSalimov
    @RailSalimov 3 роки тому

    а как сделать правильное распознавание конца строки и абзаца? чтобы текст был сплошной, без ненужных переносов.

  • @woxaz9076
    @woxaz9076 3 роки тому +1

    в WINDOWS тоже можно скачивать языки и закидывать в папку с языками

  • @vitalimanjur8563
    @vitalimanjur8563 Рік тому

    как делать так чтоб другой алгоритм или другой модуль мог выплнять при обнаружение, или другими словами как использывать в условиях

  • @autopilot_youtube
    @autopilot_youtube 3 роки тому

    Отличный урок!
    Может быть Вы знаете как справиться со следующей задачей:
    Я хочу найти на изображении определенную фразу, например "Мой компьютер", получить координаты центра этой фразы, чтобы затем кликнуть по ней мышкой.
    Это требуется для АВТОКЛИКЕРА по определенным кнопкам. Вы можете спросить - А не проще ли искать кнопку по её изображению? Конечно проще, если изображение кнопки не меняется. Но в некоторых играх изображения кнопок часто меняются, а названия остаются без изменений. Поэтому хотелось бы попробовать искать кнопку через распознавание текста.

    • @PythonToday
      @PythonToday  3 роки тому +1

      Привет спасибо за фидбэк. Я подобного не делал, но это 100% возможно средствами Python. Попробуй почитать про бибилиотеку openCV, возможно там будет решение.

    • @autopilot_youtube
      @autopilot_youtube 3 роки тому +1

      @@PythonToday Благодарю за совет, попробую разобраться с openCV.

    • @farinsaifutdinov5534
      @farinsaifutdinov5534 3 роки тому

      Используй библиотеки компьютерного зрения Google cloud vision. Гугл предоставляет API, они не бесплатные. Гугл может распознавать сложные тексты на различных изображениях и возвращать координаты текстовых надписей, к которым можно привязаться. Первые 1000 запросов в месяц бесплатны, далее 1.5$ за каждые 1000 запросов.

    • @autopilot_youtube
      @autopilot_youtube 3 роки тому

      @@farinsaifutdinov5534 благодарю, но я уже решил этот вопрос с помощью opencv + pytessaract. Хорошо распознаёт печатный текст и даёт его координаты.

    • @pixer9994
      @pixer9994 2 роки тому

      @@autopilot_youtube Возможно ли написать решения для распознавания простой капчи из 4 цифр?

  • @Neko-sr4wz
    @Neko-sr4wz Рік тому

    Пайтон тудей лучший!!

  • @Poriks
    @Poriks Рік тому

    Архи полезное видео

  • @fastcode977
    @fastcode977 2 роки тому

    Можете помочь? У меня после строки появляется вот такой символ: ♀. Изменения config не помогают

  • @Pavlev03
    @Pavlev03 3 роки тому

    Пожалуйста помоги!!! Как сделать image.open(все изображения из папки)

  • @Responsible_Show-off
    @Responsible_Show-off 3 місяці тому

    А где можно найти документацию по созданию своего OCR? Нигде, буквально никто ничего об этом не пишет, просто все толдычат про тессеракт или на форумах про keras-ocr, а это мое задание. С чего начать или как или самое главное что нужно в модель пихать, разительно не понятно, уже в депресссию с этого вхожу...

  • @user-fx3go2ov8y
    @user-fx3go2ov8y Рік тому

    для каптчи подойдёт?

  • @edwardssms2592
    @edwardssms2592 3 роки тому

    Привет а как сделать свою модель для англ языка если у тебя кастомный шрифт?

    • @PythonToday
      @PythonToday  3 роки тому

      Привет, что значит "сделать свой модуль...". Тесеракт справляется с разными шрифтами, тем более английскими. Кидай пример картинки в чат, посмотрим.

  • @user-ts7ef8fs5g
    @user-ts7ef8fs5g 2 роки тому

    Ребят, подскажите пожалуйста.
    TESSERACT пригоден для цели:
    Отфоткать на сяомишную смартфонную камеру 5-10 страниц (обычная книга с бумажными страницами) , выложить эти 5-10 файликов в папку и потом пройтись по ним циклом , выполняя попутно распознание текста на фото и его дальнейшую оцифровку (через данную библиотеку) с сохранением в отдельный файл: т.е. на выходе должно получаться 5-10 TXT файлов? Или же есть модули получше?
    Поясню - у меня просто сомнения, что этот модуль будет корректно справляться с фото файлом ,в котором изображение целой книжной страницы.
    Извините, если вопрос покажется глупым, ни разу просто с подобным не работал. Спасибо)

    • @PythonToday
      @PythonToday  2 роки тому

      Пригоден, но есть средства лучше/удобнее. В выходные выйдет ролик.

    • @user-ts7ef8fs5g
      @user-ts7ef8fs5g 2 роки тому

      @@PythonToday это замечательно. Спасибо, буду ждать! )

  • @azazel1394
    @azazel1394 3 роки тому

    Виедо топ, но одна проблемка посмотрел его вот только и ссылки для версии на windows нету, что качать то?

    • @PythonToday
      @PythonToday  3 роки тому

      Спасибо за фидбэк. Всё там есть, раздел Downloads >> tesseract-ocr.github.io/tessdoc/4.0-with-LSTM >>> Downloads archive on... и выбираешь последний доступный под винду. Но я бы делал на Linux, на винде тоже работало, но там вечно что-то не заводится.

  • @demonstalker_game_developer
    @demonstalker_game_developer 3 роки тому

    У меня почему-то к определению текста добавляет значок женского пола. По какой причине такое может быть? В интернете такой информации не нашёл!

  • @user-gd6dm2xp1p
    @user-gd6dm2xp1p 3 роки тому

    По ссылке в описании нету binaries для windows пишет что версия устарела где скачать актуальную?

    • @dfkkg3453
      @dfkkg3453 3 роки тому

      Там в описании есть ссылка на инсталл 5-й версии

  • @user-ks4lm9cn4k
    @user-ks4lm9cn4k 2 роки тому +1

    Неплохое решение. А если 100 картинок, 1000 картинок?
    К примеру, интересует распарсить счёт на оплату. Вытащить из картинки контрагента, наименование позиций, цену, дату. Таких картинок очень много

    • @Adam_Blake
      @Adam_Blake Рік тому

      нашел решение? какой цикл нужен чтобы программа перебирала много фоток в папке?

  • @kuaranir2440
    @kuaranir2440 Рік тому

    А как у тебя заработал тессеракт, если ссылка на ехе файл была закомментирована? Во всех туториалах ссылка на него обязательно и у меня без нее ничего не работало

    • @PleerFol
      @PleerFol Рік тому

      У него мак, ало

  • @asas7083
    @asas7083 3 роки тому

    'charmap' codec can't encode character '\ufb01' in position 241: character maps to
    втф?

    • @PythonToday
      @PythonToday  3 роки тому

      Windows?

    • @asas7083
      @asas7083 3 роки тому

      @@PythonToday да,думаешь перейти на линукс?

    • @PythonToday
      @PythonToday  3 роки тому

      😀 Избежишь многих проблем касаемых программирования. Если конечно не любитель unity + c#

    • @asas7083
      @asas7083 3 роки тому

      @@PythonToday в том то и дело,учу c# ;)

  • @cashriser225
    @cashriser225 2 роки тому

    А где ссылка в описании?

  • @bernardsoul8936
    @bernardsoul8936 3 роки тому +1

    Почему-то при указании параметра lang='rus', tesseract вылетает. Прекращена работа программы... Есть у кого такая проблема?

    • @khostq
      @khostq 3 роки тому

      Для этого нужно дополнительно скачать языки
      Ты сейчас можешь удалить тессеракт и скачать по новой при этом поставив галочку на "additional language data.... " или что то такое

  • @plailet6118
    @plailet6118 3 роки тому

    У меня не распознаёт цифры, только текст, либо в консоли ничего не пишет, либо выдаёт вот такой знак "♀". В чём проблема?

    • @PythonToday
      @PythonToday  3 роки тому

      Нужно смотреть код. Кинь ссылку на проект и что за изображение интересно.

    • @plailet6118
      @plailet6118 3 роки тому

      @@PythonToday Извините за беспокойство, но я разобрался, поигрался с цифрами "--psm 13", и всё заработало:)

    • @PythonToday
      @PythonToday  3 роки тому

      @@plailet6118 Молодцом что сам разобрался 👍

  • @python_cheatsheet_by_eugene
    @python_cheatsheet_by_eugene 2 роки тому

    Так и не понял как в Семерке запустить. В виртуальной среде добавлен, путь прописан но кричит на pytesseract.pytesseract, что "Cannot find reference 'pytesseract' in '__init__.py'", а на pytesseract.image_to_string - "Cannot find reference 'image_to_string' in '__init__.py'". Так и не понял, как это все дело запустить. Линукс пока не могу поставить

    • @PythonToday
      @PythonToday  2 роки тому

      Не подскажу, не работал в виндоус. В гугле нет ответа?

    • @python_cheatsheet_by_eugene
      @python_cheatsheet_by_eugene 2 роки тому

      @@PythonToday для Windows не густо. Потому что, если Python, то надо сидеть на Linux, ну или на Макоси, на худой конец, но не на Windows

    • @python_cheatsheet_by_eugene
      @python_cheatsheet_by_eugene 2 роки тому

      Тому, кто столкнулся с той же проблемой, необходимо Tesseract устанавливать командами pip install tesseract, а потом pip install pytesseract. Также Tesseract должен быть установлен в Windows и внесен в виртуальное окружение

  • @user-uu9wg1yj2t
    @user-uu9wg1yj2t 2 роки тому

    где взять исходный код?

  • @user-ng7ok2qo5c
    @user-ng7ok2qo5c 5 місяців тому

    Сфоткал крупным планом номер авто. Ничего не распознаёт. При некоторых параметрах может выдать абракадабру. И языки и конфиг менял. всё фигня выходит.

  • @iamrussiancockeater
    @iamrussiancockeater 3 роки тому

    Я б добавил threshold

  • @nargan1129
    @nargan1129 2 роки тому

    В документации из описания ничего не сказано про флаг --oem

    • @syrus5854
      @syrus5854 Рік тому +1

      это режим работы движка, он и так по умолчанию 3, но вот остальные режимы:
      0 = Original Tesseract only.
      1 = Neural nets LSTM only.
      2 = Tesseract + LSTM.
      3 = Default, based on what is available.

  • @vitalimanjur8563
    @vitalimanjur8563 Рік тому

    конечно круто но есть одна маленькая проблема, этот текст нельзя использывать при обнаружение лица

  • @user-vx6mj6ul3n
    @user-vx6mj6ul3n 3 роки тому

    Неплохие видео, но очень трудно читать, особенно при небольшом разрешении. Сделайте шрифт покрупнее и цветовую схему более контрастную - будет гораздо лучше.

    • @PythonToday
      @PythonToday  3 роки тому

      Спасибо за фидбэк. Шрифт поставил 16, если сделаю ещё больше, на экране будет по 20 строк отображаться с длиной в 40 символов. Будет совсем не видно и не удобно показывать длинный код.

  • @seterbot7201
    @seterbot7201 3 роки тому

    А тисиракт ето библіотека которая уже сама решает графіческиє задачі

  • @rand_name6734
    @rand_name6734 3 роки тому

    а дизлайк авито поставили)))

  • @romanbolgar
    @romanbolgar 6 місяців тому

    А смысл этой практики на Python если ни одного доработанного решения нет. Где например аналог файнридер? До сих пор пайтон дальше командной строки не пошёл.

  • @user-yn1rf1fv7m
    @user-yn1rf1fv7m 3 роки тому +2

    А у меня мак что делать?

    • @PythonToday
      @PythonToday  3 роки тому +2

      А в чем проблема? google "How to install tesseract on mac". Вроде ничего сложного

  • @serzhik13xxx
    @serzhik13xxx 3 роки тому

    А у меня на винде не работает :( и я не понимаю что не так и как всё должно работать. Хотелось бы более подробный урок

    • @PythonToday
      @PythonToday  3 роки тому +1

      Брось этот кусок г и установи один из дистрибутивов unix, хотя бы на виртуалку. Многих проблем касаемо программирования избежишь в дальнейшем.

    • @LuaNaZakaz
      @LuaNaZakaz 2 роки тому

      у меня завелось. пропиши переменные среды

  • @u5gb619
    @u5gb619 3 роки тому +1

    Пингвинус, это ты?

    • @PythonToday
      @PythonToday  3 роки тому

      Шта?

    • @u5gb619
      @u5gb619 3 роки тому

      @@PythonToday у тебя голос немного похож на автора канала "пингвинус"

    • @PythonToday
      @PythonToday  3 роки тому

      Не, точно не я

  • @user-yu3cj2co6j
    @user-yu3cj2co6j 3 роки тому

    не работает

    • @PythonToday
      @PythonToday  3 роки тому

      Работает

    • @user-yu3cj2co6j
      @user-yu3cj2co6j 3 роки тому +1

      @@PythonToday
      sudo apt install tesseract-ocr-rus. Так работает.

  • @SfitiKoks
    @SfitiKoks Рік тому

    как сделай свой шрифт сдела тутор пожалуйста