Отличная иссдовательская работа! Спасибо! Я тестировал web speech api от гугла на windows и на android. Поведение действительно разное. Причем разное между андроид на планшете и андроид на телефоне. На телефоне при старте и окончании распознавания звенит колокольчик, что очень раздражает. На планшете и на ПК-windows колокольчиков нет. В любом случае, спасибо! Отличная работа! Кратко и без воды.
Vosk использую сам, чуть позже запишу видео про умный дом на воске. Silero тоже тестировал, но уже после записи видео. Не понравился, самый громкий распознал так себе
Тестировала vosk и speech recognition для распознавания wav файлов. Sr неплох, а вот vosk при неплохих результатах с микрофона wav файл читает, не угадывая ни единого слова.
@@MautozTech а если тебе нужно пол ляма записей прогнать?)) хотя если есть у Audacity API для питона - кинь ссылочку (буду признателен) p.s. Нашел API - спс за наводку)
Понятно что ничего не понятно, много воды автор и слишком запутано,отматал в конец чтоб посмотреть таблицу и скачать где больше баллов. Попробуй записвать чтоб проще было а не подробно
Sber Smartspeech - 0 0 0
Tinkoff Voicekit - 0 3.5 4.5
NLab Speech ASR - 0 3 4
Silero - NT NT 3
whisper тоже русский распознает там куча моделей разных размеров
Отличная иссдовательская работа! Спасибо! Я тестировал web speech api от гугла на windows и на android. Поведение действительно разное. Причем разное между андроид на планшете и андроид на телефоне. На телефоне при старте и окончании распознавания звенит колокольчик, что очень раздражает. На планшете и на ПК-windows колокольчиков нет. В любом случае, спасибо! Отличная работа! Кратко и без воды.
Попался в Ютуб рекомендациях, подписался)
Большое спасибо авторк👍
Спасибо большое за сравнение! У воска русская моделька версии 0.22 очень приличная. Есть еще Silero
Vosk использую сам, чуть позже запишу видео про умный дом на воске. Silero тоже тестировал, но уже после записи видео. Не понравился, самый громкий распознал так себе
величайший.
Что на данный момент является лучшей распозновалкой? Чтоб оффлайн и с поддержкой русского?
Я его не сравнивал, но могу предложить попробовать OpenAI Whisper
А можешь код для Android приложения показать пожалуйста? Пытаюсь сам сделать, но что-то не выходит
В описании репозитория есть ссылка на проект с кодом
@@MautozTech Я только там apk нашёл, можешь ссылку дать, очень поможешь
@@ДмитрийАйтиев посмотрите еще раз, там весь код.
Тестировала vosk и speech recognition для распознавания wav файлов. Sr неплох, а вот vosk при неплохих результатах с микрофона wav файл читает, не угадывая ни единого слова.
Помню через Audacity конвертировал файлы в Mono PCM и по-моему всё было нормально
@@MautozTech а если тебе нужно пол ляма записей прогнать?)) хотя если есть у Audacity API для питона - кинь ссылочку (буду признателен) p.s. Нашел API - спс за наводку)
Понятно что ничего не понятно, много воды автор и слишком запутано,отматал в конец чтоб посмотреть таблицу и скачать где больше баллов. Попробуй записвать чтоб проще было а не подробно
Я надеюсь у вас получилось скачать яндекс
Так там же вообще нет воды, я посмотрел полностью и не нашел