DIY умная колонка для управления голосом устройствами умного дома Home Assistant на ESP32 и ESPHome

Поділитися
Вставка
  • Опубліковано 23 лис 2024

КОМЕНТАРІ • 180

  • @upavla
    @upavla  7 місяців тому +2

    Подписывайтесь на мой телеграмм канал: t.me/ypavla

  • @RezKuz
    @RezKuz 7 місяців тому +27

    Очень жду видео про ускорение распознавания речи. Тема очень интересная. Спасибо за действительно познавательные и интересные видео!

  • @ОлегВоденников
    @ОлегВоденников 7 місяців тому +27

    Плюсую, локальное распознавание речи - тема. Не нужны гугли, яндексы, огрызки, никакого слежения и рекламы.

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому +2

      есп32 ничего не распознаёт, кроме "хайЛексин" силёнок маловато. А вот малинка и ли другие одноплатники справляются +- сносно. Только памяти не менее 2Гиг желательно. Распознавание речи реализовать на компе за пару вечеров -- можно, проверено лично.

    • @skylol4eg
      @skylol4eg 6 місяців тому

      @@AndrewKobelev А можно пару ссылок на форумы, где подобное реализовывали? Чета захотел попробовать)

    • @AndrewKobelev
      @AndrewKobelev 6 місяців тому +4

      @@skylol4eg Проект Ирина

  • @viktorg2765
    @viktorg2765 7 місяців тому +19

    Супер! Про локальные базы для ускорения распознавания речи было бы интересно посмотреть

    • @AndrewKobelev
      @AndrewKobelev 6 місяців тому

      на ютубе про это масса роликов.

  • @inhab88
    @inhab88 7 місяців тому +11

    Спасибо за видосы. Развивай тему. Очень интересно! Удачи.

  • @alexmega
    @alexmega 7 місяців тому +8

    Микрофон подключается не по протоколу i2c, а по i2s, это кардинально разные протоколы.

  • @indevor8337
    @indevor8337 6 місяців тому +3

    Для желающих повторить. Вместо Wisper используйте VOSK, скорость распознавания 0.3 секунды, вместо 7-8, распознавание окончания разговора, дефолт либо умеренный. Иначе не успеете сказать то что хотели) По сравнению с шопотом, воск на несколько порядков быстрее и точнее. гуглится: vosk home assistant

    • @EvgenMo1111
      @EvgenMo1111 6 місяців тому

      а tts какой можешь посоветовать,? а то все какое то унылое, можно с робоголосом

    • @indevor8337
      @indevor8337 6 місяців тому

      @@EvgenMo1111 поставил Silero-TTS-Service (в гугле гитхаб проект) - ставится через докер (плагином командная строка) , шикарный голос. Основан на silero-models на хабре есть статья и примеры голосов.

    • @indevor8337
      @indevor8337 5 місяців тому

      @@EvgenMo1111 Silero-TTS-Service

  • @СергейКовёров-й3ц
    @СергейКовёров-й3ц 7 місяців тому +1

    Павел, тебе респект. Я в этом деле начинающий, а лопатить литературу нет времени. Из твоих уроков получилось сделать сервер, прошить и встроить zigbee, не первого раза конечно. Я думаю многим будет интересен этот проект на основе тв приставки. Я думаю тема с колонкой очень актуальна и развивать её надо.

  • @maksimlenin3159
    @maksimlenin3159 7 місяців тому +2

    Супер!!!! Огромное спасибо за ваши труды!

  • @АлександрКецкалов
    @АлександрКецкалов 7 місяців тому +6

    Отличная тема! Попробовал, все запустилось без проблем. У меня сервер умного дома крутится на виртуалке Synology DS920+ и время распознавания составляет 5-7 секунд, поэтому тема по сокращению времени распознавания очень необходима!

    • @NikeRossXP
      @NikeRossXP 7 місяців тому +2

      1. потому что не нужно из сетевого накопителя делать сервер
      2. потому что это переоцененное говно

    • @АлександрКецкалов
      @АлександрКецкалов 7 місяців тому +3

      @@NikeRossXP Этот сетевой, как вы говорите, накопитель который вы судя по комментарию видели только на картинке, фору даст любому arm одноплатнику (которые в основном используют для этих целей) при этом выполняя еще кучу разных задач, так что запихайте ваше диванное мнение... ну вы сами знаете куда ;))

    • @АлександрКецкалов
      @АлександрКецкалов 7 місяців тому +1

      А Павел красавчик! И только благодаря его четким и развернутым видео я вдохновился идеей умного дома и несколько не пожалел. Практически на любой вопрос по HASS да и в принципе по умной автоматике в его материалах можно найти ответ.

    • @NikeRossXP
      @NikeRossXP 7 місяців тому

      @@АлександрКецкалов еще бы сейчас переплачивать за целерон с веб-интерфейсом для даунов
      то что в него пихаются всякие пакеты, конечно позволяет говорить "кучу разных задач", но вот что он всё это делает неполноценно любители поесть говна умалчивают. Можешь попробовать сделать нетривиальную задачу: поднять на нём openvpn-сервер одновременно на tcp и udp протоколах, без необходимости генерировать сертификаты для каждого пользака. Это базовая конфигурация, если что.
      "для этих целей" сейчас становятся всё более популярны всякие intel-n100 минипк, производительность можешь сравнить сам.

    • @lexx725
      @lexx725 6 місяців тому

      У меня при компиляции куча варнингов. Даже не знаю, что делать

  • @Amicsification
    @Amicsification 7 місяців тому +5

    Блин, очень интересно, спасибо.
    У меня есть заготовки под несколько ламп гайвера. Похоже надо будет такую лампу переводить на esphome ) жаль я не умею)

    • @dNix
      @dNix 7 місяців тому +2

      Лампу гайвера лучше переводить на WLED. Там сразу всё под это заточено и с Home Assiastant WLED интегрируется в пару кликов, он сам их обнаруживает в сети. Только лучше использовать ESP32, на ESP8266 стабильность плохая.

    • @ELFMEDIA
      @ELFMEDIA 7 місяців тому

      У esphome мало готовых эффектов, или их придётся писать самому на labda, wled лучше

  • @egeht13
    @egeht13 Місяць тому

    Я с нетерпением жду видео про ускорение распознавания речи. :-)

  • @sledleo
    @sledleo 7 місяців тому

    Респект, классная тема!
    Ждем продолжения по этим занимательным устройствам!

  • @itEvolution
    @itEvolution 5 місяців тому +1

    Доброе время суток! Скажите а можно сделать голосовое управление с помощью Яндекса или tuya или любым другим способом а не только с home assistant ?

  • @teenjak
    @teenjak 7 місяців тому +3

    Непосредственно сейчас хочу занять сбором такой колонки-ассистента. Поэтому любое раскрытие темы интересно. И локальный запуск модели в том числе. А ещё в документации ESPHome сказано, что ассистент очень прожорливый в плане ресурсов поэтому не рекомендуется использовать его с некоторыми другими компонентами. Мне же хочется чтобы колонка параллельно работала в режиме media player. Это реально вообще?

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому

      Начните с ассистента, а не с колонки

  • @maksys4101
    @maksys4101 7 місяців тому

    Спасибо за видео.
    Очень хочется узнать об локальной базе распознавания голоса.
    Буду благодарен за это видео.
    👍👍👍

  • @Dialbist
    @Dialbist 7 місяців тому +2

    И ещё хотелось бы точнее понять, а чем разница использования разных плат esp32 и что точно не подойдёт?

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому

      ESP32 S3 подойдёт идеально, а ESP32 S1, 2 или ESP32 C3 тоже подойдёт, просто будет больше нагрузка на сервер.

  • @egeht13
    @egeht13 Місяць тому

    Подскажите как его отлаживать? HA настроил, с телефона управление голосом работает. Собрал колонку, прошил, HA все видит, светодиод включается, при загрузке моргает, но на кодовую фразу не реагирует. Может какой-то лог можно включить. Понять что не работает железо или ПО.

  • @mydreamisfreedom
    @mydreamisfreedom Місяць тому

    Читал, что антенну можно развернуть на 90 градусов и сигнал будет сильно лучше

  • @Ivashco92
    @Ivashco92 7 місяців тому

    Павел! Конечно интересно, как запустить на приставке

  • @DmitryByankin
    @DmitryByankin 7 місяців тому +2

    Подскажите на S3 версии у вас нет следующей проблемы: В esphome сделал media player а не speaker чтобы можно было музыку играть, но при включенном распознавании горячей фразы звук музыки очень сильно заикается - не хватает мощности обычной esp32. В моменте ответа голосового ассистента это не видно т.к. он ставит на паузу распознавание пока фраза не закончится. Вот думаю имеет ли смысл брать S3 варисию или она тоже не справится.

    • @kaimichaelson6349
      @kaimichaelson6349 7 місяців тому

      Вот кстати тоже интересует, потому что в моем юзеркейсе колонка обязательно должна играть спотифай

    • @upavla
      @upavla  7 місяців тому

      Я даже не знал, что есть возможность сделать просто колонку для спотифай в esphome

    • @DmitryByankin
      @DmitryByankin 7 місяців тому

      @@upavla насчёт поддержки спотифай не могу сказать, но для esphome voice assistant есть 2 взаимо исключающих варианта в конфигурации: speaker и media player. Второй будет отображаться как источник вывода аудио в HA и на него например можно выводить голосовые уведомления или музыку.

    • @ЭдуардЗаборовский-м7б
      @ЭдуардЗаборовский-м7б 2 місяці тому

      А можете поделиться кодом?

    • @DmitryByankin
      @DmitryByankin 2 місяці тому

      @@ЭдуардЗаборовский-м7б к сожалению уже удалил проект, но там был банальный sample с esphome

  • @СергейПантюхин-б2з
    @СергейПантюхин-б2з 7 місяців тому +1

    Павел! Можешь прокометировать тему про китайские реле для управления шторами, в УДЯ напрямую они не залетают, через связку аккаунтов добавляются, но нет функции СТОП, только вверх или вниз до упора... Что с этим можно сделать...

    • @upavla
      @upavla  7 місяців тому

      Можете куда-то в телеграмм ссылку на реле скинуть. Я не очень понимаю о чем речь

    • @СергейПантюхин-б2з
      @СергейПантюхин-б2з 7 місяців тому

      ​​@@upavla отправил в чат в телегу

  • @ДмитрийСоломаха-е8ф
    @ДмитрийСоломаха-е8ф 6 місяців тому

    Доброго времени суток. Собрал такой проект на esp32, запускается, вызывается по имени, принимает одну команду выполняет её и все, больше не вызывается ничего не слушает не выполняет. Выключаю питание, включаю опять тоже самое.
    Подскажите куда поковырять, может сталкивались с такой проблемой?

  • @satiAgasava
    @satiAgasava 7 місяців тому +2

    Идея шикарная. Используя 3д принтер смогу сделать что угодно! Подскажите пожалуйста, можно ли несколько таких колонок соединить в один мозг как с яндекс алисой?

    • @upavla
      @upavla  7 місяців тому +1

      Не знаю таких способов

    • @satiAgasava
      @satiAgasava 7 місяців тому

      @@upavla Благодарю за ответ!

  • @VitaliySunny
    @VitaliySunny 7 місяців тому +2

    Спасибо за обзор, интересный проект. Сравнение производительности было бы интересно посмотреть. Коммерческие колонки как раз характеризуются быстрым откликом на множество команд. Приблизиться к этому - это значит получить open-source решение не завязанное на каком-либо вендоре.

    • @AndrewKobelev
      @AndrewKobelev 6 місяців тому

      Коммерческие колонки характеризуются быстрым откликом на множество команд. Потому, что они используют ресурсы вендора, например, Алиса использует ресурсы Яндекса , а это гигантское количество серверов. У которых есть хозяин, обслуживающий их. Опенсорсные "решения", такой роскошью не располагают. Можно только рассчитывать на домашний сервер.

    • @VitaliySunny
      @VitaliySunny 6 місяців тому

      @@AndrewKobelev Речь про задержки сети, естественно в локалке self-hosted решения будут гораздо быстрее чем облачные решения, даже не смотря на "супер-пупер" сервера облака.

    • @AndrewKobelev
      @AndrewKobelev 6 місяців тому +1

      @@VitaliySunny сравнил время отклика четырёх серверов, привожу максимальные (самые плохие) значения -- локального 3мс , РФ 18мс, DE 57mc, US 178mc. Разница, конечно есть, но уловить даже 0.1 с, затруднительно. Когда сеть нашей организации объединили через космическую связь (до этого была модемная), то пинг достигал до 1,5 сек, и да, такая задержка чувствовалась, но это было 20 лет назад. Тем не менее локальный сервер обладает решающим преимуществом в плане той же безопасности, мы же не хотим, чтобы наш умный дом накрылся медным тазом, как иранская ядерная центрифуга в 2010 г.

  • @IvanIvanov-ny4nz
    @IvanIvanov-ny4nz 7 місяців тому +2

    Отличное видео, спасибо! Сколько таких колоном можно расставить по квартире?

    • @ELFMEDIA
      @ELFMEDIA 7 місяців тому

      Сколько хотите

    • @ЭдуардЗаборовский-м7б
      @ЭдуардЗаборовский-м7б 3 місяці тому

      @@ELFMEDIA вот только непонятно как дать знать дому где какая находится, чтобы говорить "включи свет" а не "включи свет на кухне"

    • @ELFMEDIA
      @ELFMEDIA 3 місяці тому

      @@ЭдуардЗаборовский-м7б Так колонкам так же как лампочкам присваивается расположение

    • @ЭдуардЗаборовский-м7б
      @ЭдуардЗаборовский-м7б 3 місяці тому

      @@ELFMEDIA но учитывается ли оно для контекста голосовых команд?

  • @MaksymKovalenko-p7m
    @MaksymKovalenko-p7m 7 місяців тому

    Да,интересно, продолжай

  • @vyshnyvetskyy
    @vyshnyvetskyy 7 місяців тому +1

    А у меня вопрос) А нельзя ли скрестить блютуз колонку и еспешку таким образом, чтобы работоспособность осталась и у одного, и у другого? По сути, вывод усилителя можно запаять на плату колонки (к выводам на динамик) или ещё проще, найти у платы колонки "вход" на усилитель и припаяться туда (тогда сторонний усилитель нам вовсе и не нужен)?

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому

      скорее всего можно . надо раздобыть схему вашей блютус колонки.

    • @captainpronin953
      @captainpronin953 5 місяців тому

      Так это не просто усилитель же, это ЦАП! ESP гонит цифру а не аналог.

  • @iqubik
    @iqubik 7 місяців тому +1

    Павел, а вы вначале говорите что esp32 не умеет wake word, только s3. А в конце показываете пример на esp32

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому +2

      ESP32 S3 умеет, а ESP32 S1 или ESP32 C3 не умеет делать wake word ВНУТРИ Себя, а делегирует это задание серверу

    • @vyshnyvetskyy
      @vyshnyvetskyy 7 місяців тому

      там распознавание идёт уже на сервере Хоум Асситант (он постоянно слушает эфир)

  • @asyvolkova1047
    @asyvolkova1047 7 місяців тому +1

    Даёшь голос!

  • @pmpkng19
    @pmpkng19 7 місяців тому

    На умной панели такой же контроллер, и подключить вроде можно микрофон
    На ней нельзя будет сделать голосовое распознавание?)

  • @alfaomega3012
    @alfaomega3012 4 місяці тому

    Добрый день. Может я что-то не понял, но на схеме у вас другая плата. Как правильно их соединить? Если к самой esp32-s3 подключить type-c, признаки жизни какие-то должны быть?

    • @egeht13
      @egeht13 Місяць тому

      Нумерация пинов правильная

  • @Kirilloff73
    @Kirilloff73 7 місяців тому

    Читая коментарии, возникла мысль о том, что было бы здорово, если бы можно было как-нибудь перепрошить яндексовские колонки, которые поподписе. Их на просторох Авито можно найти за шапку сухарей. При этом в них отличные микрофоны и динамики.

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому

      Во первых, "прошить" -- реально, там Линукс (или РТОС) стоит и процессор 4х ядерный и памяти достаточно (раз в 20 больше, чем в ЕСП), из конфетки сделать гавно легко. Только зачем? У меня 2 такие колонки работают без подписки. Весь цимес этого проекта в том и заключается, что автор умудрился запилить распознавалку на этом "ПочтиАрдуино". Я тоже запустил торгового бота на ЕСП32 для биржи бинанс. И этим гордился. А народ спрашивал " а сколько % в день даёт сей агрегат", "а на компе это реально запустить?", вместо того, чтобы восхищаться "как тебе удалось впихнуть торговый терминал и робота-трейдера в эту дешевую микросхему".

    • @Kirilloff73
      @Kirilloff73 7 місяців тому

      Моя идея,заключается в том, чтобы хоть как-то реанимировать и использовать яндекс колонку (по подписке ), которую я в своё время лоханувшись купил на Авито. И сейчас она валяется без дела, т.к. без подписки это кирпич. А вот если бы её можно было-бы перепрошить и использовать как колонку в этом видео было бы очень здорово. Потому, что яндекс колонка наверняка лучше будет слышать на расстоянии т.к. у неё массив микрофонов, да и ответ будет звучать поприятнее.

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому

      @@Kirilloff73 Надо сбросить вашу Алису на заводские настройки, а потом заново её активировать. А подписку не включать. У меня 2 колонки с алисой, лайт и DEXP. Обе работают без подписки полтора года как. Некоторые функции не работают, например, нельзя запустить какую нибудь произвольную музыкальную композицию. Вебрадио работает, диалог алиса поддерживает, этого мне достаточно.

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому

      @@Kirilloff73 попробуйте сбросить колонку на фабричные настройки. И заново активируйте через свежесозданный аккаунт. А подписку не подключайте. Если не получается никак сбросить, мой совет-продайте на том же Авито, и купите колонку типа как У Павла и "массив микрофонов", ибо надеяться на то, что используете "алисины" микрофоны - зыбкая идея. И с чего это "ответ будет звучать поприятнее", это всецело зависит от TTS модуля.

    • @ELFMEDIA
      @ELFMEDIA 7 місяців тому

      @@Kirilloff73 Нет пока никаких прошивок под их железо

  • @Energistorefne
    @Energistorefne Місяць тому

    самый прикол, изначально в колонке есть и усь и микро и даже аккумы. просто автор видимо не хотел разбираться с кодом еспэхи для перевода с иквадратц на обычный аналог и лезть в компоненты самой колонки для подключения к изначпльным компонентам.

  • @MrZandho
    @MrZandho 5 місяців тому

    Получается колонка это уши и рот для хом ассистент. И все расчеты происходят на основном сервере?

  • @СергейЧувахин-з9щ
    @СергейЧувахин-з9щ 7 місяців тому

    Отлично, а как прошить плату Esp

  • @Dialbist
    @Dialbist 7 місяців тому

    Полезное видео! Я вот только не могу понять, если дешифратор по i2s (кстати не путать с i2c) и после него усилитель, если колонка больше 3w, можно ли так

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому

      Конечно можно. У "дешифратора" ровно такие же контакты на входе, а выходы -- линейные, до 12 каналов можно сделать, а не моно 3 ватта. PCM5102 называется.

  • @sionmr2
    @sionmr2 7 місяців тому

    Павел, а есть вариант интеграции алисы в хом ассистант, без использования яндекс колонки? Скажем, сценарий, когда есть выделенная машина, на которой крутится сервер ha, и просто туда через микрофонный вход и выход, скажем, на внешнюю колонку.

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому

      Есть.

    • @ELFMEDIA
      @ELFMEDIA 7 місяців тому

      @@AndrewKobelev И как вы Алису без Яндекс колонки в HomeAssistant запихнёте? Там с родной-то их колонкой всё через одно место работает

    • @AndrewKobelev
      @AndrewKobelev 6 місяців тому

      @@ELFMEDIA никак не запихну. Товарищ спрашивал про "сценарий, когда есть выделенная машина, на которой крутится сервер ha, и просто туда через микрофонный вход и выход, скажем, на внешнюю колонку" -- это ведь проще, чем городуха на "блюпуп колонке, I2S микрофоне и ESP32 S3"

  • @Сергей-п4ф3з
    @Сергей-п4ф3з 3 місяці тому

    Прерывается звук на этом усилителе, вчем проблема?

  • @Ярик-я8о4е
    @Ярик-я8о4е 6 місяців тому

    А есть способ добавить интонацию голосу? Очень хотелось сделать себе такую калонку и не одну но очень беспокоит ужасное произношение фраз.

  • @nikitasevryuk3995
    @nikitasevryuk3995 6 місяців тому

    А возможно выводить на такое устройство заданное сообщение? Например, предположим встал на весы и устройство объявляет: ваш вес Хх килограмм.

    • @upavla
      @upavla  6 місяців тому

      Да, можно

    • @nikitasevryuk3995
      @nikitasevryuk3995 6 місяців тому

      @@upavla если будет возможность, просьба тоже показать на видео или в статье как это работает на самодельной колонке esp для упревлени голосом

  • @Mbyte-rx8lj
    @Mbyte-rx8lj 7 місяців тому +4

    А как-то голос менять можно? А то он сильно режет уши.

    • @upavla
      @upavla  7 місяців тому

      Ну там можно поменять на мужской например. Есть несколько вариантов

    • @AndrewKobelev
      @AndrewKobelev 6 місяців тому +2

      Конечно можно! Для умного дома синтез речи городить нет необходимости. Ответов то, типа "свет в туалете включён" немного вариантов, и вообще можно записать фразу "выполнено , мой господин! " и проигрывать её, как ответ на все команды.

  • @dkmcdk724
    @dkmcdk724 7 місяців тому +1

    Я уже подумал что на S3 распознование работает, у Espressif есть такая реклама, а тут ESP32 просто как WiFi-микрофон используют..( При чем можно сказать без реального практического применения..

    • @ELFMEDIA
      @ELFMEDIA 7 місяців тому +2

      На S3 работает распознавание wake word - начальной фразы обращения (например, "окей набу" или какую настроите). Остальная процедура stt на сервере.

    • @AndrewKobelev
      @AndrewKobelev 6 місяців тому

      "на S3 распознАвание работает" -- действительно работает, у Espressif есть документация на Гитхаб с примерами. "А тут ESP32 просто как WiFi-микрофон используют." - именно так и есть.

  • @asustek78
    @asustek78 6 місяців тому

    спасибо

  • @dartwejders
    @dartwejders 7 місяців тому +1

    Можно ли свое кодовое слово использовать? И прикрутить голос покачественней?

    • @upavla
      @upavla  7 місяців тому +2

      Есть много вариантов. Именно моя использует локальные команды которые поддерживает сама esp32 s3 таких команд только 3. Если сделать так, чтоб распознавание отправлялрсь в home assistant, то там распознаваний команд будет больше. В списке штук 20. Так же можно ещё базу команд прикрутить и там будет ещё больше вариантов. Ну и по поводу голоса. Тоже есть варианты разные

    • @dartwejders
      @dartwejders 7 місяців тому

      @@upavla Спасибо за ответ. Ну вы же понимаете что сама esp поддерживает ровно то что в нее залито при прошивке. А прошивку компилируете вы в Esphome. Так что вопросы остаются. Надеюсь доснимите в других обзорах)

    • @dNix
      @dNix 7 місяців тому +1

      @@dartwejders Я так понимаю, в ESP заливается микронейроночка натасканная на одну конкретную активационную фразу. Таким образом нельзя выбрать произвольную фразу, только те, что заранее подготовлены. Так работают и яндексовские колонки и активация голосового ассистента в смартфонах.

    • @AndrewKobelev
      @AndrewKobelev 6 місяців тому

      @@dNixВсё верно, "в ESP заливается микронейроночка натасканная на одну конкретную активационную фразу. Таким образом нельзя выбрать произвольную фразу, только те, что заранее подготовлены." А как готовить, описано в ЕСП-шной документации.

    • @dNix
      @dNix 6 місяців тому +1

      @@AndrewKobelev Понятно, что если что-то сделано человеком, вероятно кто-то другой сможет это повторить. Я мало знаю про ML, сложно оценить насколько это трудоёмко. Наверное не очень. Наверное даже достаточно среднестатистических домашних мощностей. Но надо же подготовить и разметить датасет. Сотни, тысячи правильных и неправильных слов, разными голосами, в разном темпе, с проглоченными окончаниями, с разными дефектами, интонациями. Очень близкие слова, слова включающие в себя активационное или похожее... В датасетах же вся ценность.

  • @iqubik
    @iqubik 7 місяців тому

    Я бы про тв бокс поинтересовался

  • @Sergey_Evdokimenko
    @Sergey_Evdokimenko 7 місяців тому

    модуль на DUAL Core или можно не DUAL?

  • @МихаилАваев-х7у
    @МихаилАваев-х7у 3 місяці тому

    Когда сделают колону в розетку ?

  • @ЯсныйГригорий
    @ЯсныйГригорий 7 місяців тому

    Я что-то прослушал. Сначала автор говорит что распознавать будет esp32-c3, потом говорит что у него celeron и поэтому думает долго. И я так понимаю никакого распознавания нет и в помине. Есть сравнение ранее записанных отрывков с тем что произносится и все. Да когда это работает без инета конечно же круто. Но для таких тугих как я хотелось бы более разжеванного материала.

    • @ELFMEDIA
      @ELFMEDIA 7 місяців тому +2

      На ESP32 S3 работает распознавание wake word - начальной фразы обращения (например, "окей набу" или какую настроите). Остальная процедура stt на сервере.

  • @анатоликмамай
    @анатоликмамай 7 місяців тому

    А как можно распознавание сделать в оффлайн режиме?

    • @serega40404
      @serega40404 5 місяців тому

      В home assistant поставить Whisper + Wyoming Protocol + OpenWakeWord + espHome и возможно что то ещё забыл. В интернете есть гайды как это настроить

  • @fgupcao4170
    @fgupcao4170 5 місяців тому

    А музыку включить и gpt чат прикрутить можно?

    • @serega40404
      @serega40404 5 місяців тому

      К сожалению нельзя, но можно написать свою прошивку которая сможет выполнить эти задачи

  • @lDemen
    @lDemen 7 місяців тому

    Подскажите, как оно работает при включенном телевизоре/музыке/пылесосе итд?

    • @vyshnyvetskyy
      @vyshnyvetskyy 7 місяців тому +1

      Мне вот тоже интересно) Если сосед перфоратором работает целый день, делает из стен - сыр... сможет ли "колонка" голос распознавать?

    • @AndrewKobelev
      @AndrewKobelev 6 місяців тому

      Отлично работает, включенный телевизор/музыка/пылесос не помеха

    • @AndrewKobelev
      @AndrewKobelev 6 місяців тому

      @@vyshnyvetskyy сможет

  • @МихаилСоловьев-ч1ф
    @МихаилСоловьев-ч1ф 7 місяців тому +1

    Такие колонки на озоне есть по 300р

    • @serega40404
      @serega40404 5 місяців тому

      Сейчас выбираю на али, такая же 190 руб в категории где надо 3 товара купить и там же есть более крутая версия из описания за 400 руб

  • @Dialbist
    @Dialbist 7 місяців тому

    Выходит что на Rasp 3b+ не имеет смысла делать?

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому

      любой Распберри Пи легко уделает десяток-другой ЕСПшек.

    • @serega40404
      @serega40404 7 місяців тому

      Можно подключить гугл ттс и какое нибудь внешнее распознавание, но это скорее всего будет платно, а так да, rpi не вытянет нейронки по синтезу и распознаванию речи

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому

      @@serega40404 Вытянет, просто синтезировать будет чудовищно долго.

    • @AndrewKobelev
      @AndrewKobelev 6 місяців тому +1

      Смотря ЧТО делать. Если аналог того, что в видео, то , несомненно, на RPi 3, 2 и даже 0 и 1 такая беспроводная колонка с микрофоном заработает, ресурсов у малины в 10 раз больше, чем у ESP32. Если пытаться взвалить на малину 0,1,2,3 серверные функции, распознавание и синтез речи, да ещё заставлять управлять умным домом, то вся эта городильня...даже распознает команду 1-2 раза, затем свалится в коматозное состояние. Получается, что в первом случае просто расточительно использовать Распберри там, где справляется ЕСП, можно найти применение получше, а во втором -- просто не "взлетит".

    • @serega40404
      @serega40404 6 місяців тому

      @@AndrewKobelev gtx730 вытянет киберпанк, просто fps будет мало)

  • @444STG
    @444STG 7 місяців тому

    подскажите а как реализовать аналог алисы без подписок?

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому +1

      Берёте Алису -лайт, или там Марусю...и не оформляете подписку. И алиса безо всякой подписки отвечает на вопросы, сообщает прогноз погоды и включает, например , Радио Джаз.

    • @444STG
      @444STG 7 місяців тому +1

      @@AndrewKobelev ну музыку то не будит включать плюс стучит на тебя самому Якину ☝️😳

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому

      @@444STG Если вам нужно включать музыку, алиса включит одну из 100500 интернет-радиостанций. Боитесь, что сам Якин узнает, тогда "Ирину" запустите или "Сару", она будИт включать, всё , что запрограммируете.

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому

      @@444STG как страшно жить! :-)

    • @444STG
      @444STG 7 місяців тому

      @@AndrewKobelev дорого стоит 5,5к за хрень которая на тебя стучит

  • @smartpal3754
    @smartpal3754 7 місяців тому

    Не i2c а i2s произносится по-разному.

    • @upavla
      @upavla  7 місяців тому

      Да, оговорился

  • @spajalnikom
    @spajalnikom 7 місяців тому

    А без ассистента можно сделать? Как Алиса?

    • @upavla
      @upavla  7 місяців тому

      Ещё так глубоко не вникал. Но там делали так, что колонка отвечала беря информацию из гугла

    • @spajalnikom
      @spajalnikom 7 місяців тому

      @@upavla мне инфа не нужна. Просто для умного дома вкл выкл и все.

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому

      Так алиса--это ведь голосовой ассистент

    • @ELFMEDIA
      @ELFMEDIA 7 місяців тому +1

      У Алисы просто этот ассистент живёт в облаке на серверах Яндекса

    • @AndrewKobelev
      @AndrewKobelev 6 місяців тому

      @@spajalnikomконечно можно! Только это надо, как у Алисы, где всё вынесено на гигантские серверные кластеры, вы же автономии хотите?
      В общем, если надо вкл-выкл по голосовым командам, то самое тяжелое - это запустить распознавание речи в текст. Это кусочек от проекта Ирина, или Сара. Делается за пару вечеров. Надо найти какой-то комп или одноплатник под сервер. Если сможете на него установить numpy (и желательно, но не обязательно, matplotlib) , значит железо, скорее всего, потянет и вам это тоже по плечу. Только надо решить, какое устройство и по какому протоколу будет делать ВКЛ-ВЫКЛ.

  • @alex_cube
    @alex_cube 7 місяців тому

    Интересный проект. Спасибо за такие виедео.
    Жаль не получится сделать колонку на HASS на базе TV Box H96 Max на процессоре Rockchip RK3318. Ему явно не хватит ресурсов для распознавания голоса.
    Вот если бы был способ вынести распознавание на отдельную машину, да ещё и встроить её в колонку, это было бы вообще шикарно.

    • @upavla
      @upavla  7 місяців тому +4

      На тв приставке этой добились хорошего распознавания. 2 секунды думает. Но там с локальной базой

    • @bambatv
      @bambatv 7 місяців тому

      @@upavla Можно пример как это сделать?

    • @fisher7452
      @fisher7452 7 місяців тому

      ​@@bambatvтакое ощущение, что Вы не посмотрели видео до конца.
      Но я тоже за освещение темы локальных голосовых баз, хотя меня пока и Алиса мини вполне устраивает

    • @AndrewKobelev
      @AndrewKobelev 7 місяців тому

      Не городите ерунду, у Rockchip RK3318 ресурсов на пару порядков больше, чем у любого МК , даже ЕСП.

    • @ELFMEDIA
      @ELFMEDIA 7 місяців тому

      @@AndrewKobelev При чём тут МК, распознавание голоса на сервере происходит, кроме wake word. Если целик не вывозит, то тв приставка тоже не вывезет

  • @Mobile_goha
    @Mobile_goha 6 місяців тому

    собрал данный девайс и разочарован это мягко говоря я думаю до Алисы им еще лет 5

  • @rainnbrain
    @rainnbrain 7 місяців тому

    в заголовке ты пишешь esp32, а по итогу это на esp32 не будет работать, нужен esp32s3, ну так сразу написать нельзя было?

    • @upavla
      @upavla  7 місяців тому +1

      Почему не будет работать? Я в видео работу и на esp32 показал. И инструкцию сделал на работу esp32. Повнимательнее. Демонстрация работы есть в видео и ссылка на схему подключения естьв описании видео. И не "тыкайте".

  • @MrDoctorant
    @MrDoctorant 7 місяців тому

    добрый день. я к сожалению не программист, но интересуюсь)) и возник вопрос: а можно вашу разработку скрестить с голосовым ассистентом из этого видео: ua-cam.com/video/bu-tJTA-kKs/v-deo.htmlsi=9msnNuvYFAMEWhjO

  • @PonikaLabs
    @PonikaLabs 7 місяців тому

    Супер. Только esp32 ц3. Не c

    • @upavla
      @upavla  7 місяців тому

      Наоборот

  • @Dennis_Gray
    @Dennis_Gray 7 місяців тому +1

    м-да, чего только не придумают из-за больной паранойи... вам самим не смешно?)))))

    • @upavla
      @upavla  7 місяців тому

      А что должно быть смешного в колонке менее чем за 1000 рублей?

  • @MARK2580
    @MARK2580 7 місяців тому

    мужик, ты в курсе что в браузере есть такая замечательная функция как ЗАКЛАДКИ !!!!
    ещё и клавиатура вся обосрана, постеснялся бы такое снимать.

  • @Василь-239
    @Василь-239 7 місяців тому +1

    Алиса устраивает! Зачем эта наабу?

    • @upavla
      @upavla  7 місяців тому +5

      Вам не нужна:)

    • @Василь-239
      @Василь-239 7 місяців тому

      @@upavla Не в этом смысл. Может у нее приемущества есть? Чем она лучше? Или только одно приемущество - цена? Может надо сравнить с Алисой. Чем лучше та или другая система?

    • @ruslanumaev3569
      @ruslanumaev3569 7 місяців тому

      фишка в локальности@@Василь-239

    • @begineras
      @begineras 7 місяців тому

      @@Василь-239 алиса умеет работать без интернета?

    • @ДмитрийБурага-в6з
      @ДмитрийБурага-в6з 7 місяців тому

      Может быть потому что Алиса вас всегда слушает. И что она на свои сервера посылает никто не знает. А тут локальное решение

  • @OlegPogodaev
    @OlegPogodaev 7 місяців тому +1

    Какой геморой и убогость по сравнению с Алисой!