Векторизация русского текста на Python | Обработка естественного языка

Поділитися
Вставка
  • Опубліковано 31 тра 2024
  • Демонстрация простых методов векторизации русского текста на Python
    00:00 - Загрузка и подготовка набора данных
    01:48 - Подсчет частоты встречаемости слов в наборе данных
    05:04 - Составление словаря кодов слов
    10:12 - Преобразование текстов в последовательности кодов слов
    14:52 - Создание мешка слов (bag of words)
    Ноутбук из видео - colab.research.google.com/dri...
    Проект реализуется победителем Конкурса на предоставление грантов преподавателям магистратуры благотворительной программы "Стипендиальная программа Владимира Потанина" Благотворительного фонда Владимира Потанина"
    вКонтакте - avsozykin
    telegram - t.me/a_sozykin
    Мой сайт - www.asozykin.ru
    Мой канал с краткими и понятными объяснениями сложных тем в ИТ и компьютерных науках - / andreysozykincs
  • Наука та технологія

КОМЕНТАРІ • 9

  • @user-hb6dg7gp3b
    @user-hb6dg7gp3b 9 місяців тому

    Спасибо вам за то, что вы так хорошо и доступно объясняете!

  • @chessketeer
    @chessketeer 8 місяців тому

    Спасибо! Просто отличный урок👍

  • @sherlockholmes5736
    @sherlockholmes5736 Рік тому +3

    Хорошо объяснили, спасибо! Вовремя урок вышел, читал книгу "Глубокое обучение на python" Шолле(создатель keras), там в первом примере такая же задача) Только с классификацией отзывов IMDB

    • @AndreySozykin
      @AndreySozykin  Рік тому +2

      Да, определение тональности текста - востребованная и популярная задача. Но для нее не всегда нужны нейронные сети, часто достаточно классических алгоритмов машинного обучения.

  • @Julia-ej4jz
    @Julia-ej4jz Рік тому

    Большое спасибо 🤩🤩🤩

  • @kaperdi1653
    @kaperdi1653 Рік тому

    огонь .сел изучать, нашел подписался))

  • @simplechannel7859
    @simplechannel7859 Рік тому +2

    Андрей, спасибо!

  • @TIENTI0000
    @TIENTI0000 Рік тому +1

    годно!