#032
Вставка
- Опубліковано 13 лис 2021
- Это специальный выпуск подкаста, поводом к которому послужила выложенная Сбером в открытый доступ русская версия модели для генерации изображений по текстовому описанию (ruDALL-E). В гостях Сергей Марков - управляющий директор, начальник управления экспериментальных систем машинного обучения департамента SberDevices, принимавший самое непосредственное участие в создании модели. Поговорили о том, какие сложности возникли на пути создания ruDALL-E, где брали датасеты для обучения, какая у сети архитектура, какие могут быть возможные применения сети и стоит ли дизайнерам-иллюстраторам уже начинать искать новый род занятий и многом другом интересном!
Ссылки выпуска:
Сайт проекта (rudalle.ru/)
Статья на Хабре "ruDALL-E: генерируем изображения по текстовому описанию, или Самый большой вычислительный проект в России" (habr.com/ru/company/sberbank/...)
GitHub ruDALLI-E (github.com/sberbank-ai/ru-dalle)
Телеграм-бот, с помощью которого можно генерировать картинки по запросу (t.me/sber_rudalle_xl_bot)
Статья на arxiv.org "Zero-Shot Text-to-Image Generation" (arxiv.org/pdf/2102.12092.pdf)
Генерация музыки от OpenAI в проекте Jukebox (openai.com/blog/jukebox/)
Поддерживайте подкаст на Patreon ( / machinelearningpodcast )
Выпуск подкаста на anchor.fm - anchor.fm/kmsrus/episodes/032...
Все выпуски подкаста на anchor.fm - anchor.fm/kmsrus
Подкаст на Apple Podcasts - podcasts.apple.com/ru/podcast...
Подкаст на Google Подкастах - podcasts.google.com/feed/aHR0...
Подкаст в Яндекс Музыке - music.yandex.ru/album/9781458
Паблик подкаста ВКонтакте - mlpodcast
Телеграм-канал "Стать специалистом по машинному обучению" - t.me/toBeAnMLspecialist
Телеграм автора подкаста - @kmsint
💪