- 79
- 166 967
Мотькин ИИ
Belarus
Приєднався 4 лип 2022
Я Мотькин Игорь. Специалист в области искусственного интеллекта (ИИ). Исследую всё что связано с ИИ. Это и классическое машинное обучение и робототехника, включая манипуляторы и беспилотный транспорт. На этом канале буду размещать информацию, связанную с исследованиями.
Jetson Orin NX. Детекция изображений, обучение модели. Детекция в Арме.
Данное видео посвящено обучению модели детекции для Jetson. Для начала мы повторим пример, который предоставили авторы. Обучим модель распознавать фрукты и проверим качество модели на своих изображениях.
Далее выполним обучение нескольких детекторов для датасета Арма. Проверим качество детекции сначала на тестовых изображениях. А затем с помощью камеры и в самой игре Арма. Попробуем в реальном времени делать детекцию в процессе игры.
Таймкоды:
00:00 | Введение
01:31 | Подготовительные операции перед обучением
04:35| Обучаем модель детекции на примере из документа
07:21 | Конвертация и экспорт модели на jetson
08:52 | Выполняем детекцию для обученной модели на 30-ти эпохах
11:25 | Обучение модели 100 эпох для датасета фруктов
15:04 | Подготовка к детекции на датасете Арма
17:13 | Обучение модели детекции на датасете Арма 300 пикселей
20:25 | Обучение модели детекции на датасете Арма сжатые изображения
30:22 | Камера + детекция + игра Арма
38:33 | Разбираем главный файл для обучения детектора
45:15 | Детские игры
Далее выполним обучение нескольких детекторов для датасета Арма. Проверим качество детекции сначала на тестовых изображениях. А затем с помощью камеры и в самой игре Арма. Попробуем в реальном времени делать детекцию в процессе игры.
Таймкоды:
00:00 | Введение
01:31 | Подготовительные операции перед обучением
04:35| Обучаем модель детекции на примере из документа
07:21 | Конвертация и экспорт модели на jetson
08:52 | Выполняем детекцию для обученной модели на 30-ти эпохах
11:25 | Обучение модели 100 эпох для датасета фруктов
15:04 | Подготовка к детекции на датасете Арма
17:13 | Обучение модели детекции на датасете Арма 300 пикселей
20:25 | Обучение модели детекции на датасете Арма сжатые изображения
30:22 | Камера + детекция + игра Арма
38:33 | Разбираем главный файл для обучения детектора
45:15 | Детские игры
Переглядів: 76
Відео
Jetson Orin NX. Детекция изображений, используя предобученную модель.
Переглядів 7521 день тому
В этом видео рассмотрим как выполняется детекция отдельных изображений, используя jetson-inference и модель SSD. Также напишем свою программу для детекции и при этом используем модель FCOS и даже Faster R-CNN. Интересно, что же получится. Затем проведём эксперимент с видео файлом и непосредственно видео потоком с камеры. Ссылка на это же видео на: Платформа: plvideo.ru/watch?v=FwnvzR-Y8cJ2 Rutu...
035. Детекция на основе R-CNN, Fast R-CNN.
Переглядів 10328 днів тому
Этим видео начнём серию, посвящённую нейросетевым методам детекции и сегментации. R-CNN можно считать базовой моделью для детекции после революционной модели AlexNet. В этом видео, мы теоретически рассмотрим модель R-CNN и Fast R-CNN. На данный момент они считаются устаревшими, так как уже как минимум есть Faster R-CNN. Но для сохранения хронологии и понимания эволюции всего семейства R-CNN, я ...
001. HSV. Сегментация изображения на основе HSV. С практическим уклоном.
Переглядів 244Місяць тому
Этим видео начинаю плейлист, посвящённый сегментации. Самое простое, по чём можно сегментировать объекты - это их цвет, а точнее оттенок. Именно модель HSV даёт нам канал оттенка (Hue). А это позволит сделать фильтр цвета и тем самым сегментировать изображение. В видео мы разберёмся как конвертировать RGB в HSV, да и вообще попробуем понять, что лежит в основе HSV. И даже будет немного информац...
Jetson Orin NX. Обучение модели для задачи классификации (ConvNeXt)
Переглядів 91Місяць тому
В предыдущем видео мы использовали предобученную модель на датасете ImageNet, однако это не совсем удобно. Поэтому в этом видео мы обучим модель на своём собственном датасете. И сможем решать нужные нам задачи. Здесь мы взглянем на код, с помощью которого выполняется обучение. Вместо предложенного в демо датасета и модели мы будем использовать свой собственный датасет и модель. В качестве датас...
Jetson Orin NX. Классификация изображений, используя предобученные модели.
Переглядів 106Місяць тому
В этом видео мы посмотрим как запустить модель классификации изображений на Jetson с помощью Jetson-inference. Разберём демо пример. Получим результаты для модели Googlenet, Resnet-152, Inception-v4 и проанализируем полученные результаты. Далее напишем свой код для того, чтобы запустить на Jetson транформерную модель Swin. Успешно запустим и взглянем на результаты. А ещё посмотрим, как запустит...
050. MMSegmentation фреймворк. Знакомство.
Переглядів 148Місяць тому
В этом видео я познакомлю вас с фреймворком mmsegmentation от наших китайских братьев. Установим необходимые библиотеки. Скачаем предобученные модели, и испытаем их для задачи классификации дорожной обстановки, условно для беспилотного транспорта. Таймкоды: 00:00 | Введение 03:06 | Что из себя представляет MMSegmentation в целом 04:10 | Настраиваем инфраструктуру с conda 08:00 | Запускаем демо ...
02 Тестовое задание CV. UNet модель на PyTorch для детекции Canny (Python, OpenCV, PyTorch)
Переглядів 2782 місяці тому
В этом видео идёт разбор тестового задания на позицию Computer Vision инженер. Само условие тестового задания было не совсем понятно даже после уточняющих вопросов. Поэтому в результате выполнялось следующее задание, но моими словами: «На PyTorch создать модель UNet, для того чтобы можно было с помощью этой модели получать такой же результат, как и Canny Edge detection из библиотеки OpenCV. Рас...
01 Тестовое задание CV. Поиск таблицы на изображении и чтение данных из неё (Python, OpenCV, Pandas)
Переглядів 2382 місяці тому
В этом видео идёт разбор тестового задания на позицию Computer Vision инженер. Фактически нужно было найти таблицу на изображении и, на основе данных из этой таблицы, нужно было сформировать выходной json. Задача выполняется с помощью элементов классического компьютерного зрения (фактически просто две функции). Всё остальное выполняется на табличных данных, полученных в качестве исходных данных...
Jetson Orin NX. Что за зверь? Испытаем на Yolo v8 и сравним с десктопными видеокартами.
Переглядів 2853 місяці тому
Ссылка на это же видео на платформе: plvideo.ru/watch?v=Thz7xBMIRELa В этом видео мы познакомимся с Jetson Orin NX. Начнём от комплекта покупки, далее рассмотрим какие они бывают и кратко чем отличаются. Взглянем на то, что есть в железе и на программное обеспечение. А на последок проведём большой эксперимент на понимания производительности Jetson Orin NX на выполнении задачи сегментации кубика...
CVAT. Путешествие по рассылке. Часть 2 (март 2024 - май 2024)
Переглядів 683 місяці тому
Ссылка на это же видео на Платформе: plvideo.ru/watch?v=kN49hOc3WBo6 Это продолжение путешествия по рассылке от CVAT. Посмотрим какая там есть информация. Что нового добавили о чём я ещё не знаю. Заодно выскажу своё мнение. Ещё будет продолжение. В этом видео даже наеду на содержимое рассылки от CVAT. Таймкоды: 00:00 | Введение 00:30 | Как получить формат YOLOv8 04:45| Самые известные датасеты ...
100. Segment Anything Model 2. Обзор возможностей.
Переглядів 2193 місяці тому
это видео на Платформе: plvideo.ru/watch?v=-Xm-7kiyjgXG Вот только на днях вышла вторая версия модели Segment Anything Model. Когда впервые увидел первую модель, то я был ей восхищён. Поэтому, как только вышла модель, я сразу пошёл смотреть как она работает и главное, что может делать. В этом видео я пройдусь по тем примерам, которые представили авторы модели, а также пример, который сделали Ro...
CVAT. Путешествие по рассылке. Часть 1 (ноябрь 2023 - март 2024)
Переглядів 1503 місяці тому
Вот есть такое развлечение, приезжаешь на вокзал и берёшь билет на первый поезд, самолёт. Так сказать, полагаешься на случай. Вот и я решил поиграть в такую игру. Рассматривать то, что присылает в рассылке CVAT. Изначально думал, что там только то, что касается самой программы разметки. Но оказалось, что есть ещё интересные статьи. В этом видео я проделаю путь по той информации, которую CVAT пр...
Искусственный интеллект для бизнеса. О сложностях внедрения. (Динамичное видео)
Переглядів 4664 місяці тому
Видео в первую очередь создано для тех, кто хочет внедрять искусственный интеллект (ИИ) в свой бизнес. Я, как ML инженер, собрал в это видео ту информацию, о чём бизнес должен понимать. Информация разделена на блоки, каждый из которых описывает определённый элемент, с которым бизнес будет сталкиваться в большей или меньшей степени. Также это видео будет полезно абсолютно всем, кто интересуется ...
025 Классификация изображений. Часть 18. ConvNeXt (2022)
Переглядів 3695 місяців тому
Мы рассмотрели уже много моделей на основе свёрточных сетей и только 2 модели на основе трансформера. И могло сложиться впечатление, что в компьютерном зрении эпоха свёрток заканчивается и начинается эра трансформеров. Но команда от Facebook AI Research провела большое исследование и смогла доказать, что современная архитектура ещё может строиться на свёртках. Авторы за основу взяли уже старень...
024 Классификация изображений. Часть 17. Swin Transformer (2021)
Переглядів 1,3 тис.5 місяців тому
024 Классификация изображений. Часть 17. Swin Transformer (2021)
023 Классификация изображений. Часть 16. EfficientNet v2 (2021)
Переглядів 2805 місяців тому
023 Классификация изображений. Часть 16. EfficientNet v2 (2021)
022 Классификация изображений. Часть 15. ViT (Vision Transformer) (2020)
Переглядів 7896 місяців тому
022 Классификация изображений. Часть 15. ViT (Vision Transformer) (2020)
021 Классификация изображений. Часть 14. RegNet (2020)
Переглядів 3066 місяців тому
021 Классификация изображений. Часть 14. RegNet (2020)
020 Классификация изображений. Часть 13. EfficientNet v1 (2020)
Переглядів 2787 місяців тому
020 Классификация изображений. Часть 13. EfficientNet v1 (2020)
019 Классификация изображений. Часть 12. MobileNet v3 (2019)
Переглядів 1927 місяців тому
019 Классификация изображений. Часть 12. MobileNet v3 (2019)
018 Классификация изображений. Часть 11. MnasNet (2019)
Переглядів 1367 місяців тому
018 Классификация изображений. Часть 11. MnasNet (2019)
017 Классификация изображений. Часть 10. MobileNet v2 (2019)
Переглядів 3977 місяців тому
017 Классификация изображений. Часть 10. MobileNet v2 (2019)
016 Классификация изображений. Часть 9. ShuffleNet (2018)
Переглядів 2217 місяців тому
016 Классификация изображений. Часть 9. ShuffleNet (2018)
015 Классификация изображений. Часть 8. DenseNet (2018)
Переглядів 4977 місяців тому
015 Классификация изображений. Часть 8. DenseNet (2018)
014 Классификация изображений. Часть 7. Wide ResNet (2017)
Переглядів 1798 місяців тому
014 Классификация изображений. Часть 7. Wide ResNet (2017)
013 Классификация изображений. Часть 6. ResNeXt (2017)
Переглядів 2638 місяців тому
013 Классификация изображений. Часть 6. ResNeXt (2017)
012 Классификация изображений. Часть 5. SqueezeNet (2016)
Переглядів 2638 місяців тому
012 Классификация изображений. Часть 5. SqueezeNet (2016)
011 Рефакторинг кода классификации. Часть 1 (жизненный опыт и программирование)
Переглядів 4368 місяців тому
011 Рефакторинг кода классификации. Часть 1 (жизненный опыт и программирование)
010 Классификация изображений. Часть 4. ResNet (2015)
Переглядів 4828 місяців тому
010 Классификация изображений. Часть 4. ResNet (2015)
Очень интересно 😮❤🎉 Огромное спасибо вам за труд ❤🎉😊
И вам спасибо что смотрите и за тёплые слова
Класс спасибо!
Всегда пожалуйста :)
Добрый день, а планируются новые ролик ?) спасибо за контент
Здравствуйте. Спасибо что смотрите. Видео, посвящённое AlexNet, - это одно из серии видео по классификации. Я дошёл до 2022 года и сети Swin и ConvNeXt -уже доступны в плейлисте. Сейчас переключился на детекцию и сегментацию. Постепенно делаю и публикую, когда есть возможность.
@@Motskin_AI спасибо за то что вы делаете))
Только начинаю вникать очень интересно но ничего не понятно. Можно туда поставить Windows? Хотелось бы использовать его как обычный компьютер. Но с возможностью нейросетей. Например я сейчас говорю этот текст прямо в окно комментария но всё никак не могу найти И сделать оффлайн распознание речи. И конечно же интересно тренировка Языковых моделей. Судя из результатов наверное лучше купить видеокарту Хотя цены не смотрел Там наверное видеокарты по заоблачным ценам.
Windows нельзя поставить. Если вам нравится маленький корпус, то тогда нужно смотреть в сторону миникомпьютеров с обычным железом, как в ноутбуках. Jetson для других задач. Его можно использовать как обычный компьютер на Ubuntu, однако есть нюансы из-за специфической архитектуры. Но если вы хотите себе компьютер для обучения моделей, то Jetson точно не подходит, он не сможет тягаться с полноценной видеокартой. Как раз видео сейчас делаю, где обучаю на видеокарте, а вот инференс буду делать на Jetson
@@Motskin_AI Спасибо. Жаль. Но ничего Буду тогда ждать видео про видеокарту. Думаю как-то её подключить к ноутбуку. Или может если найду какой-то подходящий Мини ПК
спасибо большое за Ваш труд
И вам искреннее спасибо, что смотрите и что находите возможность в комментарии благодарить.
Очень интересно 🎉❤ Огромное спасибо вам за труд ❤🎉😊
Вам также спасибо что смотрите и что оставляете такую обратную связь
И вам привет из Белорусского города Гомеля! А также и из других уголков) смотрим вас всей группой
Землякам конечно отдельный привет :)))
Видосы прям супер крутые!
Спасибо за ваш отзыв, будет возможность буду делать видео :)
Видос супер, продолжайте в том же духе
Благодарю за отзыв, буду стараться
Ссылки на это же видео на российских ресурсах: Rutube: rutube.ru/video/private/350b09233cab1a6609c243f9854003ad/?p=hw1x_rFk3R7tHySWAszq2A Платформа: plvideo.ru/watch?v=Rs8JQbB0ZQJq
Можете подсказать, что за дата сет показан на видио с военой техникой?
Конечно могу, это мной созданный датасет, я его называю Арма. Все подробности вы сможете узнать в первых видео этого плейлиста. И в частности видео "ua-cam.com/video/cV2CQ77QgDw/v-deo.html"
@@Motskin_AI Спасибо
В какой-то момент был хайп CSP-connection вместо residual, интересно подойдет ли он к ConvNeXt
Может быть..., нужно проверять.
Спасибо, очень интересно. Только начинаю интересоваться ИИ. Подписался.
Надеюсь будет полезным контент. Правда у меня он имеет явный уклон в сторону компьютерного зрения.
Благодарю за отличное видео! Ваше объяснение сегментации по цвету и использование модели HSV оказалось невероятно понятным и интересным. Было полезно узнать, как конвертировать RGB в HSV и что именно лежит в основе этой модели. Особенно ценю ваше внимание к деталям и практическим примерам, которые делают процесс обучения гораздо увлекательнее. Очень понравилась практическая часть, где вы демонстрируете сегментацию на изображениях кубиков и Армы. Эти примеры наглядно показывают, как можно использовать фильтр цвета для отделения объектов от фона и детекции на основе оттенка. Такие подробные и понятные уроки действительно помогают лучше освоить обработку изображений. Хочется видеть больше таких видео! Вы обладаете уникальной способностью объяснять сложные вещи простым языком, что делает обучение доступным и интересным. Пожалуйста, продолжайте снимать уроки на эту тему, они очень полезны для всех, кто интересуется компьютерным зрением и обработкой изображений.
Огромное спасибо за такой тёплый комментарий и что так положительно оценили мою работу.
Альтернативный канал и ссылка на это же видео на Платформа plvideo.ru/watch?v=k6-trmvwOzFm
Спасибо, отличный контент.
Рад стараться :)
Спасибо за разжевывание кода и комментарии в нем. Именно это делает видео не только интересным, но и полезным
И вам спасибо, что смотрите и комментируете. Приятно!
Ссылка на это же видео на Платформе: plvideo.ru/watch?v=EO3ZkN380X_0
Слушай а он может опознавать объекты? img ->text?
Не понял вопрос. Даже преобразование изображение в текст может быть для разных задач. Если у вас изображение документа, а вам нужен из него текст, то это задача OCR и у этих ребят есть MM_OCR. А может нужно, чтобы описывало изображение, т.е. что находится, что происходит. То это Image Description. И для этого есть решения,
@@Motskin_AI я просто думал что он к сегментам еще может Image Description добавить
@@bbrother92 Так для этого модель должна быть определённой архитектуры и обучена соответствующим образом. А в этом видео обучалась на датасете, который размечался вот точно также как сейчас распознаётся. Т.е. для каждой модели, своя задача, но эта не предназначена для описания изображения. Хотя она знает где человек, где машина, как они расположены...
25:06 - ну судя по переводу 70 миллионов меченных, и это тип 1/40 от общего кол-ва
Я полностью с вами согласен. В видео оговорился. 70 млн размечено, а ещё 39*70 млн не размечено. Спасибо за вашу внимательность!
Привет. можешь объяснить как в CVAT размечать ровные квадарты точнее, если в других инструметах я могу зажать shift и строится ровный прямогульник с равными сторонами, то CVAЕ я хз. и второе: зачем нужен элипс? если я хочу обучить yolo находить круги но yolo работает с огран. рамками прямоуг. то как быть?
Здравствуйте. Если кратко, то с этими двумя вопросами я не смогу помочь. Что касается разметки квадратами (т.е. где все стороны равны), то даже и не знал, что где-то существует такой способ разметки. И даже не представляю для чего может понадобиться такая разметка. Может вы поделитесь информацией о задаче, для которой понадобилась такая разметка? Лично я использую разметку полигонами, но иногда и прямоугольниками. Всё остальное уже делаю скриптами на файле аннотации. По эллипсам, у меня есть предположение, что сила эллипса - это математическая формула, И если вам нужно разметить круглые формы, то только эллипс позволит вам сделать это с математической точностью, в отличии от полигона. И, кстати, YOLO не только прямоугольники находит, т.е. задача детекции, но ещё и выполняет задачу сегментации, а это значит, что подсветит вам этот круг в прямоугольном изображении.
@@Motskin_AI Обучил самую большую модель yolo8 обнаруживать круги с помощью инста сегментации на 1600 размеченных данных но yolo не справилась. Хочу попробовать другую нейросеть которая находит очертания окружности и выводит координаты xy и радиус. пытался сделать что то с (преобразованием хафа но не понял как интегрировать это в обучение) в общем я полный 0. Могу скинуть картинку что именно мне нужно обнаружить. может поможете советом.
@@raphaild279Да, конечно, сбросьте на почту, которая в конце видео приведена. я хоть буду понимать про что речь
Ссылка на это же видео на Платформе: plvideo.ru/watch?v=MBeIu9u2HnCe
А что за софтина смотреть загрузку системы? Ну типа top или htop
Я использую nvitop на стационарном компьютере. Может кто знает ещё что-то лучшее?, то пишите. По факту я взял первый попавшийся инструмент.
А ты на какой операционной системы все записываешь?)
Windows 11. Для ML использую ubuntu через WSL
@@Motskin_AI а она норм прикидывает видеокарту? Без супер багов?
@@eduardmart1237 как родную. А некоторые задачи обработки изображений так вообще быстрее исполняется под WSL, чем на чистом Windows. Возможно в Ubuntu более оптимальная файловая система. Но я исследования не проводил, просто обратил на это внимание.
Редкий случай отличного изложения материала. Спасибо.
Спасибо за тёплые слова, буду стараться держать качество.
Хорошо что не взяли. Странная компания, надо избегать таких
Я считаю, что компания нормальная. И лично я горжусь, что в моей стране есть такая компания. Видимо просто сработал человеческий фактор. Как говорится не произошёл Match.
Спасибо за интересное видео, как раз разбираюсь с архитектурой UNet. Подскажите, это все собеседования на позицию senior или middle?
Там не обговаривалась позиция. Ко мне обратились, я даже и не был в активном поиске, уточнили мой опыт. Спросили зарплатное ожидание. Я ответил. Дальше начались этапы собеседования - значит меня, с моими зарплатными ожиданиями, рассматривали как потенциального кандидата. Но на 4-м этапе собеседования я уже осознавал, что по предстоящим обязанностям предстояло выполнять множество задач самостоятельно . Т.е. я оцениваю эту позицию ближе к сеньёрской. А вот в первом видео, там уже больше позиция middle.
@@Motskin_AI Все что хотел узнать, узнал (уровень заданий), спасибо, хорошей ЗП и итнересных проектов.
@@davidmishel4348 И вам спасибо за интерес
Здравствуйте, спасибо за материал. Есть ли у вас github где можно посмотреть код из разных видео?
Ой, я приношу извинения. Пока публично не выставляю код. Стараюсь полностью его показывать в видео и вы всегда можете его воспроизвести. Конечно, понимаю, что это не удобно. Но, к сожалению, есть юридические нюансы и я не уверен, что могу фрагменты кода публиковать с возможностью мгновенного копирования. Ещё раз прошу прощение.
@@Motskin_AI Спасибо за вашу работу. Достаточно и того что вы даёте!
@@dudedudedudedude3333 Спасибо за понимание
спасибо
И вам спасибо за спасибо :)
Видео топ. Очень оригинально и структурно получается (особенно понравилась серия видео с армой). Как вообще ситуация обстоит в Беларуси с DS-культурой?
Спасибо за тёплые слова. С Армой планирую продолжать. Сейчас жарко и не хочется эксплуатировать видеокарту. Что касается ситуации с DS в Беларуси, то честно сказать не знаю. Когда были крупные компании, типа ЕПАМ, то они организовывали различные мероприятия, в том числе и по DS. Сейчас западные компании стараются не привлекать к себе внимания и прижали все пиар мероприятия в стране. А без спонсоров, сложно что-то организовывать. Российские компании медленно заходят, но сколько ещё времени понадобится - неизвестно. В любом случае в Минске куда больше возможностей для DS. У меня в Гомеле вообще с этим сложно. Даже компании, у которых есть офисы в Гомеле, не открывают вакансии для DS, а только в Минске. Так что по сообществам пока тихо. Я вот решил развивать глобальное русскоязычное сообщество. Пока только с помощью видео. Пока есть возможность - буду выпускать видео. Но люди точно есть, правда нас по объективным причинам не так много как тех же Джавистов, .NET, Геймдевовов, мобильщиков. И когда в Гомеле появятся условия для развития DS, то я с удовольствием поддержу.
Очень круто
Спасибо что смотрите и спасибо за поддержку
Ссылка на это же видео на Платформе: plvideo.ru/watch?v=25RHkWZJXmTX Пишите в комментариях чтобы и как бы вы улучшили в этом решении
"Только давайте без политики" - вот ты и ответил на свой вопрос)
Понятное дело, что политика важный фактор, но совсем бы не хотелось на канале, посвящённому элементам ИИ, обсуждать политические вопросы. Поэтому и попросил чтобы не было политики. Пусть хотя бы здесь в мире будут присутствовать и Россияне и Беларусы и Украинцы и другие народы, кто понимает русский язык, на котором говорит автор канала. Спасибо за ваше понимание
Ссылка на видео на Платформа: plvideo.ru/watch?v=0DWzRyCeIaUL
Очень интересно, огромное спасибо вам за труд!❤🎉😊
И вам спасибо что смотрите и выражаете своё мнение
А в чем преимущество onnx? Быстрее?
onnx я использовал только для того, чтобы открыть модель в netron. А ещё это формат на границе зоны разграничения ответственности разных команд. Например, для DataScience и Computer Vision специалиста целью является получить обученную модель onnx. А у разработчиков, например веб-разрабочиков на .NET, Java, Python или для Android разработчиков это простой файл, который они встраивают в свой код и им не нужно задумываться как он создавался. Они просто знают, что он самый оптимальный на данное время в их компании...
А почему каждый слой конволюции дает разные значения? Точнее не слой а канал в первом слое. Разные начальные значения? Ну условно почему не 10 одинаковых?
Да, разные значения. Это как если бы мы нарисовали картинку зайчика и показали её на 5 секунд 10-ти человекам (аналогия со слоями свёртки) и попросили их по памяти нарисовать то, что они видели. Вроде у всех получится заец, но у всех он явно будет разным. Другие 10 человек, это уже как бы следующий слой. Это просто условно. Понятное дело, что в примере с зайцем все люди будут переносить свой опыт и знания о зайцах. Но если показать им всем картинку чего-то совсем неизвестного (несуществующего), то и результат получится более интересным.
Интересно - узнал что тот самый илья из opeAI изобрел AlexNet.
Ну может он удачно поучаствовал. Сеть то называется АлексНет, а не ИльяНет :)
Очень нравится что ты прям все подробно и споконой рассказываешь!) очень приятно смотреть.
Спасибо
А ссылки на исходники будут?
А я решил исходники не выкладывать. Всё равно они решают какую-то специфическую задачу, а тем более что по видео можно восстановить весь код.
И сколько времени у тебя ушло написать такой скриптик?
Честно, не помню. Конечно, много заготовок у меня уже было и они кочуют от одного проекта к другому, но пришлось конечно повозиться с алгоритмами обрезки, хотелось разнообразить данные. Так как не всё гладко шло, и как это обычно бывает на 1000 изображений обязательно находилось хоть одно, которое не вписывалось в общую логику. Но так как случаи живые, то приходилось и их покрывать кодом.
И получатся сами файлы сохраняются синхронно?
О! как я указал чуть ранее в ответе на комментарий - Да, сохранение данных выполняется синхронно, в противном случае получу Exception - проблему с доступом к файловой системе.
А в данном случае GIL не мешает многопоточности?
Почти не мешает. Правда конечно есть проблема с записью файлов из самого потока. Но я в коде многопоточность использую для обработки данных и удерживаю в памяти. А когда Чанк обработан, то в последовательном режиме создаю файлы. И никаких конфликтов не возникает.
А для гта5 исходники были получается?? Ну кстати можно нечто подобное сделать на открытом движке - типа юнити или унреал. Там даже специальные плагины для этого есть.
Как раз в статье (которую указал в комментарии для другого видео) и описывали как они делали. И это сильно не понравилось издателю GTA. В результате пришлось приостановить работы других энтузиастов. Если интересно, то покопайтесь в этой теме. Если будете искать self-driven GTA то обязательно найдёте следы. Но уже увы, много чего недоступно
А можно это как то оптимизировать и автоматом делать? Может мод какой нибудь. Чтоб сразу с bounding boxes было. Я знаю для unity есть - Perception
Для этого нужно вмешиваться в код игры, а у меня такой возможности нет. Например, как это делали в GTA можно посмотреть в статье: "Playing for Data: Ground Truth from Computer Games". Но в этом случае есть проблемы с авторскими правами.
Крутая задача, кайфово смотреть!
Как бы вот ещё добраться до задачи сегментации на этих данных :)
Кайф, очень интересно смотреть
Приятного просмотра
Вау, спасибо за труд, очень круто!
Вам явно зашла серия видео :), Желаю получить удовольствие от просмотра!
Очень круто и доступно объясняешь. Спасибо чувак! Лайк, подписка.
спасибо, приятного просмотра
Бро это то что мне нужно. Уплетаю твой плейлист с большим интересом, хочу освежить память перед собесом. Очень круто что ты также рассказываешь про авторов статей
Большое спасибо. Приятного просмотра. Что касается авторов, то здесь двоякое мнение. В любом случае познакомились с большим числом авторов и кто чего достиг. Однако в будущем крайне мало вероятно, что буду рассказывать про авторов.