Поиск объектов на видео с Python и TensorFlow с нуля, cтроим и обучаем нейросеть UNet

Павел Васильев

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 3 лют 2025

КОМЕНТАРІ • 76

@goga-pro2024 Рік тому ⁺¹⁸
самое лучшее обьяснение за всю мою жизнь, а я с нейронками с 2014 года, обьясни людям в следующем видео как продолжить обучение не начиная с нуля, этого матерьяла мало в нете
@НикитаФилиппов-л5г 2 роки тому ⁺²⁰
Отличное Видео. С пояснением всего что сделано. Автору большое спасибо. Если такое же видео будет сделано и для других типов сетей или например PyTorch, было бы очень круто! Автору большое уважение.
@TheBestSurvival Рік тому ⁺⁶
Качественно и доступно, а главное реально интересно и полезно! Автору желаю 100500 подписчиков))
@ernisesama1636 3 роки тому ⁺¹⁸
Наверное самое понятное обяснение на UA-cam. Продолжай пожалуста
@Alex_Smirnov Місяць тому
Я конечно не понимаю в нейронках вообще ничего, но думаю что на начальном этапе нейронке нужно определить свойства, все характеристики объекта. К примеру сначала определяется формат изображения, его разрешение, итд. Нужно просканировать весь файл на наличие свойств, исходя из этих свойств определять дальнейший алгоритм действий с файлом. То есть я хочу сказать что объект для анализа должен иметь максимально полную информацию о себе. Эпохи как я понял это своего рода определение координат для фокуса внимания. Чем меньше эпох тем умнее алгоритм сети. Исправлять дефекты так себе идея, это ведь не фотошоп, сеть должна это делать без ошибок автоматически. Материал демонстративно хорош, речь в ролике это самое лучшее.
@АлександрВальвачев-я6ъ 5 місяців тому
Великолепный подход. Жаль, что мало тем. Вы очень многим помогли. Спасибо.
@cekkush 2 роки тому ⁺²
Павел, очень доступно. Огромное спасибо. Ждём продолжения! Привет из Азербайджана.
@bekabad 2 роки тому ⁺²
Теперь я знаю, про что будет моя дипломная работа! Спасибо!
@Dima日本 8 місяців тому
ну что? получилось с дипломной?
@bekabad 8 місяців тому ⁺¹
@@Dima日本 Нет, заставили писать что-то более прикладное. Пришлось CRM на Django бахнуть.
@АннаМельникова-к5я 3 роки тому ⁺⁷
Отличное видео! Спасибо автору за работу!
@timur.shhhhh 8 місяців тому
Классное видео, все понятно объяснил, ещё попробую на этой недели протестить, если получится, напишу в PS(если не забуду).👍
@vvvanysha 4 місяці тому ⁺¹
Разжевал до атомов. Хотелось бы увидеть урок, как на базе 100 (условно) разных изображений научить нейросеть находить определенный предмет. Так же желательно через Google Cloud Platform.
@727doto 3 роки тому ⁺¹
Отличное видео, спасибо, очень интересно! С нетерпением жду продолжения !
@СветланаБурмутская-в2ш 2 роки тому
Надо же как интересно . Класс! Здорово придумано.
@sakamotoras 2 роки тому ⁺¹
Спасибо за ролик!
@НиколайНескажу-э7т 2 роки тому
Спасибо! Отличное видео! Все настолько хорошо объяснили!
@dyachenkokonstantin67 2 роки тому
Спасибо, очень чисто и понятно.
@НастяКолесник-б4н 3 роки тому
Очень полезное видео ! Спасибо большое !
@СашкаСемеркин 2 роки тому
Очень круто, спасибо большое
@seoonlyRU 2 роки тому
красота) лайк от СЕООНЛИ!
@nikolaynovikov5756 3 роки тому ⁺¹
Жду следующие видео, когда будет ???
@ксеня-г9я 3 роки тому
Очень полезное дело 👍
@lecturer_abramenkova 3 роки тому ⁺¹
Спасибо)
@MrKappasama 11 місяців тому
Спасибо за видео! А можете подсказать, в какую сторону копать если нужно найти бинарную маску блоков текста на картинке? (в идеале так вырезать текст и восстановить фон)
@meowxd1337 2 роки тому ⁺¹
А есть какой нибудь готовый датасет для лис, котов итд?
@АртурТарасов-о7г 2 роки тому ⁺¹
когда пытаюсь вставить свои изображения вылезает такая ошибка:
TypeError: Input 'filename' of 'ReadFile' Op has type float32 that does not match expected type of string.
что мне делать?
@СашаШевченко-д5р Рік тому
Здравствуйте, у меня вопрос, чем кардинально будет отличаться данный метод от метода локализации? Суть же останется той же, только объект будет всего лишь один или есть различия?
@PLenchak Рік тому
Отличное видео! Подскажите, как можно распечатывать карты признаков по мере обучения?
@yood1e Рік тому
Годнота
@ЗаметкиПроверьвсесам 2 роки тому
круть
@ДмитрийСафронов-р2ъ Рік тому
А для чего применяется подряд tf.image.convert_image_dtype и следом нормализация image/255? Разве это не одно и тоже?
@SeregaZinin 5 місяців тому
Даешь пример TensorFlow на С++ ? :)
@kirilllas7247 7 місяців тому
Как сделать чтобы нейронка распознавала нужные изображения в браузере, например листаешь вкладку с фотографиями, и она как то распознает нужное, по стокам
@workvng 3 місяці тому
нашел решение?
@workvng 3 місяці тому
ало кирилчик
@RRRR-u5n Рік тому
Здравствуйте, а куда сохраняются уже обработанные кадры? По коду они должны сохранятся в репозиторий videos/processed, я повторил, но у меня ничего в этой папке не появляется. Помогите, пожалуйста!
@RRRR-u5n Рік тому
ПОМОГИТЕ ПОЖАЛУЙСТА
@GAVNO 2 роки тому
спасибо
@s1ngle77 3 роки тому
Блин круто препод топ
@ВладКлинский-ы1у Рік тому ⁺¹
Отличное видео. Подскажите, а что за среда разработки используется на видео?
@user-of-world Рік тому
Юзай Google collab, офигенная штука
@НиколайНескажу-э7т 2 роки тому
Кстати. А вот если задача стоит так, чтобы модель к цвету не привязывалась, а к форме - перевод в градации серого решит задачу? Например, изменение освещенности это сможет решить?
@КонстантинБабаян Рік тому
Добрый день! Отличное видео, спасибо. Подскажите пожалуйста, в каком формате вы экспортировали данные из supervisely?
@lyftzeigen Рік тому
Здравствуйте! Sypervisely обновился, наверное сейчас это называется "Export to masks".
@КонстантинБабаян Рік тому
@@lyftzeigen большое спасибо!
@dmitrykhomyakov8451 Рік тому
@@КонстантинБабаян Sypervisely. не предлагает экспорт в таком формате. На выбор дано 6 вариантов: Sypervisely, YOLO8, просто images (видимо без аннотаций), DOTA, COCO Keypoints, image links to CSV. Какой из этих форматов можно использовать в коде по Вашему видео?
@RockstarAlexander 2 роки тому
👍👍👍👍👍👍👍👍
@Grenkitop Рік тому
Добрый день , Павел .Как с вами связаться ? Я хочу попросить вас обучить Аи под мою модель , я заплачу.
И если интересно в дальнейшем мне нужна будет помощь для добавления разных объектов в мою библиотеку . В целом возможно долгосрочное сотрудничество в этом направлении
@zloslovie 23 дні тому
не лейбл ми не нашел в интернете где скачать не второе...
@grey111111111 Рік тому
На Colab ошибка на ячейке с обучением модели:
InvalidArgumentError: Graph execution error:
@grey111111111 Рік тому
поменял GPU на CPU и заработало, почему так может быть?
@djosmer2 2 роки тому
Подскажи. Допустим есть картинка, на ней один объект и снизу рядом текст, надо сделать рамку вокруг объекта с текстом. Сделать обводку не пойдет, т.к. повторяет форму объекта, надо чтоб линия плавно обводила объект с текстом, например как у стикеров. Сможет ли это сделать нейронка?
@lyftzeigen 2 роки тому
На мой взгляд, применять нейросеть для решения такой задачи, не самое оптимальное решение. Думаю, что проще воспользоваться классическими методами, например, выделение контуров текста и применение морфологических операций с последующей обработкой.
@ДенисСедищев Рік тому
Здравствуйте.
Имею следующую ошибку во время первой эпохи обучения:
ValueError: Dimensions must be equal, but are 400 and 8 for '{{node dice_bce_mc_loss/mul}} = Mul[T=DT_FLOAT](dice_bce_mc_loss/unstack, dice_bce_mc_loss/unstack_1)' with input shapes: [?,400,500], [?,8,8].
В коде изменил лишь размер изображения (на 400x500), количество классов-цветов (с 8 на 2) и добавил указание количества каналов для png (mask = tf.io.decode_png(mask, channels=3)), а также небольшое изменение в Skip Connections - downsample_skips = reversed(downsample_skips[:0]).
На какую часть программы порекомендуете взглянуть?
Спасибо.
@lyftzeigen Рік тому ⁺¹
Здравствуйте! Изменение разрешения изображения тянет за собой все остальное. Нужно разобраться в размере данных, которые проходят через нейросеть и через все функции.
А порекомендую взглянуть на связку YOLO + Roboflow:
blog.roboflow.com/train-yolov7-instance-segmentation-on-custom-data/
@Сынмаминойподруги-м9ъ Рік тому
Добрый день, спасибо за видео) очень помогло
Но есть один вопрос, как подтянуть координаты пересмотра классов?
@RRRR-u5n Рік тому
А куда сохраняются обработанные кадры? Подскажи пожалуйста
Или как сохранить их локально?
@ЕгорМорковкин-э4л 2 роки тому
Уважаемый автор, не могли бы вы помочь и предоставить файл с моделью нейронной сети которую Вы реализуете в данном ролике
@lyftzeigen 2 роки тому
В описании к видео есть ссылка на Google Collab, где вы можете самостоятельно опробовать работу нейронной сети.
@ЕгорМорковкин-э4л 2 роки тому
@@lyftzeigen я имею ввиду схему нейронной сети, которая у вас демонстрируется на 2:30
@somebody5186 Рік тому
!!!
@ДмитрийЯльчик 2 роки тому
Как размечать, как выгружать - ни слова об этом :(
@sakamotoras 2 роки тому
согласен - это достаточно полезная информация была бы!
@НикитаФилиппов-л5г 2 роки тому
На счет этого можно посмотреть видео по разметке данных именно указанными инструментами. Хотя согласен, можно было бы добавить описание.
@MrSatanizd 2 роки тому
г_спади видос на 11 из 10 по объяснению и демонстрации как вся это нейронная хня работает!!!!111.
Есть ли возможность связаться с автором видео для общения по разработке решения распознавания объектов на видео?
@romastep6576 Рік тому
Очень интересно, но почти ничего не понятно. Не в сторону автора выпад, а в сторону недостаточности моих знаний для полного понимания разжеваного до атомов материала 😂
@iiiyx 2 роки тому ⁺⁷
Слишком много "почему" после просмотра, поэтому это, увы, не обучающее видео.
@ilyatarasevich1008 6 місяців тому
File "C:\1111\1111\1111\main.py", line 12, in load_images *
image = tf.io.image.convert_image_dtype(image, tf.float32)
AttributeError: module 'tensorflow._api.v2.io' has no attribute 'image'
@ilyatarasevich1008 6 місяців тому
Помогите пожалуйста решить ошибку
@mattewcox7065 2 роки тому
кто нибудь сталкивался с проблемой, что именно маски не читаются с ошибкой:
InvalidArgumentError: Matrix size-incompatible: In[0]: [189888,1], In[1]: [3,1]
[[{{node rgb_to_grayscale/Tensordot/MatMul}}]] [Op:IteratorGetNext]
@mattewcox7065 Рік тому
@@aligatorpe а я ззафиксил кстати и забыл как уже
@MrIvansamara 22 дні тому
Видимо supervicely дает маски, которые уже в формате grayscale. Так что можно попробовать убрать строку mask = tf.image.rgb_to_grayscale(mask)
@mattewcox7065 17 днів тому
@@MrIvansamara наверное, вот бы на два года раньше, но все равно спасибо
@revoluxe Рік тому
💪

Наступне

Автоматичне відтворення

[DeepLearning | видео 1] Что же такое нейронная сеть?