Странно, но в английской документации о music tagging ничего, а вот на китайской\японской\корейской уже есть информация. Возможно из-за своих не особо прямых рук, но не смог подключить этот модуль(MusicTaggerCRNN), не нашлось этого модуля в keras.applications. Есть ли способы это решить, кроме как взять модель и веса с гита?:D
Здравствуйте, очень полезное видео) Подскажите, а можно как нибудь "заморозить" сверточные слои нейросети и обучить "хвост" сети на другой базе данных для распознавания речи?
Подскажите, Вы говорите, что на выходе сети будет 1 на том классе к которому отнесёт сетка изображение, а на остальных 0, one hot coding так называемый. Тогда расскажите, пожалуйста, откуда взялись вероятности отнесения к тому иди иному классу?
>что на выходе сети будет 1 на том классе к которому отнесёт сетка изображение, а на остальных 0 подразумеваются обучаемые примеры, эталоны, а не результат модели
Тут, действительно, смешались две вещи. Первая - это представление one hot encoding. У нас есть 1000 элементов, из них все 0, кроме одного, который равен 1. В таком формате готовят данные о правильных ответах, или входные данные для сети. Но когда нейронная сеть работает, у нее на выходе не точные значения 0 и 1. Если мы используем функцию активации softmax, то выходные значения всех нейронов в сумме будут равны единице. Поэтому выходные значения называют вероятностями. Большая часть их них будет близка к 0. В лучшем случае хотелось бы, чтобы одно значение было близко к единице. Это означало бы, что сеть уверена в результатах распознавания. Но обычно так не бывает, и есть несколько выходных нейронов выдают сигнал существенно больше 0. Мы выбираем три максимальных значения и печатаем их.
я скачал, но классификация очень странные на изображение "собаки" говорит "цепь" и т д. думаю дело в неправильном определении весов. model.load_weights('путь/vgg16_weghts_tf_dim_ordering_tf_kernels_notop.h5 ', by_name=True)
Проще всего положить скаченный файл в каталог keras для моделей. Он находится в домашнем каталоге пользователя, каталог .keras/models. Обратите внимание, что каталог начинается с точки, это скрытый каталог в Linux.
Добрый день , Андрей. Очень хорошие уроки. Спасибо!!! Одно не могу понять: везде мы работаем с маленькими изображениями (примерно 25*25 точек или 30*30 не важно) , уже выделенными кем то. А как перейти к реальному изображению, например 800*1200 точек, где много разных объектов? Как выделить из реального изображения объекты по 25*25 точек, которые потом будут классифицированы на основе подобных библиотек ? Александр.
В предварительно обученных сетях размер изображений 224х224 или 299х299. Если на изображении много объектов, то это задача сегментации - найти объекты на изображении и определить их тип. Для этого используются другие сети, например, YOLO - pjreddie.com/darknet/yolo/.
Блистательный у Вас плейлист, просто блистательный!
У Вас несомненно талант к преподаванию
В жизни ведь тоже, лучше обучаться с учителем
Спасибо!
Супер!!! Все по полочкам, нет ни какой каши, всё понятно. Респект!!!
Спасибо!
респект таким преподавателям
Огромное спасибо за вашу работу.
+brablay364, пожалуйста!
Странно, но в английской документации о music tagging ничего, а вот на китайской\японской\корейской уже есть информация. Возможно из-за своих не особо прямых рук, но не смог подключить этот модуль(MusicTaggerCRNN), не нашлось этого модуля в keras.applications. Есть ли способы это решить, кроме как взять модель и веса с гита?:D
Я взял информацию из репозитория keras на github - github.com/fchollet/deep-learning-models
Сам не пробовал, к сожалению.
Здравствуйте, очень полезное видео)
Подскажите, а можно как нибудь "заморозить" сверточные слои нейросети и обучить "хвост" сети на другой базе данных для распознавания речи?
Подскажите, Вы говорите, что на выходе сети будет 1 на том классе к которому отнесёт сетка изображение, а на остальных 0, one hot coding так называемый. Тогда расскажите, пожалуйста, откуда взялись вероятности отнесения к тому иди иному классу?
>что на выходе сети будет 1 на том классе к которому отнесёт сетка изображение, а на остальных 0
подразумеваются обучаемые примеры, эталоны, а не результат модели
Тут, действительно, смешались две вещи. Первая - это представление one hot encoding. У нас есть 1000 элементов, из них все 0, кроме одного, который равен 1. В таком формате готовят данные о правильных ответах, или входные данные для сети.
Но когда нейронная сеть работает, у нее на выходе не точные значения 0 и 1. Если мы используем функцию активации softmax, то выходные значения всех нейронов в сумме будут равны единице. Поэтому выходные значения называют вероятностями. Большая часть их них будет близка к 0. В лучшем случае хотелось бы, чтобы одно значение было близко к единице. Это означало бы, что сеть уверена в результатах распознавания. Но обычно так не бывает, и есть несколько выходных нейронов выдают сигнал существенно больше 0. Мы выбираем три максимальных значения и печатаем их.
а как загрузить веса, если я скачал его напрямую. у меня соединение плохое. тайм аут ерор все время
я скачал, но классификация очень странные на изображение "собаки" говорит "цепь" и т д. думаю дело в неправильном определении весов.
model.load_weights('путь/vgg16_weghts_tf_dim_ordering_tf_kernels_notop.h5
', by_name=True)
Проще всего положить скаченный файл в каталог keras для моделей. Он находится в домашнем каталоге пользователя, каталог .keras/models. Обратите внимание, что каталог начинается с точки, это скрытый каталог в Linux.
здравствуйте, у меня все получилось когда скачал правильные веса=)
Добрый день , Андрей. Очень хорошие уроки. Спасибо!!! Одно не могу понять: везде мы работаем с маленькими изображениями (примерно 25*25 точек или 30*30 не важно) , уже выделенными кем то. А как перейти к реальному изображению, например 800*1200 точек, где много разных объектов? Как выделить из реального изображения объекты по 25*25 точек, которые потом будут классифицированы на основе подобных библиотек ? Александр.
В предварительно обученных сетях размер изображений 224х224 или 299х299. Если на изображении много объектов, то это задача сегментации - найти объекты на изображении и определить их тип. Для этого используются другие сети, например, YOLO - pjreddie.com/darknet/yolo/.
просто отлично, спасибо тебе друг, давай еще!
cs.stanford.edu/people/karpathy/ - Давай отсюда поковыряем инфу и разберем по полочкам????
+МастерЛомастер , спасибо за хороший отзыв! Ссылка отличная, много интересного. Посмотрю, что можно сделать.
Котики всегда популярны
Да, именно так ;-)
глаукома прилагается ?
а что не так? вроде всё норм с картинкой
+Барон, я тоже не понял, что не так.