Владимир Григорьевич, участника проекта ПостНаука - спасибо. ПостНаука, подумайте над идеей создания совместных прикладных лекций: учёный + инженер, учёный + программист и т.д.. Посадите за один стол Владимира Григорьевича и инженера-технолога или заводского программиста. Владимир Григорьевич будет рассказывать о том, что такое кластеризация, а инженер будет рассказывать о возможностях прикладного применения кластеризации в перерабатывающей промышленности. Для чего это нужно: Допустим, предприятие решило внедрить АСУП, собственник покупает лицензии и начинает внедрять софт. АСУП - это сиcтема автоматизации управления производством, а не система управления производством. И если на предприятии царит информационный хаос, то все попытки автоматизировать информационные потоки, приведут к тому же хаосу, только автоматизированному. Объяснить инвесторам необходимость вложений во внедрение АСУП, включая кластеризацию, которая необходима и трудоёмка, а, следовательно, требует значительных затрат - крайне сложно. А вот если будет такой комбинированный ликбез, то его будут использовать как инструмент убеждения. И тогда, возможно статистика успешных внедрений АСУП, будет не столь печальна как она есть.
профессору Спокойному спасибо за потраченное время. было бы, кстати, неплохо написать фамилию профессора в описание или в название видео. также не хватает пояснений, что имеется в виду под "формулами", которые периодически всплывают. ну и по формулам, могу предположить, что опечатка на 2:00? в индексе субмножеств (или что это? лейблы кластеров?) два раза 1. так больше на правду похоже: h(1)>h(2)...h(kmax). на 2:30 может быть тоже опечатка: вместо степени у последнего члена ряда, имело бы смысл поставить n в индекс. я так понимаю, речь идёт об упорядоченном числовом ряде без пропусков, принадлежащем пространству R^d, поэтому врядли там х был бы в степени, т.е. имеет, по-моему, больше смысла так: x(1),...,x(n) принадлежит R^d. на 2:50 лень было написать формулу через нормальную дробь, чтобы было нагляднее? и было бы неплохо подписать что за метод кластеризации, опять же, чтобы хоть знать, где об этом почитать. по поводу "отсутствия зазоров". интуитивно мне показалось, что точки должы стоять в плотную друг к другу. больше бы подошло слово, именно, "пропусков", я думаю. в общем, не понятно, для какого рода зрителей это видео? для тех, кто занимается наукой - малоинформативно. для новичков - довольно сумбурно, а формулы вообще в таком случае для атмосферности. хотя, может, я во всём не прав.^^
В видеоролике увидел ликбез прикладного значения, адресованный широкой аудитории, но конечно не для тех кто занимается наукой. Кластеризация, действительно очень важная тема, кажется всё просто, но когда доходит до практического применения, свойства кластеров игнорируются при разработке прикладных IT-систем. Самая распространённая ошибка - когда программисты лепят несколько атрибутов объекта в один кластер, искусственно создавая квант, пытаясь тем самым сократить объём информации. А в физическом пространстве объект может входить в несколько кластеров одновременно, по свойствам атрибутов. В результате получается система не удовлетворяющая потребности пользователя.
МЕТАЛЛООБРАБОТКА не очень силен в ИТ-системах, но на сколько я знаю, понятие кластера в математике и статистике, и в программировании, это разные вещи.
есть базовое понятие термина кластер (математика), которое применяется ко всем моделируемым системам, а есть другие значения термина кластер. Алгоритм производства выражается отношением между объектом и операцией Obcon=Op(Ob), которое означает, что объект Obcon получен выполнением операции Op над объектом Ob. Символы Op и Ob, могут выражать как единичные операции и объекты, так и группы операций и объектов. Алгоритм производства - это динамическая система, состоящая из множества элементов, для которых задана функциональная зависимость между временем, объектом и операцией. Определение величины времени для элементов Op, формирует исходные данные (Массивность) алгоритма производства. Массивность алгоритма производства является его основой. Obcon, Op и Ob имеют свойства, которые обозначаются атрибутами. Obcon, Op и Ob входят в различные кластеры, может быть один или несколько кластеров, которые формируются по атрибутам в зависимости от персональных потребностей использования информации для принятия стратегических или оперативных управленческих решений.
вывод: кластеризация работает только при условии наличия метаданных; думаю зрителям будут интересны видео про автоматическую аннотацию контекста.. руками прописывать теги не вариант.
что тут, что с петлями - всё как бы достаточно очевидно и просто, но как это применяется к бигдате? я не понимаю. видимо, я совсем не имею представления о самом понятии бигдаты.
Владимир Спокойный говорит, что никто не знает, что такое кластер. Видимо его не устраивают определения кластера, которые можно найти в неавторитетной, но тем не менее великой Википедии. Например: *Кластер* (англ. cluster - скопление, кисть, рой) - объединение нескольких однородных элементов, которое может рассматриваться как самостоятельная единица, обладающая определёнными свойствами. *Экономический кластер* - сконцентрированная на некоторой территории группа взаимосвязанных организаций (компаний, корпораций, университетов, банков и проч.): поставщиков продукции, комплектующих и специализированных услуг; инфраструктуры; научно-исследовательских институтов; вузов и других организаций, взаимодополняющих друг друга и усиливающих конкурентные преимущества отдельных компаний и кластера в целом. *Электронно-вычислительный кластер* - группа компьютеров, объединённых высокоскоростными каналами связи, представляющая с точки зрения пользователя единый аппаратный ресурс. *Файловый кластер* - в некоторых типах файловых систем логическая единица хранения данных в таблице размещения файлов, объединяющая группу секторов.
Действительно, спокойный
Владимир Григорьевич, участника проекта ПостНаука - спасибо.
ПостНаука, подумайте над идеей создания совместных прикладных лекций: учёный + инженер, учёный + программист и т.д.. Посадите за один стол Владимира Григорьевича и инженера-технолога или заводского программиста. Владимир Григорьевич будет рассказывать о том, что такое кластеризация, а инженер будет рассказывать о возможностях прикладного применения кластеризации в перерабатывающей промышленности.
Для чего это нужно:
Допустим, предприятие решило внедрить АСУП, собственник покупает лицензии и начинает внедрять софт. АСУП - это сиcтема автоматизации управления производством, а не система управления производством. И если на предприятии царит информационный хаос, то все попытки автоматизировать информационные потоки, приведут к тому же хаосу, только автоматизированному. Объяснить инвесторам необходимость вложений во внедрение АСУП, включая кластеризацию, которая необходима и трудоёмка, а, следовательно, требует значительных затрат - крайне сложно. А вот если будет такой комбинированный ликбез, то его будут использовать как инструмент убеждения. И тогда, возможно статистика успешных внедрений АСУП, будет не столь печальна как она есть.
Отличный выпуск, но почему вы не указываете в титрах лектора?
Владимир Спокойный.0:16-я секунда.
***** Это не титры, а лектор тоже участвует в создании ролика.
Да я просто пошутил.Наверное неудачно.Извините.
нашинская небрежность раздражает. Как можно такое допустить. Хотя бы в названии ролика указали. Далеко не факт что в тэгах к ролику есть его ФИО
профессору Спокойному спасибо за потраченное время. было бы, кстати, неплохо написать фамилию профессора в описание или в название видео.
также не хватает пояснений, что имеется в виду под "формулами", которые периодически всплывают.
ну и по формулам, могу предположить, что опечатка на 2:00? в индексе субмножеств (или что это? лейблы кластеров?) два раза 1. так больше на правду похоже: h(1)>h(2)...h(kmax).
на 2:30 может быть тоже опечатка: вместо степени у последнего члена ряда, имело бы смысл поставить n в индекс. я так понимаю, речь идёт об упорядоченном числовом ряде без пропусков, принадлежащем пространству R^d, поэтому врядли там х был бы в степени, т.е. имеет, по-моему, больше смысла так: x(1),...,x(n) принадлежит R^d.
на 2:50 лень было написать формулу через нормальную дробь, чтобы было нагляднее? и было бы неплохо подписать что за метод кластеризации, опять же, чтобы хоть знать, где об этом почитать.
по поводу "отсутствия зазоров". интуитивно мне показалось, что точки должы стоять в плотную друг к другу. больше бы подошло слово, именно, "пропусков", я думаю.
в общем, не понятно, для какого рода зрителей это видео? для тех, кто занимается наукой - малоинформативно. для новичков - довольно сумбурно, а формулы вообще в таком случае для атмосферности.
хотя, может, я во всём не прав.^^
В видеоролике увидел ликбез прикладного значения, адресованный широкой аудитории, но конечно не для тех кто занимается наукой. Кластеризация, действительно очень важная тема, кажется всё просто, но когда доходит до практического применения, свойства кластеров игнорируются при разработке прикладных IT-систем. Самая распространённая ошибка - когда программисты лепят несколько атрибутов объекта в один кластер, искусственно создавая квант, пытаясь тем самым сократить объём информации. А в физическом пространстве объект может входить в несколько кластеров одновременно, по свойствам атрибутов. В результате получается система не удовлетворяющая потребности пользователя.
МЕТАЛЛООБРАБОТКА не очень силен в ИТ-системах, но на сколько я знаю, понятие кластера в математике и статистике, и в программировании, это разные вещи.
есть базовое понятие термина кластер (математика), которое применяется ко всем моделируемым системам, а есть другие значения термина кластер.
Алгоритм производства выражается отношением между объектом и операцией Obcon=Op(Ob), которое означает, что объект Obcon получен выполнением операции Op над объектом Ob. Символы Op и Ob, могут выражать как единичные операции и объекты, так и группы операций и объектов.
Алгоритм производства - это динамическая система, состоящая из множества элементов, для которых задана функциональная зависимость между временем, объектом и операцией.
Определение величины времени для элементов Op, формирует исходные данные (Массивность) алгоритма производства. Массивность алгоритма производства является его основой.
Obcon, Op и Ob имеют свойства, которые обозначаются атрибутами. Obcon, Op и Ob входят в различные кластеры, может быть один или несколько кластеров, которые формируются по атрибутам в зависимости от персональных потребностей использования информации для принятия стратегических или оперативных управленческих решений.
Владимир Спокойный, вам нужно заняться покером! у вас определенно талант! В купе с вашим интеллектом вы будете рвать всех.
Александр Воронцов вы тонко намекаете на его не выразительное лицо?
нет не на лицо конечно, на самообладиние и выдержку.
Здорово!
вывод: кластеризация работает только при условии наличия метаданных; думаю зрителям будут интересны видео про автоматическую аннотацию контекста.. руками прописывать теги не вариант.
мета теги) кейвордс)или контент)
что тут, что с петлями - всё как бы достаточно очевидно и просто, но как это применяется к бигдате? я не понимаю. видимо, я совсем не имею представления о самом понятии бигдаты.
Сергей Николаич группировка. снижение количества элементов, анализируемых человеком.
Описал алгоритм dbscan
предыдущая с резиночками была интереснее
Владимир Спокойный говорит, что никто не знает, что такое кластер. Видимо его не устраивают определения кластера, которые можно найти в неавторитетной, но тем не менее великой Википедии. Например:
*Кластер* (англ. cluster - скопление, кисть, рой) - объединение нескольких однородных элементов, которое может рассматриваться как самостоятельная единица, обладающая определёнными свойствами.
*Экономический кластер* - сконцентрированная на некоторой территории группа взаимосвязанных организаций (компаний, корпораций, университетов, банков и проч.): поставщиков продукции, комплектующих и специализированных услуг; инфраструктуры; научно-исследовательских институтов; вузов и других организаций, взаимодополняющих друг друга и усиливающих конкурентные преимущества отдельных компаний и кластера в целом.
*Электронно-вычислительный кластер* - группа компьютеров, объединённых высокоскоростными каналами связи, представляющая с точки зрения пользователя единый аппаратный ресурс.
*Файловый кластер* - в некоторых типах файловых систем логическая единица хранения данных в таблице размещения файлов, объединяющая группу секторов.
Он намекает на то, что нет оптимального способа определить кластер математически -- в этом и есть проблема кластеризации