Грубо говоря, хадуп как RAID, только вместо дисков - отдельные компьютеры. Плюс возможность запускать на этом распределенном массиве данных (хадуп кластере) параллельную обработку этих самых данных так, что код обрабатывающий данные, работает там же, на тех же машинах, где данные хранятся физически. На контрасте со старым подходом, когда данные хранились на одних машинах, а обрабатывались на других, такой подход частично избавляет от путешествия данных по сети и как следствие повышает скорость их обработки.
@@alx8439 ну опять же. Яблоко - зеленый круглый фрукт, например, здесь понятно. А " только вместо дисков - отдельные компьютеры" - два компьютера это хадуп что ли? Или это принцип работы? Или это АС?
Автор статьи по ходу далек от понимания того, что такое Hadoop. Замени каждое слово "Hadoop" на слово "Интернет" и смысл ролика вообще не изменится, ну и видения автора на том же уровне)
@@ListenIT_channel Во первых, Извини, если мои слова прозвучали резко и негативно. Искажение интернета, любой контент не воспринимается как что то, над чем старался конкретный человек. Исправил "Автор" на "Автор статьи" но сказанное может касаться и тебя тоже как автора ролика. В видео не раскрывается тема "Что такое Hadoop", не смотря на то, что видео именно так и называется. Это видео о том, зачем используют Hadoop в большинстве случаев, но никак не "что такое". Первое это информация ниочем, типа, может использоваться а может и в других случаях, можно использовать и для сайтов но зачем, типа разговор ни о чем. А вот раскрыть тему, что такое Hadoop, как устроен, как развернуть, как складывать и извлекать данные, какие дополнительные функции, по какому принципу работает распределенное хранение, короче миллион вопросов, на которые можно было бы дать ответы. Но автор статьи, по ходу что то типа маркетолога/продажника, то есть знаем как называется и области применения, но понятия не имеем что это конкретно и как работает. Учитывая что я на тебя подписан и ценю выбранный тобою формат, расценивай пожалуйста мой комментарий как отзыв а не как личный выпад, чем он по сути и является.
Hadoop в 2023 - устаревшее, негибкое решение, которое используют крупные on-premise компании, которые когда-то начали им пользоваться и сейчас уже не могут от него отказаться и вынуждены поддерживать его и дальше. S3 - ❤ а с новым S3 express, представленным недавно AWS, hadoop остаётся на свалке технологий позади него
У хадупа есть над S3 преимущества - локализация расчетов например. S3 чисто сторейдж, локальные операции он поддерживает в очень ограниченном объёме - все приходится таскать по сети, самому медленному компоненту любой инфры. Ну а про внешние, сука облачные сервисы, я вообще молчу. Мало того, что если у вас хоть сколько-нибудь чувствительные данные, вам здравый смысл, безопасники и регуляторы не дадут их наружу тащить, так и построение on-premise облаков сейчас, благодаря современному open source - задача пустяковая
Терабайт в контексте "большие данные" в 2024 это смешно. Сейчас смартфоны уже имеют террабайт. Скорость современных PCI v4 NVME SSD 4-6 Гб в секунду. Террабайт это уже не большие данные 😂 Для обработки терабайта данных вам даже не нужен будет кластер
Из ролика стало понятно зачем нужен Hadoop, но ни капли не понял что это такое...
+😂
Это для менеджеров статья. А им понимать и не обязательно.
Грубо говоря, хадуп как RAID, только вместо дисков - отдельные компьютеры. Плюс возможность запускать на этом распределенном массиве данных (хадуп кластере) параллельную обработку этих самых данных так, что код обрабатывающий данные, работает там же, на тех же машинах, где данные хранятся физически. На контрасте со старым подходом, когда данные хранились на одних машинах, а обрабатывались на других, такой подход частично избавляет от путешествия данных по сети и как следствие повышает скорость их обработки.
@@alx8439 ну опять же. Яблоко - зеленый круглый фрукт, например, здесь понятно. А " только вместо дисков - отдельные компьютеры" - два компьютера это хадуп что ли? Или это принцип работы? Или это АС?
Куда нужно задонатить, чтобы крестик на окнах в видео был САМЫМ ПРАВЫМ из трех, а не самым левым? =) Ну хватит издеваться-то! ))))
😂
))))))))))))//))😂😂😂)😂)😂)😂)😂)😅😅😅😅😅😅😅
Зачем ты это сказал. Я теперь не могу смотреть
😂😂😂
Базовых примеров разворачивания и конфигураций не хватает, не особо понятно что такое hadoop непосредственно
Ничего не понятно, но очень интересно
Слишком замудренно, полезность 1%
Воды многовато с примерами использования без объяснения, как это работает и какие компоненты за что отвечают
Спасибо большое за инфо!!!!
Автор статьи по ходу далек от понимания того, что такое Hadoop. Замени каждое слово "Hadoop" на слово "Интернет" и смысл ролика вообще не изменится, ну и видения автора на том же уровне)
Скажи, а что неправильно описано в ролике?
Ну и не совсем понятно, как "Интернет" поможет в хранении, анализе и обработке больших данных)
@@ListenIT_channel Во первых, Извини, если мои слова прозвучали резко и негативно. Искажение интернета, любой контент не воспринимается как что то, над чем старался конкретный человек. Исправил "Автор" на "Автор статьи" но сказанное может касаться и тебя тоже как автора ролика. В видео не раскрывается тема "Что такое Hadoop", не смотря на то, что видео именно так и называется. Это видео о том, зачем используют Hadoop в большинстве случаев, но никак не "что такое". Первое это информация ниочем, типа, может использоваться а может и в других случаях, можно использовать и для сайтов но зачем, типа разговор ни о чем. А вот раскрыть тему, что такое Hadoop, как устроен, как развернуть, как складывать и извлекать данные, какие дополнительные функции, по какому принципу работает распределенное хранение, короче миллион вопросов, на которые можно было бы дать ответы. Но автор статьи, по ходу что то типа маркетолога/продажника, то есть знаем как называется и области применения, но понятия не имеем что это конкретно и как работает. Учитывая что я на тебя подписан и ценю выбранный тобою формат, расценивай пожалуйста мой комментарий как отзыв а не как личный выпад, чем он по сути и является.
спасибо за обзор!
Спасибо!
Топчик, спасибо!
спасибо!_)
Hadoop в 2023 - устаревшее, негибкое решение, которое используют крупные on-premise компании, которые когда-то начали им пользоваться и сейчас уже не могут от него отказаться и вынуждены поддерживать его и дальше.
S3 - ❤ а с новым S3 express, представленным недавно AWS, hadoop остаётся на свалке технологий позади него
У хадупа есть над S3 преимущества - локализация расчетов например. S3 чисто сторейдж, локальные операции он поддерживает в очень ограниченном объёме - все приходится таскать по сети, самому медленному компоненту любой инфры. Ну а про внешние, сука облачные сервисы, я вообще молчу. Мало того, что если у вас хоть сколько-нибудь чувствительные данные, вам здравый смысл, безопасники и регуляторы не дадут их наружу тащить, так и построение on-premise облаков сейчас, благодаря современному open source - задача пустяковая
спасибо. почитать со слайдов я тоже могу.
Вспомнился софт Palantir.
Терабайт в контексте "большие данные" в 2024 это смешно. Сейчас смартфоны уже имеют террабайт. Скорость современных PCI v4 NVME SSD 4-6 Гб в секунду. Террабайт это уже не большие данные 😂 Для обработки терабайта данных вам даже не нужен будет кластер
Одна вода.