Что такое Apache Spark
Вставка
- Опубліковано 8 лис 2024
- В данном видео мы знакомимся с фреймворком для параллельной обработки данных Apache Spark. На конкретном примере разбираем возможности Apache Spark по работе с источниками данных (файлами и RDBMS), трансформации данных (как с помощью Structured API, так на Spark SQL).
Курс проводится только в специализированном учебном центре «Школа Больших Данных»
По вопросам обучения на курсах машинного обучения приглашаем в нашу «Школа Больших Данных»
Обращаться по телефону:
+7 (495) 41-41-121
+7 (995) 100-45-63
Чтобы не пропустить информацию о новых курсах, акциях и других событиях Школы Больших Данных, рекомендуем подписаться на нас в социальных сетях:
Телеграм-канал: t.me/BigDataSc...
Facebook: / bigdataschoolru
Вконтакте: bdschoo...
LinkedIn: / bigdataschoolru
Twitter: / bigdataschoolr
Подписывайтесь и будьте в курсе всех интересных новинок мира Big Data вместе со Школой больших данных - www.bigdatasch...
Это одно из лучших введений в тему, которое я когда-либо видел.
Спасибо за комментарий, приходите к нам на курсы или просто подписывайтесь :-)
пощупать руками это реально бесценно. с примером!
Супер пример!
Жаль в плейлистах нет нумерации уроков. Иногда затруднительно найти первое видео и дальше смотреть по очереди.
Про спарк ни слова... плохо очень.
Класс
Добрый день. очень полезное виедо спасибо. Подскжите пожалуйста, а почему дата сайнтист не может сам преобразовать эти данные как ему надо, через тот же пандас скажем ?
Пандас - одномашинный вариант обработки, по определению "большие данные" так не обработать. Spark работает на кластере, ему любые данные "по плечу".
Понятно, что в видео была "игрушечная" задачка, в жизни задачи куда-как больше и сложнее.
Звук ❤
Добрый день!
Скажи, пожалуйста, где можно скачать код с исходные данные для изучения в живую?
Заранее благодарен!
Круто
иииии... датасеты разные)
Что такое Спарк?
все видео это пример - как с помощью спарк преобразовывать данные. А что такое спарк - ноль инфы
ужасное объяснение
че так
Из этого видео я понял, что Apache Spark - это питоновская библиотека, которая дублирует pandas. Спасибо.
К сожалению есть питоновская, лучше под Spark писать на Scala
@@ChannelCheesecakeпочему к сожалению ?
Качество звучания, как будто в прямом эфире ток-шоу позвонили внезапно человеку))