Build a Spark pipeline to analyze streaming data using AWS Glue, Apache Hudi, S3 and Athena

Пишем реальный CI/CD пайплайн | GITLAB CI/CD на практике

Кирилл Набутов про «мирный план» Трампа, разлив мазута в Анапе, блокировку ютуб и Хинштейна в Курске

ふわふわシフォン大作戦🩷スイーツ戦隊のキラキラミッション✨【銀座コージーコーナー】 #shorts #シフォンケーキ #クリスマスケーキ #クリスマス #ケーキ #チョコケーキ #christmas

Дал Свою Безлимитную Карту Друзьям, Потратили Миллионы... (Хазяева, Кокошка, Дилблин, Сатир)

Ветеран війни отримав гроші на житло

Simple 5 Steps Guide to get started with Apache Hudi and Glue 4.0 and query the data using Athena

Soumil Shah

Переглядів 3 273

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 29 гру 2024

КОМЕНТАРІ • 15

@wistyroamlands7495 Рік тому
I'm so glad you're still making videos. :) I wish you luck in your field of choice and I hope things are going well for you. Thanks for your contributions to society.
@KartikGautam 5 місяців тому
Hi Soumil,
I am unable to access the pdf can you help me with that. Thanks
@tomyanth Рік тому
Thanks. It is very clear and I manage to repeat this in AWS.
@MohamedFazanNismy 7 місяців тому
Thanks Soumil , if I open the file it shows 'page not found'
@chetancc 2 роки тому
Hi Soumil,
Thanks for sharing. It would be really useful. God bless you.
Thanks,
Chetan from Kandivali, Mumbai, India :)
@SoumilShah 2 роки тому
My pleasure
@adarshverma5429 Рік тому ⁺¹
I am getting an error like, failed to upsert for commit time 202303022121655469 while writing the data. Please help me out to resolve this issue.
@MaheshWankhede-u2o 11 місяців тому
Great video. Can you provide the links for jar files used for above script.
@lezaaarman6964 2 роки тому
I'm so close to transitioning to Hudi tables, but there's ONE missing feature that I is a blocker:
Do you know what's the best practice to replace the glue job bookmark feature ?
I'm actually building my own bookmarking capability to add to my new glue jobs using Hudi (by replicating what the original glue job bookmark does), but is it the best approach ?
My source data is always being pushed to S3, so I don't have the option of using a streaming job by connecting to a kinesis stream, I just want to use the S3 bucket only as source.
Thanks
@MunindherReddy Рік тому
Does HUDI tables will not allow $ or specials characters on table column names?
@AuroraNabi 2 роки тому
where can i find the Hudi MOR table glue job script ? Is it uploaded ?i have checked your Github but couldn't find much
@SoumilShah 2 роки тому
Simply change setting to MOR there is table type option
@joegenshlea6827 Рік тому
Great video. I really enjoy your positive energy and passion for the topic.
As a NB in Pyspark and AWS it would be very nice if you could walk through the code just a touch more. I'm curious about how those parameters in the job setup get injected into the job. I'm also curious about this function:
def create_spark_session():
spark = SparkSession \
.builder \
.config('spark.serializer', 'org.apache.spark.serializer.KryoSerializer') \
.getOrCreate()
return spark
The boiler plate script has this line to instantiate a spark session:
spark = glueContext.spark_session
What is gained by your technique?
@SoumilShah Рік тому
Hie thanks for suggestion there are hudi labs let me share links for those
@SoumilShah Рік тому
Hey here is link for beginners
ua-cam.com/play/PLxSSOLH2WRMO3Vz6qp_S3KhDqUbro1PqG.html

Наступне

Автоматичне відтворення

Build a Spark pipeline to analyze streaming data using AWS Glue, Apache Hudi, S3 and Athena

Build a Spark pipeline to analyze streaming data using AWS Glue, Apache Hudi, S3 and Athena

Пишем реальный CI/CD пайплайн | GITLAB CI/CD на практике

Пишем реальный CI/CD пайплайн | GITLAB CI/CD на практике

Кирилл Набутов про «мирный план» Трампа, разлив мазута в Анапе, блокировку ютуб и Хинштейна в Курске

Кирилл Набутов про «мирный план» Трампа, разлив мазута в Анапе, блокировку ютуб и Хинштейна в Курске

ふわふわシフォン大作戦🩷スイーツ戦隊のキラキラミッション✨【銀座コージーコーナー】 #shorts #シフォンケーキ #クリスマスケーキ #クリスマス #ケーキ #チョコケーキ #christmas

ふわふわシフォン大作戦🩷スイーツ戦隊のキラキラミッション✨【銀座コージーコーナー】 #shorts #シフォンケーキ #クリスマスケーキ #クリスマス #ケーキ #チョコケーキ #christmas

Дал Свою Безлимитную Карту Друзьям, Потратили Миллионы... (Хазяева, Кокошка, Дилблин, Сатир)

Дал Свою Безлимитную Карту Друзьям, Потратили Миллионы... (Хазяева, Кокошка, Дилблин, Сатир)

Ветеран війни отримав гроші на житло

Ветеран війни отримав гроші на житло

ДИЗЕЛЬ ШОУ 2024 🇺🇦 ❄️ ЗИМОВА ПРЕМ'ЄРА ❄️ 🇺🇦 ВИПУСК 154 на підтримку ЗСУ ⭐ Гумор ICTV від 13.12.2024

ДИЗЕЛЬ ШОУ 2024 🇺🇦 ❄️ ЗИМОВА ПРЕМ'ЄРА ❄️ 🇺🇦 ВИПУСК 154 на підтримку ЗСУ ⭐ Гумор ICTV від 13.12.2024

The only Cloud services you actually need to know

The only Cloud services you actually need to know

API vs SDK: What’s the Difference?

API vs SDK: What’s the Difference?

Стыдные вопросы про Китай / вДудь

Стыдные вопросы про Китай / вДудь

How I would learn Data Engineering (if I could start over)

How I would learn Data Engineering (if I could start over)

Тамара Глоба: что ждет мир в 2025 году? Большой астрологический прогноз для всех знаков

Тамара Глоба: что ждет мир в 2025 году? Большой астрологический прогноз для всех знаков

Event-Driven Architecture (EDA) vs Request/Response (RR)

Event-Driven Architecture (EDA) vs Request/Response (RR)

Президент Азербайджана в Международном аэропорту Гейдар Алиев дал интервью AzTV

Президент Азербайджана в Международном аэропорту Гейдар Алиев дал интервью AzTV

GraphQL vs REST: Which is Better for APIs?

GraphQL vs REST: Which is Better for APIs?

ОСЕЧКИН: "Сейчас начнется!": почему Путин извинился, Алиев пошел в разнос, рейс Баку-Грозный, БОИНГ

ОСЕЧКИН: "Сейчас начнется!": почему Путин извинился, Алиев пошел в разнос, рейс Баку-Грозный, БОИНГ

Разобрался голыми руками 😎 #start #кино #фильм #сериал #молотведьм #полиция #пацаны

Разобрался голыми руками 😎 #start #кино #фильм #сериал #молотведьм #полиция #пацаны

Рождение Немецкой Легенды - Mercedes 190E 2.3-16

Рождение Немецкой Легенды - Mercedes 190E 2.3-16

ПРАНК НАД БОЯРСКИМ | КОНФЛИКТ НА ДОРОГЕ

ПРАНК НАД БОЯРСКИМ | КОНФЛИКТ НА ДОРОГЕ

Unexpected way to open the new Audi A6 e-tron Frunk 😮! #shorts

Unexpected way to open the new Audi A6 e-tron Frunk 😮! #shorts

"ХИТРЕЦ": Трамп РОЗЛЮТИВ Скабєєву / Оля ЛИЄ ЯДОМ #shorts

"ХИТРЕЦ": Трамп РОЗЛЮТИВ Скабєєву / Оля ЛИЄ ЯДОМ #shorts

ШАЛОСТЬ (смешное видео, приколы, юмор, поржать)

ШАЛОСТЬ (смешное видео, приколы, юмор, поржать)

Cool Items!🥰 New Gadgets, Smart Appliances, Kitchen Tools Utensils, Home Cleaning, Beauty #shorts

Cool Items!🥰 New Gadgets, Smart Appliances, Kitchen Tools Utensils, Home Cleaning, Beauty #shorts

Что-что Мурсдей говорит? 💭 #симбочка #симба #мурсдей

Что-что Мурсдей говорит? 💭 #симбочка #симба #мурсдей