DBDEMOS in databricks #dataengineering #data

narrow and wide transformation in spark | | Operations in Pyspark RDD | Pyspark tutorials - 6

6. Difference Between Repartition and Coalesce in Databricks Spark

Хто такий РОМАН СВІТАН? Звідки бере інформацію про фронт?

REAL or FAKE? #beatbox #tiktok

«Шнурки не зрізайте, акуратненько»: медик про реакцію військових на поранення #shorts

Narrow and Wide Transformations and Actions in Spark

CloudFitness

Переглядів 1 626

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 4 лют 2025

КОМЕНТАРІ •

@nagamanickam6604 10 місяців тому
Thank you
@harshitgupta355 Рік тому
In union, duplicate rows are removed right? So for removing those duplicate rows, the data should be fetched into single partition, that means data shuffle is there, then how UNION is a narrow transformation?
we can say UNIONALL is a narrow transformation, bcs it does not remove duplicate rows.
Please explain me, I'm confused on this.
@harshitgupta355 Рік тому
Please reply, this question was asked by an interviewer in DE interview.
@Shivv2008 9 місяців тому
@harshitgupta355
union() and unionAll() behave differently in Spark as compared to SQL.
In spark:
1. unionAll() is deprecated. It used to work same as union() (different than SQL).
2. union() merges 2 DFs with same schema and duplicates are retained.
3. Because duplicates are retained, so it is a narrow transformation.
Also check out unionByName()

Наступне

Автоматичне відтворення

DBDEMOS in databricks #dataengineering #data

DBDEMOS in databricks #dataengineering #data

narrow and wide transformation in spark | | Operations in Pyspark RDD | Pyspark tutorials - 6

narrow and wide transformation in spark | | Operations in Pyspark RDD | Pyspark tutorials - 6

6. Difference Between Repartition and Coalesce in Databricks Spark

6. Difference Between Repartition and Coalesce in Databricks Spark

Хто такий РОМАН СВІТАН? Звідки бере інформацію про фронт?

Хто такий РОМАН СВІТАН? Звідки бере інформацію про фронт?

REAL or FAKE? #beatbox #tiktok

REAL or FAKE? #beatbox #tiktok

«Шнурки не зрізайте, акуратненько»: медик про реакцію військових на поранення #shorts

«Шнурки не зрізайте, акуратненько»: медик про реакцію військових на поранення #shorts

1% vs 100% #beatbox #tiktok

1% vs 100% #beatbox #tiktok

Advancing Spark - Understanding the Spark UI

Advancing Spark - Understanding the Spark UI

Z-Order Visualized

Z-Order Visualized

Spark Architecture Part 5 : Spark narrow & wide transformations #spark #sparktransformations

Spark Architecture Part 5 : Spark narrow & wide transformations #spark #sparktransformations

Master Data Pipelines: Avoid These Common Mistakes!

Master Data Pipelines: Avoid These Common Mistakes!

20. Runtime Architecture of Spark In Databricks

20. Runtime Architecture of Spark In Databricks

Commonly used data cleaning functions in databricks #data #dataengineering

Commonly used data cleaning functions in databricks #data #dataengineering

Accelerating Data Ingestion with Databricks Autoloader

Accelerating Data Ingestion with Databricks Autoloader

Правильный подход к детям

Правильный подход к детям

人是不能做到吗？#火影忍者 #家人 #佐助

人是不能做到吗？#火影忍者 #家人 #佐助

Анна Трінчер - Треш (Official Music Video)

Анна Трінчер - Треш (Official Music Video)

Прочистка шлюзов

Прочистка шлюзов

🤔Можно ли спастись от Ядерки в Холодильнике ? #shorts

🤔Можно ли спастись от Ядерки в Холодильнике ? #shorts

😳Трамп ПОТІШИВ Скабєєву, але одразу РОЗЧАРУВАВ #shorts

😳Трамп ПОТІШИВ Скабєєву, але одразу РОЗЧАРУВАВ #shorts

СКОЛЬКО ИХ...?! #Shorts #Глент

СКОЛЬКО ИХ...?! #Shorts #Глент

Комаровский. Когда конец войны, Трамп не поможет, потеря Украины, эмиграция, многоженство в Украине

Комаровский. Когда конец войны, Трамп не поможет, потеря Украины, эмиграция, многоженство в Украине