35. Databricks & Spark: Interview Question - Shuffle Partition

24 Fix Skewness and Spillage with Salting in Spark

Spark performance optimization Part1 | How to do performance optimization in spark

MELLSTROY - первое интервью: как живет самый обсуждаемый стример года

«Зайшли п*дорам в тил у перший день штурму» #україна #війна #зсу #окупанти

Дон ДОН, Алаудинов и СБЕЖАВШИЕ из под Курска ахматовцы 😁 [Пародия]

34. Databricks - Spark: Data Skew Optimization

Raja's Data Engineering

Переглядів 25 306

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 20 сер 2024
#DataSkew, #Bigdata-Dataskew, #BigdataOptimization, #AdaptiveQueryExecution, #AQE, #DatabricksDataskew, #SparkSalting, #Salting, #DatabricksSalting, #SkewHint, #SparkSkewhint, #DatabricksOptimization,#pysparkOptimization, #sparkOptmimization, #SparkPerformanceOptimization, #SparkPerformance, #DatabricksPerformanceImprovement,#Databricks, #DatabricksTutorial, #AzureDatabricks
#Databricks
#Pyspark
#Spark
#AzureDatabricks
#AzureADF
#Databricks #LearnPyspark #LearnDataBRicks #DataBricksTutorial
databricks spark tutorial
databricks tutorial
databricks azure
databricks notebook tutorial
databricks delta lake
databricks azure tutorial,
Databricks Tutorial for beginners,
azure Databricks tutorial
databricks tutorial,
databricks community edition,
databricks community edition cluster creation,
databricks community edition tutorial
databricks community edition pyspark
databricks community edition cluster
databricks pyspark tutorial
databricks community edition tutorial
databricks spark certification
databricks cli
databricks tutorial for beginners
databricks interview questions
databricks azure

КОМЕНТАРІ • 32

@Prashanth-os5he Рік тому ⁺⁴
This is by far the best databricks and spark tutorial series on youtube... great job Raja
@rajasdataengineering7585 Рік тому
Glad you think so! Thanks for your comment
@joyo2122 2 роки тому ⁺¹
You are the best Raja 🙌
@srinubathina7191 Рік тому ⁺¹
Awesome content Thank You So much Sir
@rajasdataengineering7585 Рік тому
Glad you liked it
@sumanmondal8836 2 роки тому ⁺³
Thanks, Raja, your explanations are really good...can you please make a video on salting techniques with example? It will be very helpful.
@rajasdataengineering7585 2 роки тому
Thank you Suman. Sure, will make a video on salting
@abhinavsingh1173 Рік тому ⁺²
Your course it
best. But problem with you course is that you are not attching the github link for your sample data and code. Irequest you as your audience please do this. Thanks
@skasifali4457 2 роки тому ⁺²
Thanks Raja..Your video is really useful. Can you please create a video on debugging techniques and how we can use spark UI to debug and understand the bottleneck using use cases. Thanks a lot again
@rajasdataengineering7585 2 роки тому ⁺²
Sure Asif, will post a video on debugging
@VishalSharma-hv6ks 2 роки тому ⁺²
You mainly focus on theoretical. It would be great if you write the code for salting as well.
@rajasdataengineering7585 2 роки тому ⁺¹
Sure, will post another video with coding example
@sravankumar1767 2 роки тому ⁺¹
Superb
@rajasdataengineering7585 2 роки тому
Thank you
@Personalcomments 2 роки тому ⁺¹
Your videos are very informative. Can you please post a video on Client mode vs Cluster mode vs local
@rajasdataengineering7585 2 роки тому
Sure Merin, will post the video on this topic
@naveenkumarsingh3829 2 місяці тому
why cant we use set maxpartitionbytes to get equal size of partitions and handle data skewness?
@prathapganesh7021 5 місяців тому ⁺¹
thank you
@rajasdataengineering7585 5 місяців тому
Welcome!
@tanushreenagar3116 2 роки тому ⁺¹
nice
@rajasdataengineering7585 2 роки тому
Thanks
@balakrishna61 3 місяці тому
@rajasdataengineering7585 Please explain salting in detail.It's not clear how you parition the German-1,_2 and so on .Each record will become one partition correct in this case?
@iamkiri_ 9 місяців тому ⁺¹
Thanks for the video, I have a question.. Is salting technique applied while reading the data from source or during intermediate processing of the application..
@rajasdataengineering7585 9 місяців тому
It is applied during transformation stage, not at data extraction
@iamkiri_ 9 місяців тому
Thanks Bro
@SaurabhDestiny18 Рік тому
Hi Tq for such useful videos, i have one question, i am still confused about executor boundary and cores/tasks boundary. In your first video you mentioned executor can have many cores/ram and then this video you mention executor runs in its own jvm process , which means all the cores/tasks are running under one jvm process? Or under than parent jvm process there are many more jvm process are running which are equal to number of cores/tasks?
@sanskarsuman9340 Рік тому ⁺¹
i have doubt:
when u say data is partitioned on country and there are five different countries, out of which lets say Germany has 80% of data, so how can I say that germany data is in single partition only? coz partition is determined on the size of the block and 1 parttion = 128mb size, so depending on its size, germany data could be splitted into multiple partitions automatically?
@ndbweurt34485 Рік тому
same question i had
@supriyakoura7755 20 днів тому
Same question
@rajunaik8803 Рік тому ⁺¹
Hi Raja, QQ - Does AQE take care of salting and skew hint technique automatically in case of data skewness?
Or do we have to explicitly apply them?
@rajasdataengineering7585 Рік тому ⁺¹
Yes AQE handles data skewness automatically. In later spark versions after 3.0, it is enabled by default. For prior versions of spark, we just need to enable AQE through spark config settings
@rajunaik8803 Рік тому
@@rajasdataengineering7585 thanks alot for your response. Do you have any telegram channel? And may I know your LinkedIn id please

Наступне

Автоматичне відтворення

35. Databricks & Spark: Interview Question - Shuffle Partition

35. Databricks & Spark: Interview Question - Shuffle Partition

24 Fix Skewness and Spillage with Salting in Spark

24 Fix Skewness and Spillage with Salting in Spark

Spark performance optimization Part1 | How to do performance optimization in spark

Spark performance optimization Part1 | How to do performance optimization in spark

MELLSTROY - первое интервью: как живет самый обсуждаемый стример года

MELLSTROY — первое интервью: как живет самый обсуждаемый стример года

«Зайшли п*дорам в тил у перший день штурму» #україна #війна #зсу #окупанти

«Зайшли п*дорам в тил у перший день штурму» #україна #війна #зсу #окупанти

Дон ДОН, Алаудинов и СБЕЖАВШИЕ из под Курска ахматовцы 😁 [Пародия]

Дон ДОН, Алаудинов и СБЕЖАВШИЕ из под Курска ахматовцы 😁 [Пародия]

🔥 Уся правда про українську СУДЖУ

🔥 Уся правда про українську СУДЖУ

salting in spark | how to handle data skew issue | Lec-23

salting in spark | how to handle data skew issue | Lec-23

Data Caching in Apache Spark | Optimizing performance using Caching | When and when not to cache

Data Caching in Apache Spark | Optimizing performance using Caching | When and when not to cache

How to handle Data skewness in Apache Spark using Key Salting Technique

How to handle Data skewness in Apache Spark using Key Salting Technique

Mock Interview for Data Engineers | Spark Optimizations | Real-time Project Challenges and Scenarios

Mock Interview for Data Engineers | Spark Optimizations | Real-time Project Challenges and Scenarios

How Salting Can Reduce Data Skew By 99%

How Salting Can Reduce Data Skew By 99%

Apache Spark Core - Practical Optimization Daniel Tomes (Databricks)

Apache Spark Core – Practical Optimization Daniel Tomes (Databricks)

Spark Performance Tuning | Handling DATA Skewness | Interview Question

Spark Performance Tuning | Handling DATA Skewness | Interview Question

💣Все! Під КУРСЬК зайшли БІЛОРУСИ на танках. У Київ везуть ПОСЛАННЯ ПУТІНА. ТАКОГО ТОЧНО ще не було!

💣Все! Під КУРСЬК зайшли БІЛОРУСИ на танках. У Київ везуть ПОСЛАННЯ ПУТІНА. ТАКОГО ТОЧНО ще не було!

Sad To Announce I Did Not Qualify For Mens 2024 Olympic Gymnastics Team

Sad To Announce I Did Not Qualify For Mens 2024 Olympic Gymnastics Team

So brutal REVENGE 😂😭🔥 @BrutalAssaultOFFICIAL #youtube #festival #comedy #metal #corpsepaint

So brutal REVENGE 😂😭🔥 @BrutalAssaultOFFICIAL #youtube #festival #comedy #metal #corpsepaint

Курск и Суджа России НЕ НУЖНЫ? ПОЗОР Ахмата | Антизомби 2024 - 30 полный выпуск

Курск и Суджа России НЕ НУЖНЫ? ПОЗОР Ахмата | Антизомби 2024 — 30 полный выпуск

ПОДІЇ НА КУРЩИНІ: ЕКСКЛЮЗИВНИЙ РЕПОРТАЖ НАТАЛІ НАГОРНОЇ З СУДЖІ

ПОДІЇ НА КУРЩИНІ: ЕКСКЛЮЗИВНИЙ РЕПОРТАЖ НАТАЛІ НАГОРНОЇ З СУДЖІ

Удар по російській колоні в Курській області #shorts #війна #курськ #арміярф

Удар по російській колоні в Курській області #shorts #війна #курськ #арміярф

Зачем страны меняют флаги? #россия #ссср #новаязеландия

Зачем страны меняют флаги? #россия #ссср #новаязеландия

SCHOOLBOY RUNAWAY В РЕАЛЬНОЙ ЖИЗНИ 📚🔔 #schoolboy #runaway #schoolboyrunaway #shorts YOUNG

SCHOOLBOY RUNAWAY В РЕАЛЬНОЙ ЖИЗНИ 📚🔔 #schoolboy #runaway #schoolboyrunaway #shorts YOUNG