Big Data Engineer Mock Interview | Big Data Project Pipeline | Managerial #interview #question

Cloud Data Engineer Mock Interview | PySpark Coding Interview Questions |Azure Databricks #question

Live Azure Data Engineering Mock Interview | Technical Round | Out of Memory Issue | SQL #interview

Нельзя смеяться | Смех с водой | 97 #shorts

Як азовська піхота прийняла групу розвідки вс рф? Зізнання окупантів і кадри з GoPro

ПРОВЕРКА НА ВШИВОСТЬ (смешное видео, юмор, поржать, приколы)

Live Big Data Mock Interview | Technical Round 2 : PySpark | Slowly Changing Dimensions | Data Skew

Sumit Mittal

Переглядів 5 036

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 19 гру 2024

КОМЕНТАРІ • 10

@Sha-mu3pv 13 днів тому
17:20 distinct is not a narrow transformation
@rajeshd9925 8 місяців тому
Window function will helps to solve this pyspark code.
@akhiladevangamath1277 25 днів тому
Interviewee has 9 years of experience as a data engineer
@varadpadalkar4879 8 місяців тому
Sir, Can you please share the pyspark code of that problem?
@Blissful_Echoes-f6t 8 місяців тому
thank u sir.
@VikasChauhan-h7o 5 місяців тому ⁺¹
from pyspark.sql import SparkSession
from pyspark.sql import *
from pyspark.sql.functions import *
from pyspark.sql.functions import lag
from pyspark.sql import functions as F
sc = SparkSession\
.builder\
.master("local[*]")\
.appName('example_spark')\
.getOrCreate()

# creating a dataframe
data = [
(2000,'2024-01-01'),
(3000,'2024-01-02'),
(45000,'2024-01-22'),
(40000,'2024-02-02'),
(13000,'2024-03-03')
]
headers = ("revenue","date")
df = sc.createDataFrame(data, headers)
df.show()
df = df.withColumn('month',date_format(df.date, 'yyyy-MM'))
df = df.groupBy('month').agg(sum('revenue').alias('revenue')).orderBy('month')
my_window = (Window.orderBy('month')
.rowsBetween(Window.unboundedPreceding, 0))
df_new = df.withColumn('cum_sum', F.sum('revenue').over(my_window))
df_new.show()
@VikasChauhan-h7o 5 місяців тому
from pyspark.sql import SparkSession
from pyspark.sql import *
from pyspark.sql.functions import *
from pyspark.sql.functions import lag
from pyspark.sql import functions as F
sc = SparkSession\
.builder\
.master("local[*]")\
.appName('example_spark')\
.getOrCreate()

# creating a dataframe
data = [
(2000,'2024-01-01'),
(3000,'2024-01-02'),
(45000,'2024-01-22'),
(40000,'2024-02-02'),
(13000,'2024-03-03')
]
headers = ("revenue","date")
df = sc.createDataFrame(data, headers)
df.show()
df = df.withColumn('month',date_format(df.date, 'yyyy-MM'))
df = df.groupBy('month').agg(sum('revenue').alias('revenue')).orderBy('month')
my_window = (Window.orderBy('month')
.rowsBetween(Window.unboundedPreceding, 0))
df_new = df.withColumn('cum_sum', F.sum('revenue').over(my_window))
df_new.show()

Наступне

Автоматичне відтворення

Big Data Engineer Mock Interview | Big Data Project Pipeline | Managerial #interview #question

Big Data Engineer Mock Interview | Big Data Project Pipeline | Managerial #interview #question

Cloud Data Engineer Mock Interview | PySpark Coding Interview Questions |Azure Databricks #question

Cloud Data Engineer Mock Interview | PySpark Coding Interview Questions |Azure Databricks #question

Live Azure Data Engineering Mock Interview | Technical Round | Out of Memory Issue | SQL #interview

Live Azure Data Engineering Mock Interview | Technical Round | Out of Memory Issue | SQL #interview

Нельзя смеяться | Смех с водой | 97 #shorts

Нельзя смеяться | Смех с водой | 97 #shorts

Як азовська піхота прийняла групу розвідки вс рф? Зізнання окупантів і кадри з GoPro

Як азовська піхота прийняла групу розвідки вс рф? Зізнання окупантів і кадри з GoPro

ПРОВЕРКА НА ВШИВОСТЬ (смешное видео, юмор, поржать, приколы)

ПРОВЕРКА НА ВШИВОСТЬ (смешное видео, юмор, поржать, приколы)

ШАЛОСТЬ (смешное видео, приколы, юмор, поржать)

ШАЛОСТЬ (смешное видео, приколы, юмор, поржать)

Live Data Engineering Technical Round Mock Interview | Apache Spark, SQL & Project #question

Live Data Engineering Technical Round Mock Interview | Apache Spark, SQL & Project #question

How i Cracked 5 offers in 30 days

How i Cracked 5 offers in 30 days

Real-time Data Modeling & System Design Mock Interview for Data Engineers #interview #important

Real-time Data Modeling & System Design Mock Interview for Data Engineers #interview #important

Stocks plunge after Fed signals fewer rate cuts for 2025

Stocks plunge after Fed signals fewer rate cuts for 2025

Live Data Engineering Coding Round Mock Interview | Apache Spark | Big Data Project #interview

Live Data Engineering Coding Round Mock Interview | Apache Spark | Big Data Project #interview

Live Mock Interview For Data Analyst| Data Science By Ranjan Sir | DataGyan |Best Interview in 2023

Live Mock Interview For Data Analyst| Data Science By Ranjan Sir | DataGyan |Best Interview in 2023

Mock Interview for Data Engineers | Spark Optimizations | Real-time Project Challenges and Scenarios

Mock Interview for Data Engineers | Spark Optimizations | Real-time Project Challenges and Scenarios

Data Lake VS Data Warehouse VS Data Marts | CodeLearnX

Data Lake VS Data Warehouse VS Data Marts | CodeLearnX

5 Reasons NVIDIA Stock is Falling

5 Reasons NVIDIA Stock is Falling

Хто такий РОМАН СВІТАН? Звідки бере інформацію про фронт?

Хто такий РОМАН СВІТАН? Звідки бере інформацію про фронт?

"ХИТРЕЦ": Трамп РОЗЛЮТИВ Скабєєву / Оля ЛИЄ ЯДОМ #shorts

"ХИТРЕЦ": Трамп РОЗЛЮТИВ Скабєєву / Оля ЛИЄ ЯДОМ #shorts

Анна Трінчер - Треш (Official Music Video)

Анна Трінчер - Треш (Official Music Video)

ФИЛЬМ! НЕВИНОВНЫЙ ГОТОВИТ ДЕРЗКИЙ ПОБЕГ С НЕПРИСТУПНОГО ОСТРОВА-ТЮРЬМЫ! Мотылёк! Русский фильм

ФИЛЬМ! НЕВИНОВНЫЙ ГОТОВИТ ДЕРЗКИЙ ПОБЕГ С НЕПРИСТУПНОГО ОСТРОВА-ТЮРЬМЫ! Мотылёк! Русский фильм

😳Трамп ПОТІШИВ Скабєєву, але одразу РОЗЧАРУВАВ #shorts

😳Трамп ПОТІШИВ Скабєєву, але одразу РОЗЧАРУВАВ #shorts

"ВСЯ УЛИЦА полетела" - курянка про обстріли рф

"ВСЯ УЛИЦА полетела" — курянка про обстріли рф

МІША ЛЕБІГА і АНДРІЙ ЛУЗАН в СРАЧІ #32

МІША ЛЕБІГА і АНДРІЙ ЛУЗАН в СРАЧІ #32