Finishing our SG API Pipeline with Chronocoding - How I Write Pipes Part V

How might LLMs store facts | DL7

Реальное ЛАЙВКОДИНГ собеседование JUNIOR Python разработчик

У ДЕТЕНЫША СТЕПЫ ИСЧЕЗ ГЛАЗИК

ПРАНК НАД БОЯРСКИМ | КОНФЛИКТ НА ДОРОГЕ

😯 Подарила сыну БМВ, но не ожидала такой реакции на машину! | Новостничок

Parallelize Pipeline Processing With Sub Node Parallelization - How I Write Pipes Part IV

DataEngineerOne

Переглядів 1 102

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 7 січ 2025

КОМЕНТАРІ • 4

@javierbosch1338 4 роки тому ⁺²
If you data is very big, would this approach still work? Would passing the data back to be aggregated in the dict (to be passed to PartionedDataSet) still work?
@DataEngineerOne 4 роки тому ⁺¹
If the data is too large for this approach, you might be better off going with a proper data parallel processing solution such as spark. Of course, if you have a beefy enough machine, no data is too large for this approach :)
@javierbosch1338 4 роки тому ⁺¹
@@DataEngineerOne I was using Ray for this task instead of Spark. There was not only a matter of data size but the execution time of writing all that data. Here I was using each worker to write to disk, but wanted a way to use the PartionedDataSet recorded/registered in the catalog to save to file. That way I bypass pushing dataframes across the stacks and processes.
@DataEngineerOne 4 роки тому ⁺¹
@@javierbosch1338 Aha, I see. Yes, you certainly can should be able to pass the data into a PartitionedDataSet that wraps around a pandas DataFrame, to serialize the reading and writing. But, if the data is as big as you say, you may still run into speed issues with regard to IO

Наступне

Автоматичне відтворення

Finishing our SG API Pipeline with Chronocoding - How I Write Pipes Part V

Finishing our SG API Pipeline with Chronocoding - How I Write Pipes Part V

How might LLMs store facts | DL7

How might LLMs store facts | DL7

Реальное ЛАЙВКОДИНГ собеседование JUNIOR Python разработчик

Реальное ЛАЙВКОДИНГ собеседование JUNIOR Python разработчик

У ДЕТЕНЫША СТЕПЫ ИСЧЕЗ ГЛАЗИК

У ДЕТЕНЫША СТЕПЫ ИСЧЕЗ ГЛАЗИК

ПРАНК НАД БОЯРСКИМ | КОНФЛИКТ НА ДОРОГЕ

ПРАНК НАД БОЯРСКИМ | КОНФЛИКТ НА ДОРОГЕ

😯 Подарила сыну БМВ, но не ожидала такой реакции на машину! | Новостничок

😯 Подарила сыну БМВ, но не ожидала такой реакции на машину! | Новостничок

Прочистка шлюзов

Прочистка шлюзов

Trump announced the end date of the war / Emergency plane landing

Trump announced the end date of the war / Emergency plane landing

Как Сделать Лучший Пет-Проект | Архитектура Бекенда за 1 час

Как Сделать Лучший Пет-Проект | Архитектура Бекенда за 1 час

What is Kedro? Why is it useful? A Non-Technical Intro to Kedro

What is Kedro? Why is it useful? A Non-Technical Intro to Kedro

How to Get/Write Data from/to a SQL Database

How to Get/Write Data from/to a SQL Database

Load Balancers are not Magic - Dissecting Atlassian Outage

Load Balancers are not Magic - Dissecting Atlassian Outage

This Is Why Python Data Classes Are Awesome

This Is Why Python Data Classes Are Awesome

Writing Code That Runs FAST on a GPU

Writing Code That Runs FAST on a GPU

Solving one of PostgreSQL's biggest weaknesses.

Solving one of PostgreSQL's biggest weaknesses.

Software Planning and Technical Documentation

Software Planning and Technical Documentation

Гениальное изобретение из обычного стаканчика!

Гениальное изобретение из обычного стаканчика!

У ДЕТЕНЫША СТЕПЫ ИСЧЕЗ ГЛАЗИК

У ДЕТЕНЫША СТЕПЫ ИСЧЕЗ ГЛАЗИК

Что-что Мурсдей говорит? 💭 #симбочка #симба #мурсдей

Что-что Мурсдей говорит? 💭 #симбочка #симба #мурсдей

How to treat Acne💉

How to treat Acne💉

Анна Трінчер - Треш (Official Music Video)

Анна Трінчер - Треш (Official Music Video)

Ветеран війни отримав гроші на житло

Ветеран війни отримав гроші на житло

Мама загинула у блокадному Чернігові, а тато у полоні РФ #війна #люди #україна #shorts #смерть

Мама загинула у блокадному Чернігові, а тато у полоні РФ #війна #люди #україна #shorts #смерть

🔥"СВОшник" РОЗНОСИТЬ шоу путіністів! Ведучий ШОКОВАНИЙ від цих СЛІВ #shorts

🔥"СВОшник" РОЗНОСИТЬ шоу путіністів! Ведучий ШОКОВАНИЙ від цих СЛІВ #shorts