Scaling and innovating with Google Cloud databases

Google TPU & other in-house AI Chips

Fresher Mock Interview FULL STACK PYTHON | Technical Round | FULL STACK PYTHON | @magneqsoftware6896

Ну Лилит))) прода в онк: завидные котики

Історія військовослужбовця з ТЦК на Миколаївщині #shortsvideo

СПАСТИСЬ ОТ МАЧЕХИ. БЕСЕДА С ВИТАЛИЕМ ПОРТНИКОВЫМ @portnikov.argumenty

Accelerating AI inference workloads

Google Cloud Tech

Переглядів 1 576

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 5 чер 2024
Deploying AI models at scale demands high-performance inference capabilities. Google Cloud offers a range of cloud tensor processing units (TPUs) and NVIDIA-powered graphics processing unit (GPU) VMs. Join Debi Cabrera as she sits down with Alex Spiridonov, Group Product Manager, to discuss key considerations for choosing TPUs and GPUs for your inference needs. Watch along and understand the cost implications, how to deploy and optimize your inference pipeline on Google Cloud, and more!
Chapters:
0:00 - Meet Alex
2:52 - Balancing cost and efficiency
5:51 - TPU vs GPU for AI models
8:21 - Getting started with Google Cloud TPUs and GPUs
10:05 - Common challenges when using inference optimization
12:10 - Available resources for AI inference workloads
13:13 - Wrap up
Resources:
Watch the full session here → goo.gle/3JC32qx
Check out Alex’s blog post → goo.gle/3wa2DZb
JetStream GitHub → goo.gle/49SoSRj
MaxDiffusion GitHub → goo.gle/4aQ1g11
MaxText GitHub → goo.gle/49SoYZb
Watch more Cloud Next 2024 → goo.gle/Next-24
Subscribe to Google Cloud Tech → goo.gle/GoogleCloudTech
#GoogleCloudNext #GoogleGemini
Event: Google Cloud Next 2024
Speakers: Debi Cabrera, Alex Spiridonov
Products Mentioned: Cloud TPUs, Cloud GPUs
Наука та технологія

КОМЕНТАРІ • 2

@googlecloudtech Місяць тому
Check out more interviews and demos from Cloud Next 2024 here → goo.gle/Next-24.
@peterblanch2830 Місяць тому ⁺¹
Too much acronyms as usual... 😕

Наступне

Автоматичне відтворення

Scaling and innovating with Google Cloud databases

Scaling and innovating with Google Cloud databases

Google TPU & other in-house AI Chips

Google TPU & other in-house AI Chips

Fresher Mock Interview FULL STACK PYTHON | Technical Round | FULL STACK PYTHON | @magneqsoftware6896

Fresher Mock Interview FULL STACK PYTHON | Technical Round | FULL STACK PYTHON | @magneqsoftware6896

Ну Лилит))) прода в онк: завидные котики

Ну Лилит))) прода в онк: завидные котики

Історія військовослужбовця з ТЦК на Миколаївщині #shortsvideo

Історія військовослужбовця з ТЦК на Миколаївщині #shortsvideo

СПАСТИСЬ ОТ МАЧЕХИ. БЕСЕДА С ВИТАЛИЕМ ПОРТНИКОВЫМ @portnikov.argumenty

СПАСТИСЬ ОТ МАЧЕХИ. БЕСЕДА С ВИТАЛИЕМ ПОРТНИКОВЫМ @portnikov.argumenty

MONATIK - А що? (Official video)

MONATIK — А що? (Official video)

Google Cloud’s approach to generative AI

Google Cloud’s approach to generative AI

Keynote: Accelerating AI Workloads with GPUs in Kubernetes - Kevin Klues & Sanjay Chatterjee

Keynote: Accelerating AI Workloads with GPUs in Kubernetes - Kevin Klues & Sanjay Chatterjee

Exploring the Latency/Throughput & Cost Space for LLM Inference // Timothée Lacroix // CTO Mistral

Exploring the Latency/Throughput & Cost Space for LLM Inference // Timothée Lacroix // CTO Mistral

The most important AI trends in 2024

The most important AI trends in 2024

Retrieval Augmented Generation (RAG) Explained: Embedding, Sentence BERT, Vector Database (HNSW)

Retrieval Augmented Generation (RAG) Explained: Embedding, Sentence BERT, Vector Database (HNSW)

Google Releases AI AGENT BUILDER! 🤖 Worth The Wait?

Google Releases AI AGENT BUILDER! 🤖 Worth The Wait?

Deep Dive: Optimizing LLM inference

Deep Dive: Optimizing LLM inference

Accelerate building AI applications with Cloud Run

Accelerate building AI applications with Cloud Run

Очень странные дела PS 4 Pro

Очень странные дела PS 4 Pro

ЭТО Главный провал Apple перевод @mkbhd Смотри до КОНЦА

ЭТО Главный провал Apple перевод @mkbhd Смотри до КОНЦА

КУПИЛ САМЫЙ ДЕШЁВЫЙ ПК ARDOR GAMING в DNS для CS2

КУПИЛ САМЫЙ ДЕШЁВЫЙ ПК ARDOR GAMING в DNS для CS2

Noctua stole my idea!

Noctua stole my idea!

НЕЛЕПЫЙ ФЕЙЛ при замене гнезда на Usb-c в Xiaomi Redmi AirDots #wireless #mi #redmi

НЕЛЕПЫЙ ФЕЙЛ при замене гнезда на Usb-c в Xiaomi Redmi AirDots #wireless #mi #redmi

GPT-5 уже через 90 дней, Шпионские наушники с ИИ, Робопес на заводе BMW и другие новости

GPT-5 уже через 90 дней, Шпионские наушники с ИИ, Робопес на заводе BMW и другие новости

Glow in the Dark Charging cable #shorts #diy #glowinthedark #chargingcable #nanocord

Glow in the Dark Charging cable #shorts #diy #glowinthedark #chargingcable #nanocord

Новинки Asus ROG на Computex 2024! Забудьте про RAM! 🔥

Новинки Asus ROG на Computex 2024! Забудьте про RAM! 🔥