Effortless Scalability: Orchestrating Large Language Model Inference w... Joinal Ahmed & Nirav Kumar

Keynote: Linus Torvalds, Creator of Linux & Git, in Conversation with Dirk Hohndel

LLM's Anywhere: Browser Deployment with Wasm & WebGPU - Joinal Ahmed & Nikhil Rana

ВЕЛИКИЙ ЕКСКЛЮЗИВ: Чому Оля Полякова більше не співає для чоловіка? Він розкаже! Вперше за 20 років

風船をキャッチしろ！🎈 Balloon catch Challenges

Главная суперспособность армейских муравьев и пляжные упогебии

LLM's Anywhere: Browser Deployment with Wasm & WebGPU - Joinal Ahmed & Nikhil Rana

The Linux Foundation

Переглядів 383

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 8 лис 2024
Don't miss out! Join us at our upcoming conference: Open Source Summit + AI_Dev: Open Source GenAI & ML Summit in Tokyo from October 28-29, 2024. Connect with peers as the community gathers to further the education and advancement of open source and GenAI. Learn more at events.linuxfo...
LLM's Anywhere: Browser Deployment with Wasm & WebGPU | LLM随处可用：使用Wasm和WebGPU进行浏览器部署 - Joinal Ahmed, Navatech Group & Nikhil Rana, Google Cloud
In today's interconnected world, deploying and accessing machine learning (ML) models efficiently poses significant challenges. Traditional methods rely on cloud GPU clusters and constant internet connectivity. However, WebAssembly (Wasm) and WebGPU technologies are revolutionizing this landscape. This talk explores leveraging Wasm and WebGPU for deploying Single Layer Models (SLMs) directly within web browsers, eliminating the need for extensive cloud GPU clusters and reducing reliance on constant internet access. We showcase practical examples and discuss how Wasm enables efficient cross-platform ML model execution, while WebGPU optimizes parallel computation within browsers. Join us to discover how this fusion empowers developers and users alike with unprecedented ease and efficiency in browser-based ML, while reducing dependence on centralized cloud infrastructure and internet connectivity constraints.
在当今互联世界中，高效部署和访问机器学习（ML）模型面临着重大挑战。传统方法依赖于云GPU集群和持续的互联网连接。然而，WebAssembly（Wasm）和WebGPU技术正在彻底改变这一局面。本次演讲探讨了如何利用Wasm和WebGPU在Web浏览器中直接部署单层模型（SLMs），消除了对庞大云GPU集群的需求，减少了对持续互联网访问的依赖。我们展示了实际示例，并讨论了Wasm如何实现高效的跨平台ML模型执行，以及WebGPU如何优化浏览器内的并行计算。加入我们，发现这种融合如何赋予开发人员和用户在基于浏览器的ML中前所未有的便利和效率，同时减少对集中式云基础设施和互联网连接的依赖。
Наука та технологія

КОМЕНТАРІ •

Наступне

Автоматичне відтворення

Effortless Scalability: Orchestrating Large Language Model Inference w... Joinal Ahmed & Nirav Kumar

Effortless Scalability: Orchestrating Large Language Model Inference w... Joinal Ahmed & Nirav Kumar

Keynote: Linus Torvalds, Creator of Linux & Git, in Conversation with Dirk Hohndel

Keynote: Linus Torvalds, Creator of Linux & Git, in Conversation with Dirk Hohndel

LLM's Anywhere: Browser Deployment with Wasm & WebGPU - Joinal Ahmed & Nikhil Rana

LLM's Anywhere: Browser Deployment with Wasm & WebGPU - Joinal Ahmed & Nikhil Rana

ВЕЛИКИЙ ЕКСКЛЮЗИВ: Чому Оля Полякова більше не співає для чоловіка? Він розкаже! Вперше за 20 років

ВЕЛИКИЙ ЕКСКЛЮЗИВ: Чому Оля Полякова більше не співає для чоловіка? Він розкаже! Вперше за 20 років

風船をキャッチしろ！🎈 Balloon catch Challenges

風船をキャッチしろ！🎈 Balloon catch Challenges

Главная суперспособность армейских муравьев и пляжные упогебии

Главная суперспособность армейских муравьев и пляжные упогебии

美味しい食べ物のASMR ASMR FOOD 🍜🍝🍜🥓🥢🍗#asmr #美味しい食べ物#食べ物#vlog

美味しい食べ物のASMR ASMR FOOD 🍜🍝🍜🥓🥢🍗#asmr #美味しい食べ物#食べ物#vlog

A Next-generation IoT Platform for Edge AI Apps Leveraging Se...- Munehiro Shimomura & Kenji Shimizu

A Next-generation IoT Platform for Edge AI Apps Leveraging Se...- Munehiro Shimomura & Kenji Shimizu

X Space #20 - Intention based #Web3 AdTech: What is it? How to use it?

X Space #20 - Intention based #Web3 AdTech: What is it? How to use it?

Introducing WebGPU: Unlocking modern GPU access for JavaScript

Introducing WebGPU: Unlocking modern GPU access for JavaScript

How large language models work, a visual intro to transformers | Chapter 5, Deep Learning

How large language models work, a visual intro to transformers | Chapter 5, Deep Learning

Improving Bpftrace Reliability - Daniel Xu, Meta

Improving Bpftrace Reliability - Daniel Xu, Meta

Nico Martin - From ML to LLM: On-Device AI in the Browser - Uphill Conf 2024

Nico Martin - From ML to LLM: On-Device AI in the Browser - Uphill Conf 2024

Contributing to KernelCI for Better Testing and Collaboration - Arisu Tachibana, Cybertrust Japan Co

Contributing to KernelCI for Better Testing and Collaboration - Arisu Tachibana, Cybertrust Japan Co

What is WebGPU?

What is WebGPU?

What are AI Agents?

What are AI Agents?

Игрок нашел способ защитить монитор от посторонних взглядов

Игрок нашел способ защитить монитор от посторонних взглядов

iPhone 13 vs iPhone 12 ⚡ The Ultimate Speed Test Battle! Who’s the Real Speed King? 👑 #Viral #Shorts

iPhone 13 vs iPhone 12 ⚡ The Ultimate Speed Test Battle! Who’s the Real Speed King? 👑 #Viral #Shorts

ОБМАНУЛИ В МАГАЗИНЕ / Блок питания Asus ROG Thor 1200W (РЕМОНТ)

ОБМАНУЛИ В МАГАЗИНЕ / Блок питания Asus ROG Thor 1200W (РЕМОНТ)

#s24ultra _vs_ #iphone16promax #iphone16promax #s24ultra #foryou

#s24ultra _vs_ #iphone16promax #iphone16promax #s24ultra #foryou

When engineers design the product #coding #programming #javascript #python

When engineers design the product #coding #programming #javascript #python

Этот парень ускорил работу своего компьютера с помощью аквариума! #рекомендации #факты #интересно

Этот парень ускорил работу своего компьютера с помощью аквариума! #рекомендации #факты #интересно

The M4 Mac Mini is Incredible!

The M4 Mac Mini is Incredible!

Other smartphones vs Nokia #shorts

Other smartphones vs Nokia #shorts