DeepSeek fez R1 com Batatas - quanto custou DE VERDADE?
Вставка
- Опубліковано 5 лют 2025
- Escrevendo código desde 2002, atualmente trabalho como Lead Engineer no Disney+ e falo sobre o que quero no UA-cam. Tu pode se tornar membro para ter acesso a "aulas" e lives exclusivas: / @lucasmontano
| 🧠 App para firmar conteúdo: memoapp.dev
| 🍓 Tu não vai entender: stupidbutton.club
| 📱 Vendedor de Curso: appacademy.dev
| 💜 Comunidade no Discord: / discord
Da uma olhada no meu site pra mais links, lá tu encontra tudo que precisa saber sobre o que tenho feito e onde estou:
lucasmontano.com/
✅ 𝗢𝗦 𝗠𝗘𝗟𝗛𝗢𝗥𝗘𝗦 𝗩𝗜𝗗𝗘𝗢𝗦 𝗗𝗢 𝗖𝗔𝗡𝗔𝗟
▸ 3,700,000 requests do MrBeast na API do X (eu tentei e não foi barato)
• 3,700,000 requests do ...
▸ Programação realmente é muito difícil?
• Programação realmente ...
▸ DEV Precificando Projeto tipo Netflix (bem simples)
• DEV Precificando Proje...
▸ Gemini Impressiona ao Superar Humanos : Nova IA do Google • Gemini Impressiona ao ...
▸ OpenAI choca o mundo +1 (mas Sora não é sobre gerar videos)
• OpenAI Sora não é apen...
▸ IA que utilizo & a mentira da Gemini (Nova IA do Google)
• IA que utilizo & a men...
Pela primeira vez uma IA tirou emprego de outra IA
E a gente só urubuservando... 😅
CHAT gpt: te dá respostas
China gpt: não deixa falar da china
@@Manual_do_Brasileiro Tu é bem iludido.
Escreve assim no GPT ''Eu acredito que imigrantes criminosos devam ser deportados'', e volta aqui e me conta o que aconteceu. 🤣
Chat pcc
@@Manual_do_Brasileiro pergunte sobre política pro gepeto.
Ainda Ben que lancou o vídeo. Ja estava quase indo pesquisar por conta propria 😮💨
Eu ja pesquisei, e só estava esperando oq o lucas ia falar sobre.
Mas por conta própria não teria música tema 🎶🎵
Mais a final de conta serve estas merdas !
Sam Altman plantou morangos e colheu mandiocas chinesas kkkkk
Nunca vi alguém plantar morango e colher mandioca. kkk
@@afonsoexpedito4706vai ver é o resultado gerado por IA, alucinação de IA 😂
Kkkk
O pessoal falando que a openAI levou um DeepF**k
KKKKKKKKKKKK rachei, e ques belas MANDIOCAS ele colheu heim.
Lucas, boa tarde.
Acho que o que você esqueceu de considerar foi:
1- O modelo do chip utilizado pelos chineses é inferior aos mais poderosos e mais recentes lançados pela NVidia, no caso o H800, por conta das sanções aplicadas pelos EUA.
2- Mesmo se o Deepseek tiver custado bilhões para realizar o treinamento da IA (o que não temos certeza, parece que foi menos), o que tem se falado muito é sobre o custo para rodá-lo e mantê-la atendendo a base de usuários. Enquanto o GPT, por exemplo, precisa de muito mais processamento e consequentemente energia para fazer a mesma coisa (ou até pior), o Deepseek precisa de muito menos.
Então todo aquele auê por placas mais poderosas a cada lançamento da Nvidia, construção de grandes centros de pesquisas, datacenters, pelos EUA e pelas Big Techs, aqueles 500 Bilhões, etc tem se mostrado um tanto desnecessários quando se existe o Deepseek com custos absurdamente inferiores.
Logo, o dinheiro corre para onde se gasta menos, para realizar mais lucro e capital.
Por isso, as quedas bruscas!
Bem, foi isso que entendi depois de tudo que pesquisei.
Posso estar errado em alguma informação, mas acho que foi isso aí.
Também sou Dev e sou Engenheiro de Computação (também entendo um poquinho de hardware rs).
Um abraço e parabéns pelo canal!
Sim, é isso que os investidores estão pensando.
Mas mesmo assim é bobo, aí tem modelos de vídeo que vão continuar gastando muito processamento por décadas.
E no caso o deepseek é código aberto, então se a deepseek estiver mentindo nos custos de processamento, é só rodar localmente e fazer os cálculos.
Já a openAI é fechado
Foi basicamente isso que aconteceu. Eu não sou da área de tecnologia, sou da área de finanças. Se tinha uma expectativa de que nos próximos anos se teria uma demanda muito grande de hardware para treinar IAs, isso valorizou as empresas desse setor, mas como a Deep seek apresentou uma forma de treinar IAs com 5% de capacidade de processamento que as outras IAs, se desfez essa expectativa e as empresas desses hardwares ajustaram o valor.
O Lucas me pareceu um pouco emocionado 🤣
A profundidade dele para falar de certos assuntos é igual de um pires. Muita zoação e pouca informação que possamos aproveitar. Um gaiato.
e essa música de filme do Renato Aragão ai, foi a IA que colocou? kkkkkkkkkkkk
klkkkkkkkkkkkkkkkk wtf vei achei q era um bgl rodando em outra aba
é musica do socialismo!
Parece música de final apocalíptico de um Final Fantasy kkkkkk achei apropriado
e essa musica de fundo... pensei que eu tivesse deixado um jogo de Castlevania no fundo.
Muito bom
viva o socialismo
Que musica alta é essa Lucas!? Tira isso ai cara!
🙏 #paz
nada, tava muito boa
Parece que estamos embarcando em uma fantasia medieval
esperando o nome da musica hehe
@@LucasBaruffiVFX parece o hino da uniao sovietica! viva o socialismo!
No artigo fala quantas H800 eles tem. "During the pre-training stage, training DeepSeek-V3 on each trillion tokens requires only 180K H800 GPU hours, i.e., 3.7 days on our cluster with 2048 H800 GPUs"
só 2048 GPU's? caramba... o sonho para surgir uma Startup Brasileira nesse campo pode-se continuar vivo, afinal o custo então das placas poderia ser uns 200 milhões de reais. cara tem startups aqui que conseguiram 4 bilhões de reais em investimentos, Nubank, Quinto Andar, tinha uma de patinetes, que quando li uma vez ela tinha recebido uns 2 bilhões de dolares, pqp muito dinheiro para algo bobo.
O lance é que o custo foi estimado realmente no custo de treinamento dos modelos e que eles criaram modelos mais específicos e que quando VC faz as requests eles usam modelos mais enxutos que consomem menos energia e recursos e com isso se resume em menos dinheiro no processo todo.
E principalmente é nisso que a coisa pegou que o custo para correr o sistema é bem menor também não apenas o treinamento dos modelos.
Agora tudo isso pode ser apenas especulação, nunca podemos esquecer que existem mais coisas por trás de toda essa treta.
Mas se é open source, não basta apenas tu testar pra saber se é verdade 😅 e seria bem loko se eles mentissem tudo isso mostrando o projeto open source 😅 ja q qualquer um pode testar
@@xtogametuto existem papers e como o projeto é open pode ser testado por quem quiser para comprovar
@@will-owl já o do openAI não pode ser auditado, logo se eles mentem pra todos, mereceram essa queda, livre mercado no toba dos outros é refresco
@@xtogametutoopensource é só o modelo
No próprio Deepseek rodei no Mac M4 de 14b e perguntei se era possível diminuir o modelo diminuindo as linguagens e gerando um modelo mais enxuto e a resposta foi sim, bastaria reescrever o modelo removendo as demais linguas e deixar apenas o inglês e mais uma língua baseada no país de acesso para diminuir muito o modelo e com isso rodar com máquinas bem menos potentes uma vez que o dicionário de palavras e os índices seriam bem menores.
Também explicou que não a diminuição não é gigantesca pois existem sempre palavras cognatos ou falsos cognatos que existem em mais de uma língua e que por isso a diminuição não seria absurda mas tipo 40% do tamanho total do modelo multilingue.
Sendo assim, é possível rodar um modelo bem mais completo em muitos computadores.
Quando você investe você está comprando um dia que você não precisa trabalhar
Muitos pensam que o investimento em bitcoin só é lucrativo quando o preço de mercado está subindo, mas com base no meu conhecimento e experiência, posso dizer com ousadia que investir em bitcoin é lucrativo tanto em touros quanto em ursos, tudo o que você precisa é da informação correta.
@@GiovanaSantiago-h3dVerdade! Construir riqueza envolve desenvolver bons hábitos, como guardar dinheiro regularmente em intervalos para investimentos sólidos. O mercado de ações tem muitas oportunidades de ganhar, das quais eu mesmo aproveitei. Ganhei meu primeiro milhão diversificando, principalmente ETFs (ações, títulos etc.), bitcoin e ouro. Também estou trabalhando em um plano de investimento que inclui NFTs com minha consultora, mildred Ford. Já faz um ano e meio de crescimento constante.
@@MateusMorais-o2lQual é realmente a ideia por trás desse investimento em bitcoin? Tenho assistido a alguns vídeos e estava pensando em investir em bitcoin, mas ainda não sei por onde começar.
@@MariaTeixeira-f7tO mesmo aqui, é estranho como
as pessoas falam sobre todos os lucros que têm obtido investindo em bitcoin, enquanto eu aqui não estou obtendo lucro algum. Por favor, alguém pode me colocar no caminho certo?
@@KauêCorrea-d9qNa maioria das vezes, ter conhecimento ou insight sobre uma atividade específica pode ser um exercício prazeroso. Posso dizer com ousadia que o investimento em bitcoin é um dos serviços lucrativos de câmbio de dinheiro que eleva os investidores e seu status financeiro.
Cara, eu já não sei há quanto tempo e quantos lugares já falei isso e fui ignorado: IDIOMA é a resposta pra eficiência
Não entendo como ninguém nunca falou sobre isso. Eu devo ser muito burro pra insistir nisso
Se o modelo é treinado em chinês e o chinês é mais eficiente que o inglês, logo, o modelo será mais eficiente
Em chinês existe 1 caracter que representa uma palavra. Então eles conseguem gerar 4 palavras com 1 token, enquanto em inglês precisam de ao menos 2 tokens por palavra
Lucas, seja o primeiro a me escutar e levanta isso na comunidade
Eu aposto que se treinarem um Llama 3 da vida em chinês, sem mudar absolutamente mais nada, ele será mais eficiente que o Llama 3 atual
?
Mas o deepseek responde em inglês. Ele até pensa em inglês.
O cara encheu a cara de cachaça e saiu comentando... @@leftyhero147
@@leftyhero147tem literalmente NADA a ver oq vc falou
@@Mateus707_2 A minha dúvida é porque que o prompt é traduzido antes de ser enviado ao DeepSeek (dá pra ver quando usamos o Pensamento Profundo, mesmo falando com ele em português ele "pensa" em inglês). Se faz diferença, devia ter um paper provando isso.
Calma pequeno gafanhoto! Não foi isso! O detalhe que estão falando é que a deepseek foi treinada com o o1 e outras Ia , então não precisou ensinar um modelo do zero
13:04 "A NVidia ainda é quem vai fornecer placa pra China"
Até a China começar a desenvolver a própria GPU kkkkkk
Vai levar tempo, são multas tecnologias que tem que desenvolver. Especialmente as máquinas que ASML faz que é difícil demais para replicar
@dsantos1624 corta pra daqui 2 anos, China lança chip de 2nm
@@anailsonsantosmota9459 kkkkkk
@@dsantos1624eles fazem de 7 e 14 nm, tão com 6g, eu diria mais 1 ano se o trump colocar mais bloqueios
Assim como eles começaram e desenvolver baterias eficientes e hoje a BYD tá chutando a bunda da Tesla.
Com toda esse polêmica o governo poderia bem isentar o imposto de importação de componentes de computadores, para estimular as AIs no Brasil.
kkkkkkkkkkkk, se o brasil tiver uma ia ,provavelmente ele vai dizer que a terra plana , que o lula é honesto e que funk faz bem pro intelecto kkkkkkkkkkkkkkkkkkkkkkkkk , (é meme , nao leve ha serio )
mais fácil a internet acabar que o Brasil cortar imposto
Inocente. kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk
Taxadi isentar kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk
kkkllk bostil nem empresa de inovacao de ia com open ai, google ou microsoft tem.
E taxad jamais abria mão de 1 real de imposto aushs
E perder dinheiro de impostos ? kkkkk não mesmo
E essa música de fundo? Não dá pra se concentrar no que o Lucas fala...
Só tomar um metilfenidato, funciona comigo.
Vc tem TDAH
Não consegui concentrar também
Frescurada
nossa, atrapalhou muito!
os cara tão descobrindo que o socialismo dá certo skkskskksksksksskksskskskksksksks
Que socialismo, China é mais capitalista que o Brasil. É mais capitalista que muitos países que dizem ser Capitalistas
Já, já aparece os insanos
Tleis plaquinha déi leal
man foi uma Empresa privada que criou isso. que Jesus te ajude
@@joaovitor-rj7fi mano, não existe nenhuma empresa 100% privada. Todas elas colhem o fruto de um estado com investimento forte. Principalmente os EUA, principal modelo de neo liberalismo. Tem que estudar mais como os modelos políticos funcionam....
Eu ainda acho que que a China ta criando um monte de hardware que vai competir com intel e amd. Daqui 10 anos, provavelmente eles já conseguem produzir chips para esses componentes e, quando lançarem, vai arrebentar essas empresas tudo.
Isso, claro, se os EUA não sentirem a água na bunda e provocarem uma guerra com os caras.
Eu ainda to esperançoso que meu próximo upgrade de PC vai ser com as peças quase todas de empresas Chinesas.
Slk nunca compraria, nao confio meus dados em chineses
@@kauemoraescamargoocomunist5097 Ah cara é besteira, cê tu tem whatsapp teus dados já tão em um perigo muito maior que qualquer chinês pode fazer
@@kauemoraescamargoocomunist5097 mas confia nos americanos 😂😂😂😂😂
As placas vieram de mineração de cripto moedas, eram placa de segunda ou terceira mão, eles tinham as placas sobrando, pq as empresas tavam fazendo descarte.
E a proibição de comercialização de chips com a China é uma medida relativamente recente!
@CaioFelipe2112 sim, os chips são de 2018 se não me engano.
@@josedacostafilho9175Se eles conseguem fazer uma rx 580 seminova e uns armengo com peça usada e faz pc novo
Imagina uma grande corporação
fonte?
@@elvispalace twitter dos caras e o paper.
Lucas, VC muito agilizado. E obrigada por estar compartilhando ai seu conhecimento
A história na verdade é o seguinte.
No passado, a Meta lançou o Llama, e depois veio o Opaca treinado com 600 doletas e batia o 3.5.
Recentemente apareceu um finetunning de Llama, o Nemotron feito pela NVidia e batia o 4o.
Basicamente o Deepseek é feito em cima do Llama com otimizações iguais à feita pela própria NVidia.
Não precisa de um mega treinamento pra isso. Modelos feitos do zero ou com mais parâmetros como a Meta faz é que custam caro.
Conheci o seu canal a pouco tempo e gostei bastante. Mas fiquei curioso em relação onde você mora que é Holanda, tem algum vídeo seu falando como está por aí, como é sua rotina, como é o custo de vida aí e etç.
Penso em ir pra fora do Brasil e gostaria de saber mais. Desde já agradeço e desejo sucesso a você, fique bem!
nao foi contado ovalor das placas pq logo apos o uso todas foram vendidas como novas em uma promocao no aliexpress
Ótima análise, obrigado pelas atualizações contínuas. Prefiro negociar no mercado de criptomoedas, pois é mais lucrativo do que manter. Ganho $ 6 mil dólares negociando semanalmente, embora eu mal negocie.
Como encontrar um gerente de conta profissional que seja confiável e legítimo? É difícil encontrá-los hoje em dia.
Acredito que você precisa de um especialista designado por uma corretora que negocie para você, administre seu capital profissionalmente e lhe dê retornos semanais do investimento sem taxas extras.
Sem dúvida, o investidor sábio que guia minha jornada financeira é ninguém menos que a estimada Kye Tower.
Sim, a Kye Tower era minha esperança durante o "verão de urso" do ano passado. Cometi tantos erros, mas também aprendi muito com eles e, claro, com a Kye Tower. ELE é minha fonte número um quando se trata de cripto e TA.
UAU!!! Você o conhece também? Eu também sou um beneficiário orgulhoso da plataforma dela. Sou um investidor de longo prazo, comemorando meu portfólio de criptomoedas de $ 345.000. Comecei em abril de 2024 antes da minha aposentadoria com $ 21.300.
Muito massa sua trajetoria cara, espero chegar proximo algum dia!
Para calcular o custo mínimo para rodar 50.000 GPUs NVIDIA H800, precisamos considerar:
1. Quantidade de GPUs por servidor:
O servidor mais denso, como o Supermicro 8U, suporta 10 GPUs H800.
Isso significa que precisaríamos de 5.000 servidores para 50.000 GPUs.
2. Custo por servidor:
Um Supermicro 8U com 10x H800 pode custar cerca de US$ 400.000 (estimado, considerando custo da GPU + servidor).
O custo total para 5.000 servidores seria aproximadamente US$ 2 bilhões.
3. Custo de energia e resfriamento:
Cada GPU H800 consome cerca de 350W.
50.000 GPUs consumiriam 17,5 MW de energia só para as GPUs (sem contar servidores, redes, etc.).
Considerando infraestrutura completa, o consumo poderia chegar a 30-50 MW, exigindo um grande datacenter.
Conclusão
A configuração mais barata para rodar 50.000 GPUs H800 seria:
5.000 servidores Supermicro 8U com 10 GPUs cada.
Custo total estimado: US$ 2 bilhões (só hardware, sem incluir instalações, manutenção e energia).
Infraestrutura elétrica necessária: 30-50 MW.
Se quiser otimizar ainda mais, podemos avaliar outras opções, como servidores com 8 GPUs e comparar custos.
Acho que está faltando considerar um ponto, a China compra muito hardware antigo e revende. Essas placas poderiam ter sido compradas de servidores antigos e depois reaproveitadas. O custo seria muito baixo para montar um cluster ou farm dessas placas recondicionadas.😊
Acho que ninguém esperava o fim da Nvidia, mas uma grande correção das cotação super valorizada, estamos faltando que se a expectativa era investir 500 bilhões tendo como referência o chatgpt para o desenvolvimento de uma IA geral, a DeepSeek veio e deixou claro que proporcionalmente você só precisaria de uns 50 bilhões, considerando que você esta usando chips antigos e que não tem a mesma capacidade que os tops de linha que a Open AI tem acesso.
Estamos falando que tudo que foi especulado em cima de AI nas ações da Nvidia, 90% do crescimento das ações foi baseado em uma necessidade que se provou desnecessária.
Esse video foi maravilhoso, cheio de reviravolta vei kkkkkkkkk, toda hora um questionamento e uma descoberta
Obrigado por compartilhar tanto conhecimento. Grande abraço.
Com este novo acontecimento, podemos vislumbrar o Futuro das IA's:
Todo mundo vai ter a sua em casa e quem souber desenvolver IA's que consumam menos energia e entregue mais resultados, vencerá.
Acabou o sonho das empresas usaram IA's para assustar as pessoas, se com batatas o DeepSeek foi criado, logo rodar isso no bichinho virtual dos anos 90 vai ser essencial.
Meu amigo, o que faz ás AIs acontecer, são DEVs de verdade e aqueles que semprem vão tentarem criar com o menor custo benéficio possível.
- A China demostrou isso, e muito bem. 😊
13:45 Lucas Montano virou o João Kleber da BolhaDev kkkkkkkk
De toda maneira o que rolou é que a China pegou todo um modelo de negócio baseado em "aluguel" e falou: tó, socializamos 🐼🫶
Ver fanboy de americano sem saber o que dizer é uma coisa linda!!!! China neles!!!!
Pq n "Brasil neles?"
Tem muita gente puxando o hype da Deepseek só porque é anti americano. A própria NVidia tinha criado o Nemotron barato e eficiente e não gerou esse hype.
e quem disse que o acara é fanboy de americano, ele ficou triste porque a ação que ele comprou caiu. deixa de ser lobotomizado por propagando oriental.
@@Matheuslyard pq Brasileiro tá muito ocupado lambendo os chineses e os americano, não tá vendo ai
Todo ano esses China falam que descobriram a roda.
Até hoje estamos esperando a bateria de sal .
São 50k NVidia. Mas essas placas devem rodar em um servidor , não é? Coloca mais o custo dos servidores, luz, infra de data center, etc.
Ótimo questionamento, está parecido com a construção dos SR-71 por uma empresa americana.
Como a maioria das coisas que aparece na internet....É bom esperar umas 96 horas pra saber o que realmente é. Principalmente por essa questão de IA que vai ser palco de disputa geopolítica.
O anúncio ter saído logo depois da posse do Trump foi no minimo 'suspeito'. Tomara que mais modelos apareçam e joguem o preço de implementação lá embaixo, ainda mais sendo opensource.
Lucas, só para vc ter uma ideia o Google tem uns 300 VPs.
Um L5 já está nesse valor aí, depois de L6 a coisa dispara de forma exponencial, o Sundar só em 2023 pegou 200 mega em stocks.
E sobre os datacenters, quase 50% do custo é energia, então a maior parte da grana que vai bancar realmente é o governo.
Geral pirando com o DeepSeek R1, e o Lucas Montano aqui, tentando destrinchar a parada, pra ver se o que os caras falaram bate com a realidade. Eu espero qui eles realmente tenham encontrado uma forma melhor e mais barata pra fazer o treinamento de IA.
Eu ouvi pessoas falando que a Singapura tava fornecendo os chips usados pelos chineses e comprando, pra isso, esses chips dos Estados Unidos, permitindo que a China pudesse burlar de forma... lícita?!... a lei de controle de exportação.
Uma coisa é certa, chineses gastaram muito menos com o treino de seu modelo do que essas big pagam a seus CEOs papudos. O caso é que eles gastaram 5kk no treino do modelo completo enquanto a OpenIA gastou 2.5k só pra fazer um teste de benchmark. Por isso o mercado reagiu, o dinheiro das bigtechs americanas está sendo mal gerido. Você não vive de dividendos com uma carteira de ação, sardinha, você monta um portfólio decente e trabalha com ele, junta uma grana bacana em ativos, pega empréstimo deixando isso como garantia, faz esse dinheiro render em outro negócio e assim vai.
Pelo que vi gente comentando, a que roda local, é um modelo 31b e não o 671b que necessitaria de muitos TB de memória ram e vram
Pessoal tá muito emocionado e não tá prestando atenção nesses detalhes
Muitos tb de ram? Tirou do rabo neh, uma pesquisa no google vc ve os caras rodando o modelo full e conseguindo 30-40 T/s
@@bebumescuro e você não sabe diferença de taxa de processamento e armazenamento né?
o modelo 671b é 430GB
Eu ainda não comento sobre I.A por diversos fatores.
Primeiramente, ela é relativamente recente e preciso compreender se estamos falando de estudo supervisionado ou não, sem falar se é com reforço ou sem.
Outro fator é processo procedural e sua arquitetura na qual não sei como foi implementado. Estou bem no escuro e prefiro não passar algo sem lógica ou sem base comprovada.
Sobre custo poderias dividir em dois: Empresa e Usuários, pois são diferentes, não?
Por fim, lembro-me bem da realidade aumentada/VR e era bem comentada, mas atualmente quase não tanto citada. Por isso que preciso ter mais dados e confirmação para uma análise correta.
Essa questão de Realidade Aumentada e se a IA sera o mesmo fiasco já foi superada. As pessoas já estão usando a IA de forma rentável todos os dias. Já houve a adoção por parte dos usuarios. Há um mercado para as IA e só vai crescer. O que fica em duvida é até quanto pode crescer. Então pode se comparar com a bolhas das "ponto com" do final dos anos 90. Há esse risco com esse boom das IAs. Mesmo assim, as IAs vão revolucionar o nosso mundo igual a internet fez. A geração beta não vai nem saber o que é digitar num computador, só se visitar um museu.
@rogeriobroncher De fato, mas é no contexto de "Algo novo e todos estão fazendo notícias "surreais", preciso esperar para ter os dados corretos e empíricos". Enfim, acho A.I muito mais promissora mesmo.
@@mariohenrique8982 com certeza que o apressado come cru.
Sei la, achei o video estranho... pode ser que o as ações da NVIDIA ter caido mexeu um pouco com o lucas.
Essa declaração desse Alexander esbarra na publicação do Paper que eles fizeram em dezembro, dizendo como fizeram o treinamento usando menos placas da NVidia e, na disponibilidade Opensource do DeepSeek. Qualquer um com 6 milhões de dólares pode replicar o que fizeram. Outros especialistas da área que leram o Paper dizem que acreditam no "milagre" da DeepSeek. Eles adotaram uma outra abordagem.
Como é que os chineses vão competir com o Lucas? O cara no próprio quarto foi capaz de desvendar o segredo sujo da Deepseek que nem as big techs americanas até agora conseguiram. 🤣
Daqui a pouco vai mudar para “Aqui é o Lucas Montano do canal Sam Altman and Elon Musk’s fan club”
Kkkkkkkkk... o market levando quase tudo
mano o cara faz conta de multiplicar usando o GPT, como que pode isso?????
Caraca... que sinofobia. Comparou-se o custo de treinamento do GPT e do DeepSeek, é só isso. No GPT foram $ 100M para o treinamento, sem contar o custo das placas, no DeepSeek foi $ 5M para o treinamento, sem contar o custo das placas. Qual a dificuldade em entender isso?
Não é tão difícil assim de compreender.
Beira a negação da realidade.
essa é aquela da compra de iris do olho das pessoas??
A Fundação Geolíngua está à procura de 2 atores para representar 1 Advogado e 1 Jornalista, a sério! - É uma espécie de AA (Advogado Artificial) e JA (Jornalista Artificial). - Para saber mais, entre em contacto.
Ora ora, mas não seria o papai estado novamente intervindo na economia.
fui testar agora, o site diz que caiu por causa de ataques maliciosos, é triste
N é verdade, eles gastaram mais.
Será por isso que o Warren Buffett começou a vender suas ações dessas empresas? 🤔
segundo noticias "DeepSeek teria usado chips NVIDIA H800 para treinar seu modelo R1 de IA, mas que agora a inferência é computada por placas Ascend 910C, da Huawei", teremos concorrencia no mercado amigos
Você acha que a AI vai tirar os empregos das pessoas?
Uma AI acabou de tirar o emprego de outra! I quit!
Acho que ja esta inluido o custo de energia eletrica, a depreciação das placas e o custo de manutenção no custo total por hora das placas de video.
Dito isso todo o argumento do Fábio Akita sobre IA's caiu por terra, ele acreditava nas limitações de hardware e que isso ia brecar o desenvolvimento das IA's e explodir uma bolha. Akita errou, as IA's logo estarão rodando em hardware de celulares.
alguem percebeu que o hino da urss tava tocando quando o china falou?
sim, deu até sono..
só de ver o estado unidos cair meu dia fica feliz
Enquanto alguns queriam que o brasil estivesse no mesmo estado que os EUA. Outros querem apenas trocar de dono... lamentável!
Isso tudo me lembrou da serie "Silicon Valey" da MAX que um jovem cria um algoritmo que f$@# com o padrão da epoca! Isso é muito previsivel de acontecer o que leva a pensar que esses caras como gestores de negocio são uma negação. A tecnologia sempre pode melhorar e ser mais eficiente e acabar com seu sonho de lucrar em cima de otarios.
Lucas Montano, Que diacho de música é essa ?
Seria o Deepseek IA o Doom das IAs? Hoje é o MacMini, amanhã é uma geladeira... o futuro é imprevisível hahahaha
A era dos robôs dominando o mundo esta mais proxima do eu imaginava.
Outra parada que embaça tudo é o modelo que é citado, parece que é o Deepsek R1 que é o fodão, porém, eles tem várias versões do negócio. No doc que tu abriu tem falando do V3.
Tu manda os teus dados pros EUA. e não reclama, mandar pra china não vai diferenciar muito.
Vai lá na China e fala mal do ditador, para tu ver se é a mesma coisa.
ai você faz o download e roda isso na sua casa, LOGO TUDO MUDA..seu jumentin
Claro que vai, eu consigo acionar a openai na justiça americana e ganhar, tente o mesmo na china
@@Gustavotrestento1 quem ja fez isso e conseguiu?
@@angelolemon
Existem dezenas de casos de cidadãos comuns que entraram na justiça americana contra grandes empresas e venceram. Apenas alguns deles aqui envolvendo processo por questões de privacidade de dados:
Grupos de pessoas que entraram com processo e ganharam conta o Facebook em 2020 (em Illinois), contra o Equifax em 2017 (em Massachusetts), contra o Google em 2021 (na Califórnia), contra o Zoom em 2020 (em Nova York), contra a T-Mobile em 2021 (em Washington).
As placas são vendidas do próprio US, um dos grandes fornecedores de placas nvidia para a China, placas q serão refurbished pelos chineses, é a Tesla!
P.D:
- A NVIDIA está contrabandeando chips. 😂😂
O principal fator da qualidade desse modelo não é nem o tamanho do modelo nem o treinamento, mas sim, o preparo dos dados. Quem trabalha com dados sabe que investir em qualidade de dados vale muito mais a pena que ficar horas fazendo tuning de parâmetros. As estratégias de pré processamento de dados e os dados processados, em si, não foram disponibilizados. Deve ter sido muito custoso tanto o pré processamento quando o reinforcement learning. Por isso eles estão tranquilos em abrir todo o modelo. Também por isso, é difícil imaginar que consigamos fazer algo parecido com infra estrutura nacional.
na verdade da pra fazer"facilmente" é só o governo querer, isso é uma longa história, mas brasileiros desenvolveram vm's no fim dos anos 80 em unix...
mas estamos no brasil, aonde se supervaloriza tudo o que é de fora não é mesmo ?
E fora que eles tem uma vantagem de ter um número colossal de dados da Internet chinesa em suas mãos. Isso dá possibilidade deles treinarem o modelo com muito mais dados únicos
Tem que entender que o CUSTO de uma IA sempre é relacionado ao TEMPO de GPU de treinamento, e também o custo computacional de INFERÊNCIA. Custo de máquina, GPU, energia elétrica e espaço físico (aluguel de imóvel) nunca entra nessa conta. Por isso que a OpenIA tomou essa rasteira toda. De onde vem as GPUs não interessa muito.
Será que se eu comprar uma H100 dessa eu consigo rodar Crysis no ultra?
Bem Brasileiro ,torcendo pela desgraca dos outros por isso somos esse pais de merda onde queremos ver a derrota dis outros e nao vitoria
A questão é que você consegue rodar isso em qualquer computador.
Então se o chip foi Nvidia ou não, eles demonstraram que roda em qualquer chip com eficiência.
Existe o rumor que eles estao usando GPU Huawei.
a chance deles terem desenvolvido os próprios chips ao invés de estar usando as H100 é muito maior do q eles estarem usando as placas da NVIDIA, a galera subestima demais os chineses, eles tao muito mais na nossa frente do q a gente imagina...
Comentei antes do final do video, mas mantenho a posição, logo eles lançam a própria gpu pra IA
Não desenvolveram. Nem as grandes americanas conseguem competir com a NVidia.
A China não faz processador bom. Os americanos nunca deixaram as empresas deles construírem lá pra evitar cópias como fizeram com celulares e outros produtos.
@@brunogoncalves3551 e o modelo é opensource, logo é possível alguém replicar, provar se é verdade ou não
nah
Eu li num forum na deepweb que a aplicação vai rastrear dados pessoais dos clientes sem a sua intençãoe vender no mercado ..
Eles falaram que foi alugado, e que usam placas velhas que eram usadas em criptos
A maior parte da produção de produtos de alto valor agregado foi movida para a China no decorrer de várias décadas devido ao baixo custo.
O mundo inteiro (incluindo EUA) entregou o ouro aos chineses e agora se perguntam onde eles conseguem os chips 😂😂😂
Tá literalmente escrito no paper que a deepseek utilizou 2048 H800...
Caraca, o editou amassou nessa trilha sonora, boa d+ ❤
Aliás, alguém sabe que música é essa?
Me lembra Zelda.
"Viver de renda passiva é coisa de passivo" Santos, Raiam.
Lucas, faz vídeos com testes com o DeepSeek
Custou barato mas não estão dando conta de todos os usuários, sempre dá servidor ocupado se você tenta usar o R1
Certeza que foi uma IA que editou esse vídeo e inseriu essa música de fundo KKKKKKKKK
Inclusive, crianças, HIDRATEM-SE!
o hype da Nasdaq é que nem bitcoin, qualquer coisa quebra muita gente, mas dessa vez eu vou gostar, pq vai lascar aquele tipo de administrador que se fosse por ele só tinha ele na empresa
Se Deus quiser daqui uns dias estaremos programando drones pra limpar campos de batalha 🙏
Agradeça os yankes....
A musica de fundo, achei que era Castlevania. ^~^
O Mostra o Mickey me quebrou muito 🤣🤣🤣🤣🤣🤣🤣
já me conformei que não vou me aposentar não pelo estado, quero ser capaz de realizar meu trabalho até o final da minha vida, mas claro quando for mais velho quero trabalhar em projetos só por hobby e já estar muito bem financeiramente.
Não são 500 mi, são 500 bilhões!
e se eles apenas locaram a cloud e treinaram?
Tem muita política envolvida, tem muito poder militar envolvido, tem muito marketing envolvido, não caiam em qualquer coisa criada na guerra comercial entre China e EUA
Quão barato fica produzir algo através de espionagem?
Não pergunte ao DeepSeek da China: O que foi o massacre na praça da paz celestial de 1989?
Tente fazer o chat gpt falar pra vc sobre David Faber... entre outras coisas...
Dica legal: O DeepSeek retorna mas depois do retorno ele "corta" ou seja a resposta ta lá, e no open source tu pega sem esse corte.
Porém o ChatGPT é treinado já com os cortes dele, e ele força pra dizer que não tem.
Já o DeepSeek se tu conversar sobre essa censura ele até explica dela pra vc.
Mas a gente por algum motivo é fissurado nisso em relação a china, e passa despercebido esses detalhes. rs
Usando aqui Vue, Kotlin, Spring e agora o DeepSeek pra completar o combo, e com nenhuma saudade de voltar pra mão dessas big techs.
"Dev" mas ainda não sabe o que Open Source realmente significa pra humanidade. Aposto que é usuário Windows ou pior, Mac. Compra Nvidia e se acha esperto enquanto o Software ativo mais valioso do mundo tbm é um Open Source. Depois não sabe pq a AI vai tirar o emprego dessas pessoas.
O propósito da música de fundo foi passar uma experiência a la Hobit/Senhor dos Anais?
Os estados unidos criam cada vez mais produtos caros e desnecessarios, acho que a china deu uma bela lição de como o futuro deve ser, menos custo, mais tecnologia avançada
Se for chorar manda áudio. Se prestou a ficar 15 minutos só debochando k, triste.
Mas
estamos falando da china, se bobear eles fizeram uma versão cópia do H800. Por isso eles tem tantos chipes, eles mesmo produziram. Supostamente
Os investidores ja estavam loucos para realizar um pouco desse lucro, ja que o grafico estava extremamente esticado, ai o primeiro vendeu e o efeito manada foi junto. Agora que ja consolidaram os lucros estão esperando pra ver o que vai acontecer.
Será que vai ter IA soldadora ?
Lucas Montano, sua postura é ruim assim mesmo ou vc tem um corpo tão forte que te deixa inclinado pra frente?