Добродоктор: Telegram-бот для записи на прием к врачу!

Тест на МУЗЫКАЛЬНУЮ ОДАРЕННОСТЬ: 100% точный результат! Проверьте себя

Transformers (how LLMs work) explained visually | DL5

«Машина з такою швидкістю летіла, і такий гул, я думала, що це ракета летить» #shortsvideo #дтп

消防避险训练，消防员用“水盾”逼退烈火！这是训练，也是他们可能面对的日常。致敬！#熱門 #中国

ПОДРАЛСЯ С БРАТОМ (Смешное видео, юмор, приколы, поржать )

Насколько хорошо GPT-4o решает математические задачи?

AI Experience Exchange

Переглядів 1 004

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 28 лис 2024

КОМЕНТАРІ • 14

@kvoloshenko 5 місяців тому
Все ссылки здесь: t.me/AiExp01/95
@cyberbiosecurity 5 місяців тому ⁺¹
я отчетливо помню времена лет 12 назад когда я не мог решить задачи 1.001, 2.001 из Сканави даже с 3й попытки, когда я начинал осваивать школьную математику для сдачи на 100 баллов. у меня ушло месяца 2 чтобы научиться решать подобные алгебраические задачи из Сканави без ошибок.
...
своё лицо через 12 лет (2036й год) глядя на возможности ИИ представили?
@avatarcybertronics2584 5 місяців тому ⁺²
Ну то есть вы подгоняли пока на i-й раз она не даст правильный ответ, который вы знаете. Вот важен % правильных решений на одном типе задач. Для этого есть куча популярных датасетов типа GSM8k, MATH и по ним есть метрики известных моделей, в том числе GPT4, но не омни новой тк она как раз новая и пока бенчмарка нет
@kvoloshenko 5 місяців тому ⁺¹
Допустим есть задача с неизвестным ответом, как быть уверенным, что модель решила ее верно? Выбрать ответ, который выпадает чаще?
@avatarcybertronics2584 5 місяців тому
@@kvoloshenko Никак. LLM вообще в целом не предназначены для решения мат. задачи и инженерии, а то, что мы люди даем им эти задачи - это вопрос к нам. Поэтому тут нет и какого-то определенного правила. Ну максимум вы можете делать 5 генераций и среди них собрать статистику было ли там правильное решение или нет. Это чуть лучше чем подгонка.
@kvoloshenko 5 місяців тому
@@avatarcybertronics2584 ну если было уравнение, то можно подставить полученные корни и вычислить...
@igormel5137 5 місяців тому ⁺²
Я думаю у вас разные ответы из за показателя температуры. При высокой температуре он не всегда берет самый лучший вариант, а наоборот стремится к разнообразным ответам.
@kvoloshenko 5 місяців тому ⁺¹
Да, только температура там в коде стоит на нуле
@igormel5137 5 місяців тому
@@kvoloshenko Странно, при нуле ответ должен быть строго детерменирован. Что же (( значит не все так как описывали
@sergeisotnik 5 місяців тому
@@igormel5137 Нет, не детерменирован даже при нулевой температуре. Там еще seed нужно задавать.
@Free-pp8mr 5 місяців тому
Теперь не только в грузинских , но и американских школах 2 * 2 равно не 4, а «так сэм восэм» 😂
@kvoloshenko 5 місяців тому
Определенно всё движется в это направлении, начиная с первых калькуляторов в школе на уроке
@densr857 2 місяці тому
Хреново решает простую задачу: Разложение числа на сумму степеней. Всё дальше полный абзац, разлодение делает, но после проверки на калькуляторе оказалось что там другое число получается в сумме.
@kvoloshenko 2 місяці тому
А вам уже доступна новая модель о1? Если да, то хотелось бы повторить все тоже самое но с ней, т.к. в рекламе кричат что она заточена в т.ч. и на математические задачи….

Наступне

Автоматичне відтворення

Добродоктор: Telegram-бот для записи на прием к врачу!

Добродоктор: Telegram-бот для записи на прием к врачу!

Тест на МУЗЫКАЛЬНУЮ ОДАРЕННОСТЬ: 100% точный результат! Проверьте себя

Тест на МУЗЫКАЛЬНУЮ ОДАРЕННОСТЬ: 100% точный результат! Проверьте себя

Transformers (how LLMs work) explained visually | DL5

Transformers (how LLMs work) explained visually | DL5

«Машина з такою швидкістю летіла, і такий гул, я думала, що це ракета летить» #shortsvideo #дтп

«Машина з такою швидкістю летіла, і такий гул, я думала, що це ракета летить» #shortsvideo #дтп

消防避险训练，消防员用“水盾”逼退烈火！这是训练，也是他们可能面对的日常。致敬！#熱門 #中国

消防避险训练，消防员用“水盾”逼退烈火！这是训练，也是他们可能面对的日常。致敬！#熱門 #中国

ПОДРАЛСЯ С БРАТОМ (Смешное видео, юмор, приколы, поржать )

ПОДРАЛСЯ С БРАТОМ (Смешное видео, юмор, приколы, поржать )

Players push long pins through a cardboard box attempting to pop the balloon!

Players push long pins through a cardboard box attempting to pop the balloon!

C++ Разработчик учит Python

C++ Разработчик учит Python

Terence Tao (IQ 220): Mathematics in the Age of AI

Terence Tao (IQ 220): Mathematics in the Age of AI

Локальный RAG (Retrieval-Augmented Generation) и Агенты

Локальный RAG (Retrieval-Augmented Generation) и Агенты

Why is Python 150X slower than C?

Why is Python 150X slower than C?

Как войти в топ 1% по использованию ChatGPT и других ИИ-инструментов? - Руслан Сыздыков, Higgsfield

Как войти в топ 1% по использованию ChatGPT и других ИИ-инструментов? - Руслан Сыздыков, Higgsfield

GPT-4o против GPT-4 : Стоит Ли Переплачивать?

GPT-4o против GPT-4 : Стоит Ли Переплачивать?

🧪🧪🧪🧪Как увидеть гиперпространство (4-е измерение)

🧪🧪🧪🧪Как увидеть гиперпространство (4-е измерение)

Attention in transformers, visually explained | DL6

Attention in transformers, visually explained | DL6

Савватеев решает ещё один параметр ЕГЭ

Савватеев решает ещё один параметр ЕГЭ

А я думаю что за звук такой знакомый? 😂😂😂

А я думаю что за звук такой знакомый? 😂😂😂

Встреча с ворами

Встреча с ворами

Chico, Qatoshi & paashee - Акація

Chico, Qatoshi & paashee - Акація

When Cucumbers Meet PVC Pipe The Results Are Wild! 🤭

When Cucumbers Meet PVC Pipe The Results Are Wild! 🤭

Do you love Blackpink?🖤🩷

Do you love Blackpink?🖤🩷

РУЧКА (смешное видео, юмор, приколы, поржать, вайны)

РУЧКА (смешное видео, юмор, приколы, поржать, вайны)

coco在求救？ #小丑 #天使 #shorts

coco在求救？ #小丑 #天使 #shorts

Mix the spurious with the genuine #joker #cosplay#Harriet Quinn

Mix the spurious with the genuine #joker #cosplay#Harriet Quinn