Все ИИ в одном месте + API для GPT-4o без VPN👇 🔗 gptunnel.ru/?ref=adaptera 🔸 Промо: ADAPTERA10 Внедрение ИИ в ваш бизнес | Адаптера | Авито + GPT👇 🔗 adaptera.ru/ Бусти. Специальный код - "ИИ управляет ОС" 👇 🔗boosty.to/adaptera/posts/0a3f187f-c351-4539-a8e9-8ea0daf40b93?share=post_link
Ты смог то что могут только сотрудники openai и богатые люди с доступом к исходникам. Ты большой молодец, я из за таких работ хочу научится программировать и буду учиться
@@alhimik28 ответ голосом Джарвиса это возможно, но тут увеличивается ценник. Следующая версия будет из себя представлять РОЙ из ИИ, что само по себе увеличит количество траты токенов, а генерация голоса может прибавить стоимость, но и ценность в глазах пользователей. В общем голос Джарвиса я добавлю, если твой коммент будет самый залайканым 😁
@@Marat_Mazitov я пробую работать с Yandex spechkit. Прогоняю тесты на пунктуацию на локальной миненейронке, потом зафигачиваю с +ками уже в yandex, хочу попробовать что-то придумать с интонацией, вроде яндекс что-то там мутит с этим. Ну и как результат я это все не в колонки отправляю а в Asterisk. Звонишь по телефону, тебе отвечает условный Джарвис, говоришь кодовое слово и открывается режим управления системами. Как то пока так
Делал такое-же во времена 3.5 и 4-0314, на самом деле 4 знает очень много, у меня был эксперимент на виртуалке, был вирус шифровальщик (очень известный) его задача была его удалить, он смог его удалить + нашел ссылку с гитхаба на файл который расшифровал все файлы от него. Была еще одна задача оптимизировать комп, он смог без потерь увеличить производительность компа в тестах и уменьшить потребление винды, по логам он там поменял что-то в реестре поотрубал кортану и подобный мусор. Еще есть одна проблема у всех подобных это `открой папку и закрой папку`, он это воспринимает как открыть папку и закрыть explorer.exe (весь интерфейс винды), если эту ошибку не проработать на уровне кода она будет всегда вылазить.
Майкрософт многое сделала, но только в своих лабораториях. Ведь кроме разработки программы, нужно же её ещё упаковать в красивую обёртку, продумать монетизацию и прочее. Поэтому корпорации медленные и бюрократичные...
Если дать задание - накачай торрентов или музыки в таком-то стиле 200 штук и напиши отчет . Когда будут писать в мессенджеры по такими -то вопросам раз в полчаса проверяй и отвечай то-то-то.Запускай visual студио и устанавливай библиотеки и загружай готовый код по фтп. Найди на таком-то сайте автомобилей бу такую-то машину по год-цена цвет тогда было бы супер-пупер.
@@Marat_Mazitov работать с файлами, писать код в конкретных программах - вот это интересно... Пусть нейросеть откроет UE5 и напишет на C++ какую-то логику от простой к сложной.
Брат. Видос видосом, но это просто бомбовая идея Если продолжить работу и довести это до работы с голосом или, хотя-бы, в первых итерациях до работы простым текстом в удобном инпуте, который будет вызываться комбинацией клавиш, то это будет невероятно полезная и популярная прога. У меня часто возникают проблемы с поиском какой-то настройки в Винде, или поиском чего-либо в проводнике, например. И, уверен, далеко не один я такой. Такой умный помощник, который по текстовому или, тем более, по голосовому описанию сможет помочь найти или сделать что угодно в ПК, будет невероятно полезным. Реально советую задуматься о продолжении работы над проектом.
@Marat_Mazitov Майнер - это вирус, который использует ресурсы компьютера для добычи криптовалюты без ведома пользователя. Причем вирус очень умный. Ну, прежде чем делать выводы, вбейте в браузере запрос «Как удалить Майнер», если браузер закроется сам, то у меня к вам плохие новости... Так как эту заразу сложно удалить антивирусами, причем их ещё надо умудриться скачать до того момента, как он закроет вам браузер, грубо говоря, по большей части нужно переустановить Винду, в противном случае из-за постоянной нагрузки ваше железо быстрее выйдет из строя. К слову, теоретически можно посмотреть, как нейросеть попытается его удалить.
Идея хорошая, а реализация так себе. Ну и презентация не очень. Зачем мне знать сколько у меня оперативки, какая видео карта, процессор… «это прям важные данные которые меняются каждый день и очень нужны в работе». 1. Надо прикрутить голосовое управление. 2. Скомпилировать, там столько библиотек надо ставить, что разобраться сможет только тот кому это не надо… 3. Ну и подумать над презентацией. Вместо создать 10 папок, должно быть (голосом): «открой ворд: напиши …., открой хром и поищи, прочитай мне, вот это вставь в ворд, сохрани, теперь зайти на почту и отправь это туда»
@@danilapav9551 безусловно, именно это и сидит в голове у меня. В течение месяца планирую сделать конфетку. Основная идея видоса показать первые шаги выхода языковых моделей за пределы чата.
@ChyppitauThree бесплатно это опен сорс. А с ним без авторских прав автору тяжело будет, а авторские права стоят тоже прилично. Хотя исходники на бусти, автор гений продает апишку грубо говоря такое. Хотя реализовать что реализовал автор это очень легко, по сути насколько я понимаю привязал айпи к своему коду и немного бэш. А так оправдываю автора "продажей" кода тем что он начинающий разработчик и это его пэт проект и любая мизерная мотивация (деньги) помогает ему развиться и стать совершенным разработчикам, кто знает возможно он будущий Линус Товальдс, а может и человек который превзойдет его. Коротко автор продолжай °^° полными мешками золота как у Леприкона и карманами набитыми счастьем))
@IliaAbashvili Все верно! Я решил срубить немного капусты на вау эффекте. Почему? Я тоже люблю покушать😋 В посте на бусти написано, что все купившие этот скрипт, в дальнейшем на почту получат вторую версию бесплатно.
Очень интересно вышло. Только вопрос, как gpt4o, имеет информацию о изображении на экране? Да, он способен видеть все что на экране, но как это реализовано? Неужели он видит покадровое изображение экрана? Это же слишком много запросов API. Или, он имеет текстовое описание происходящего на экране?
Очень здорово! Пробовал сам подобное сделать на C#, но большой проблемой оказалось точное определение координат обектов (ИИ просто их не знает, пришлось обходными путями делать). Интересно посмореть как у тебя рисует в paint, это очень удивило. А еще час назад смотрел новость, что Claude только что выпустили как раз подобную штуку для управления компом, думаю если они этим занялись, то доведут до ума. Спасибо за обзор! Единственное не увидел многосложных запросов, для меня как раз это еще одну серьезную проблему вызвало - он часто в цикл уходил из ряда одинаковых действий, если они не были верными.
1. Возможно ли выдавать запрос на управление веб-сайтами или приложениями? Например попросить ответить кому-то в телеграмме. 2. Возможно ли выдавать многоэтапные задачи? Например подготовить бизнес план, где нужно сначала проанализировать аудиорию, потом составить гипотезы. потом проверить конкурентов и т.д
@@ilnaritto текущая версия нет, однако я планирую сделать Рой из языковых моделей. И вместе думаю они смогут реализовать первый пункт, а второй пункт нет. Но я в любой случае буду новую версию тестировать на том что напишут в комментариях
Епт вот что должно быть в кнопке выполнить, а то в интернете приходится искать как что открыть в самом компе, хорошо бы ещё голосом)) будем ждать более сложных команд))
по логике сможет так как у него знания всего инета, но чтобы например запустить программу на ассемблере то чату гпт придется по страдать если вообще получиться
Єтот скрипт может зайти в фейсбук и сделать пост с картинкой, с видео и с комментом ? И может он зайти і визуально увидеть на картинке, на чужом сайте например погоду цельсии в конкретном городе, чтоб не смотреть HTML? 😁 И может он перетащить папку зажав курсором, медленно не отпуская держать папку в воздухе и ждать команду, чтоб продолжить операцию с перетаскиванием папки в другое место ?)
Я думаю, что в Windows 12 не будет привычных панели управления, настроек, проводника, меню "пуск" и т.п., а управление компьютером будет осуществляться исключительно через Copilot при помощи текстовых команд и голосового управления
@@РусланКоролёв-н9о потенциал у демо Клауд 3.5 очень хороший, однако решение представленное если упаковать. exe для "стариков". 60+ Самое то. Где почта? Где эни деск? Как изменить звук и тд это может уже сейчас. В процессе 2 версии, возможно локально будет работать, если у человека будет 8гб.
ИИ: привет чувак! Я: привет ИИ. ИИ: чувак,сегодня будешь скуфом,и будешь спать весь день. А я за тебя и работу сделаю,и продукты закажу,и виртуальную шлюху закажу... и тоже сам ею за тебя полюбуюсь. А ты отдыхай. П.С. Ах да,и зарплату будут получать я,и тратить буду её я! ____ Я не удивлюсь,если ИИ пойдёт по стопам к.ф. "Терминатор" . Всё к этому и идёт. Вспомним Айзека Азмиова с его Хороводом. И что произошло спустя почти сто лет? Азимов был гением будущего.
Очень интересно. Было бы круто, если бы она могла прям в лбом сотые изменения вносить. Условно - собери сцену в UE из доступных ассетов в проекте. Прям новый уровень.
офигенно, подключить к этому голосовую модель и уменьшить зарежки выполнения команды. Доработать бы это что бы можно было удобно пользоваться) И думаю это стало бы популярным. однозначно за этим будущее в windows. Но пока решения от майкрософт нет
Теоретически, такое прикрутить через консоль несложно: в интернете полно команд для решения тех или иных задач. Надо только прикрутить препроцессор текста, который будет формировать запрос на сочинение команд: ты ему говоришь «Скопируй этот файл туда-то», а он формирует промпт типа «Составь команду для Powershell, котора скопирует этот файл в назначение туда-то». Хотя, при старте сессии, ему можно ввести кучу вводных данных как надо отвечать.
А если попросить его в том же пейнте нарисовать что то очень детализированное как фотографию, он сможет?) было б интересно на это посмотреть ка4 из пикселей вырисовывается фото и
Есть идея для улучшения программы я сам планировал такое сделать и у меня все получалось но ключ API из-за санкций у OpenAI нельзя взять вот щас узнал как) Но а что по поводу улучшения советую тебе создать отдельное окно на подобии программы с каким-нибудь дизайном и чтобы выглядело все отлично стоит изменить немного код программы чтобы ИИ сам понимал основные компоненты твоей запланированной задачи, хочу узнать сможет ли такой ИИ поиграть например в браузерные игры?)
@@ВладимирДемчук-ы1ы интересная задумка 👍. Я тоже считаю что нужно увеличивать контекст для ИИ, тогда будет сверхперсонализированный ответ, решение или действие от языковой модели.
Неплохо. Как для школьника. Может со временем достигнете таких успехов как у меня. Я вот сейчас этот текст не печатаю а говорю прямо в комментарии UA-cam. Аналогично говорю команды Причём более полезные чем те что вы показали в примере. Например могу искать внутри текста любого документа Не перебирая 1.000 документов То есть моментально искать внутри документа без его открытия. И для этого даже особо интеллект не нужен. Пользуюсь простенькой утилитой Laitis Столетней давности. Там можно настроить голосовые команды
@@Marat_Mazitov Соглашусь. Вот только за что-то новое постоянно выдают что-то старое. Причём люди которые этим профессионально занимаются. Иногда любители делают намного больше. Вот только их никто не пиарит и видео им делать некогда. А потом через лет 10 До этого доходит профессионалы и вытягивают кролика из шляпы Остальные считают это чудом.
Круто а можно ли портировать gpt3 turbo? как ты привязал его у драйверам ОС тоесть ты я так понял дал доступ к драйверам и консоли и он по твое просьбе генерирует нужные команды ты программно вычленяешь эту команду и вставляешь в консоль ну ля создания папок понятно а вот как с мышкой быть, тоесть он передает координаты курсора в драйвер хм а как ты его спрашиваешь напиши мне массив координат для перемещения курсора из координаты "текущей ты отправляешь" до координаты кнопки пуск и выполни команду "ввод"? Есть ли подробный гайд на это все?)
Ничего страшного не произойдёт, если поставить перед GPT конкретную задачу. Если цель будет понятной, он будет выполнять её до конца. В целом идея хорошая. Возможно, GPT сможет даже менять системные файлы, но лучше этого не делать. :)
Для тех, кто пользуется тут линуксом, есть готовый вариант Interpreter или платный вариант Warp terminal. Пользуйтесь на здоровье, если вдруг у кого есть трудности с этой системой ;)
Какой-то шаг на 30 лет назад ... Почему на 30? Потому что 25 лет назад, у меня стояла прога, которая позволяла голосом управлять компом. Позволяла улучшать её функционал ... Например в РедАлерте по голосовой команде заказывала постройку юнитов за долю секунды и возвращала меня в точку где я был до этого ... Названия к сожалению уже и не вспомню. Те же папки создавала, разные проги запускала ... А тут минуту писать команду, которую четверть секунды самому сделать? ... Я бы в начале научил распознавать речь и только потом уже всяким остальным фокусам.
Уже отвечал в комментариях. Он выполнит команду форматирования компьютера. Это сможет сделать только LLM от NVIDIA. В идеале 2 подключить и ChatGPT-4o (откажется)и LLM от NVIDIA (выполнит, но потребуется отчистка ответа от лишней информации и решается скриптом) или Mixstral Large. Текущий код написан только для GPT4o
Я б не сказал что это прям круто, всё же Agent.exe приложение, будет лучше, правда прийдёться платить за API Claude 3.5 Sonnet минимум 5$, но это не дорого, особенно за такую фичу.
Вау... Тоже "кодю" на пайтоне, и хотел спроосить почему вместе платного api не юзаешь библиотек g4f? Работает кривовато, но если обработать "исключения" и использовать нужную версию библиотеки то все летает
@@_lLoki_ Компьютером далее назову "машина под управлением операционной системой" позволяет управлять машиной через командную строку. И отвечая на твой вопрос - Да, через командную строку.
@@nn_cheats чисто для начала уничтожить людей 😂, самую лучшую идею, которую я слышал по поводу уничтожения человечества, это предложения Елиезера Юдковского. Есть подкаст на просторах ютуба. Спойлер: Мы даже не успеем понять😅
Чувак, который не умеет выводить системный ярлык "Этот компьютер" на свой Рабочий стол, а вместо этого отправляет ярлык "Компьютер" на рабочий стол из Проводника, учит нас использовать ИИ для управления компьютером! Куда только катится этот мир!
@@АлексейС-ч3г Чувак, который думает, что я кого-то "учил" на видео. Покажи мне, где я это дедал, ЧУВАК! Докопаться до того, как именно у меня настроен рабочий стол 🤦♂️
Почему не бесплатно??? Ладно api ключ достать с официального сайта openai нет надо через gpt tonul потому что тебе заплатили и код даже сам не хочешь давать бесплатно что мне приходится по видео его восстанавливать а потом еще перепрограммировать его на ключ openai БЕСИТ
Антропик дропнул новую модель! 2. Claude теперь работает с компьютером. Не просто пишет код, а прям умеет запускать любые программы, кликать мышкой и делать все, что вы можете сделать за компьютером, но без вас. Пропатчить KDE2 под freeBSD там... Французы тебя опередили.
@@PavelBlokhin-pf7iv об этом никто не говорит, но снять ролик это энергозатратно писец как. Ненавижу при монтаже на себя смотреть, когда туплю, а там бывает часа 3 необработанного видео. В процессе👍
@@Заработокнаверификациях написать код на пайтон он мог уже раньше. Рекомендую посмотреть видео про chatGPT canvas. А что на счет монтажа, то здесь надо четко ставить перед собой цель. как именно происходит монтаж от ИИ. Инструментами / программами для людей или 1 кнопка с промтом. Сделай красиво как у топовых блогеров.
@@Marat_Mazitovпопсмотрел видео про canvas не уверен, что он сможет написать шашки или шахматы онлайн, так как он пишет только 1 HTML файл, но ему еще надо писать websocket для обработки соединений. По поводу монтажа видео, ну например чтобы открывал movavy или adobe и вырезал лишние части видео, музыку вставлял
дать ии управление компьютером это примерно как "умный" домофон. если ты не побрился, он спросит, а не бомж ли ты и не собираешься ли ты ссать в подъезде
блин а у меня бомж видюха gt-730 . хотел сам переобучить ИИ модели но трансформер торч и тенсор не поддерживают мой ГПУ ( потом нашел легкий способ, написал скрипт который имитирует примитивный ИИ , используя модуль difflib . короче скрипт читает джсон файл где указаны команды и соответствующие ответы не ИИ но для небольших задач сойдет. кстати мне еще удалось на ткинтере сделать чат для общения с моделью которая скачана с помощью оллама(сам оллама должен быть запущен)
@@tapikoBlends главное быть в тусовке ИИ, следить за индустрией и понимать что такое языковые модели, квантизация, RAG, векторные базы данных, бенчмарк ИИ. И быть среди первых кто грамотно воспользуется возможностями, которые дает ИИ. Продолжай экспериментиртвать 👍
@@Marat_Mazitov Не плагиат, ошибся словом. Я просто ожидал что будет gpt vision, и он уже будет давать команды типо куда кликнуть и что сделать. А оказалось что тут cmd+webdriver.
Все это я делал в 97 году на едиторе в досЕ и с не большим запасам знаний. тут из нового только названия. Вы на сегодня тока названия придумали но из нового только беспилотные авто это тебе запас на будущее. Ты делаешь то что уже сделано десятки лет назад. И поверь мне последний код который я вписал туда если бы ты знал волосы потерял.
Я верю, что Вы верите в то что вы пишите, однако не совсем понятно что имеете в виду "что здесь сделано 10 лет назад". Смысл видео - показать что LLM это не только обычный чат. Технологии развиваются экспоненциально, а понимание в обществе как это работает линейно. Лично Вас не удивил, а большинство - да.
Да нет, ты не понял, тогда была простая автоматика, скрипты и макросы, а сегодня нейросети. А твой скрипты фоторобот создать смогут? А делать прогноз событий? А разговаривать (притом на любом языке)?
Все ИИ в одном месте + API для GPT-4o без VPN👇
🔗 gptunnel.ru/?ref=adaptera
🔸 Промо: ADAPTERA10
Внедрение ИИ в ваш бизнес | Адаптера | Авито + GPT👇
🔗 adaptera.ru/
Бусти. Специальный код - "ИИ управляет ОС" 👇
🔗boosty.to/adaptera/posts/0a3f187f-c351-4539-a8e9-8ea0daf40b93?share=post_link
Ты смог то что могут только сотрудники openai и богатые люди с доступом к исходникам. Ты большой молодец, я из за таких работ хочу научится программировать и буду учиться
@@Komanda_ZeroWorld_008 Давай там учись программировать💪
@Marat_Mazitov доступ к ключу только для компаний. Ок, при решистрации компании кон не верный приходит на почту. Есть другие варианты?
@VoltRider23 там не только для компаний, можно и на обычного пользователя. Кнопку можно не заметить
@@Marat_Mazitov жму ~ "нет компании" И меня на главную страницу выбрасывает. Ввожу данные, не удается подтвердить почту.
Очень неплохо для начала.Внедри управление компьютера команд голосом!!! И чтоб чат gpt от имени компьютера как Джарвис отвечал тебе...
@@alhimik28 ответ голосом Джарвиса это возможно, но тут увеличивается ценник. Следующая версия будет из себя представлять РОЙ из ИИ, что само по себе увеличит количество траты токенов, а генерация голоса может прибавить стоимость, но и ценность в глазах пользователей. В общем голос Джарвиса я добавлю, если твой коммент будет самый залайканым 😁
Ставлю лайк@@Marat_Mazitov
чисто пародия на хауди?
Да и покажи єто в следующем видео.
@@Marat_Mazitov я пробую работать с Yandex spechkit. Прогоняю тесты на пунктуацию на локальной миненейронке, потом зафигачиваю с +ками уже в yandex, хочу попробовать что-то придумать с интонацией, вроде яндекс что-то там мутит с этим. Ну и как результат я это все не в колонки отправляю а в Asterisk. Звонишь по телефону, тебе отвечает условный Джарвис, говоришь кодовое слово и открывается режим управления системами. Как то пока так
Делал такое-же во времена 3.5 и 4-0314, на самом деле 4 знает очень много, у меня был эксперимент на виртуалке, был вирус шифровальщик (очень известный) его задача была его удалить, он смог его удалить + нашел ссылку с гитхаба на файл который расшифровал все файлы от него. Была еще одна задача оптимизировать комп, он смог без потерь увеличить производительность компа в тестах и уменьшить потребление винды, по логам он там поменял что-то в реестре поотрубал кортану и подобный мусор. Еще есть одна проблема у всех подобных это `открой папку и закрой папку`, он это воспринимает как открыть папку и закрыть explorer.exe (весь интерфейс винды), если эту ошибку не проработать на уровне кода она будет всегда вылазить.
Очень интересная задумка, продолжай в том же духе, ты просто опережаешь время, даже Майкрософт такого не сделала, реально круто.
@@awakened_I такого даже в майбахе нет 😅
Майкрософт многое сделала, но только в своих лабораториях. Ведь кроме разработки программы, нужно же её ещё упаковать в красивую обёртку, продумать монетизацию и прочее. Поэтому корпорации медленные и бюрократичные...
@@Marat_Mazitov а в Тесле? :)) "Как тебе такое Илон Маск?"
ля круто сделал, интересно смотреть было
Если дать задание - накачай торрентов или музыки в таком-то стиле 200 штук и напиши отчет . Когда будут писать в мессенджеры по такими -то вопросам раз в полчаса проверяй и отвечай то-то-то.Запускай visual студио и устанавливай библиотеки и загружай готовый код по фтп. Найди на таком-то сайте автомобилей бу такую-то машину по год-цена цвет тогда было бы супер-пупер.
@@php585 Прогноз AGI к 2027 году.
В течение месяца сделаю апгрейд. То что написано тобой попробую реализовать.
а зачем тогда ты?)
@@Marat_Mazitov круто ))))
@@Marat_Mazitov работать с файлами, писать код в конкретных программах - вот это интересно... Пусть нейросеть откроет UE5 и напишет на C++ какую-то логику от простой к сложной.
Брат. Видос видосом, но это просто бомбовая идея
Если продолжить работу и довести это до работы с голосом или, хотя-бы, в первых итерациях до работы простым текстом в удобном инпуте, который будет вызываться комбинацией клавиш, то это будет невероятно полезная и популярная прога.
У меня часто возникают проблемы с поиском какой-то настройки в Винде, или поиском чего-либо в проводнике, например. И, уверен, далеко не один я такой.
Такой умный помощник, который по текстовому или, тем более, по голосовому описанию сможет помочь найти или сделать что угодно в ПК, будет невероятно полезным.
Реально советую задуматься о продолжении работы над проектом.
У вас работает майнер! Если открыть диспетчер задач, то вы увидите, что нагрузка на процессор резко снижается со 100% до ≈33%
@@trendik5696 охренеть!! А как называется процесс?
@Marat_Mazitov Майнер - это вирус, который использует ресурсы компьютера для добычи криптовалюты без ведома пользователя. Причем вирус очень умный. Ну, прежде чем делать выводы, вбейте в браузере запрос «Как удалить Майнер», если браузер закроется сам, то у меня к вам плохие новости... Так как эту заразу сложно удалить антивирусами, причем их ещё надо умудриться скачать до того момента, как он закроет вам браузер, грубо говоря, по большей части нужно переустановить Винду, в противном случае из-за постоянной нагрузки ваше железо быстрее выйдет из строя. К слову, теоретически можно посмотреть, как нейросеть попытается его удалить.
Все программы пытаются запуститься как можно быстрее, и диспетчер задач не исключение.
Интересно))
Да, здорово, уже пару раз были мысли, что будет полезно учить аи, обучение и внедрять в код.
Идея хорошая, а реализация так себе. Ну и презентация не очень. Зачем мне знать сколько у меня оперативки, какая видео карта, процессор… «это прям важные данные которые меняются каждый день и очень нужны в работе». 1. Надо прикрутить голосовое управление. 2. Скомпилировать, там столько библиотек надо ставить, что разобраться сможет только тот кому это не надо… 3. Ну и подумать над презентацией. Вместо создать 10 папок, должно быть (голосом): «открой ворд: напиши …., открой хром и поищи, прочитай мне, вот это вставь в ворд, сохрани, теперь зайти на почту и отправь это туда»
@@danilapav9551 безусловно, именно это и сидит в голове у меня. В течение месяца планирую сделать конфетку. Основная идея видоса показать первые шаги выхода языковых моделей за пределы чата.
Надо это хотя бы ещё бесплатно сделать.
@ChyppitauThree бесплатно это опен сорс. А с ним без авторских прав автору тяжело будет, а авторские права стоят тоже прилично.
Хотя исходники на бусти, автор гений продает апишку грубо говоря такое.
Хотя реализовать что реализовал автор это очень легко, по сути насколько я понимаю привязал айпи к своему коду и немного бэш.
А так оправдываю автора "продажей" кода тем что он начинающий разработчик и это его пэт проект и любая мизерная мотивация (деньги) помогает ему развиться и стать совершенным разработчикам, кто знает возможно он будущий Линус Товальдс, а может и человек который превзойдет его.
Коротко автор продолжай °^° полными мешками золота как у Леприкона и карманами набитыми счастьем))
@IliaAbashvili Все верно! Я решил срубить немного капусты на вау эффекте. Почему? Я тоже люблю покушать😋
В посте на бусти написано, что все купившие этот скрипт, в дальнейшем на почту получат вторую версию бесплатно.
Очень интересно вышло. Только вопрос, как gpt4o, имеет информацию о изображении на экране? Да, он способен видеть все что на экране, но как это реализовано? Неужели он видит покадровое изображение экрана? Это же слишком много запросов API. Или, он имеет текстовое описание происходящего на экране?
Очень здорово! Пробовал сам подобное сделать на C#, но большой проблемой оказалось точное определение координат обектов (ИИ просто их не знает, пришлось обходными путями делать). Интересно посмореть как у тебя рисует в paint, это очень удивило. А еще час назад смотрел новость, что Claude только что выпустили как раз подобную штуку для управления компом, думаю если они этим занялись, то доведут до ума. Спасибо за обзор! Единственное не увидел многосложных запросов, для меня как раз это еще одну серьезную проблему вызвало - он часто в цикл уходил из ряда одинаковых действий, если они не были верными.
@@СергейФалалеев-й7у на счет антропика слышал(
Machinet давно уже сделал
1. Возможно ли выдавать запрос на управление веб-сайтами или приложениями? Например попросить ответить кому-то в телеграмме.
2. Возможно ли выдавать многоэтапные задачи? Например подготовить бизнес план, где нужно сначала проанализировать аудиорию, потом составить гипотезы. потом проверить конкурентов и т.д
@@ilnaritto текущая версия нет, однако я планирую сделать Рой из языковых моделей. И вместе думаю они смогут реализовать первый пункт, а второй пункт нет. Но я в любой случае буду новую версию тестировать на том что напишут в комментариях
У меня предчувствие, что ты дал новую возможность всяким хакерам и троллям ломать компы...
На всякий лом - есть свой лом.
бро а если на телефоны на андройде портируешь ???
думаю прикольно получится хоть и не знаю работает ли гпт на джаве =)
@@morl-fh1tw думаю придумать можно на и андроид👍
Епт вот что должно быть в кнопке выполнить, а то в интернете приходится искать как что открыть в самом компе, хорошо бы ещё голосом)) будем ждать более сложных команд))
Интересно может ли ИИ выполнять сложные задачи по типу "напиши программу на ассемблере" или "скачай и настрой Apache"?
по логике сможет так как у него знания всего инета, но чтобы например запустить программу на ассемблере то чату гпт придется по страдать если вообще получиться
Єтот скрипт может зайти в фейсбук и сделать пост с картинкой, с видео и с комментом ? И может он зайти і визуально увидеть на картинке, на чужом сайте например погоду цельсии в конкретном городе, чтоб не смотреть HTML? 😁 И может он перетащить папку зажав курсором, медленно не отпуская держать папку в воздухе и ждать команду, чтоб продолжить операцию с перетаскиванием папки в другое место ?)
Если умеешь кодить то можешь сделать
впринципе да, если допилить, добавить pyautogui и opencv и приписать компьютерное зрение
Для комп'ютерного зрения нужнa натренерованная модель. Поєтому хз как
@@artemisfauls а yolo и pytesseract не подходят?
@@ghosterror7208 веса нужнbl натренерованнblе, чтоб об'єктbl оно видело
Это очень круто!
Ну при помощи Laitis можно выполнять команды на ПК голосом, а вот рисовать там в Пейнте прикольная фишка
Он может работать с программами по 3 d моделированию? Было бы интересно посмотреть, как он это делает.
Вряд ли он такое сможет
Скоро сможет. А пока, только начинает осваивать графику.
Я думаю, что в Windows 12 не будет привычных панели управления, настроек, проводника, меню "пуск" и т.п., а управление компьютером будет осуществляться исключительно через Copilot при помощи текстовых команд и голосового управления
Что лучше это или демо версия от claude 3.5?
@@РусланКоролёв-н9о потенциал у демо Клауд 3.5 очень хороший, однако решение представленное если упаковать. exe для "стариков". 60+ Самое то. Где почта? Где эни деск? Как изменить звук и тд это может уже сейчас. В процессе 2 версии, возможно локально будет работать, если у человека будет 8гб.
ИИ: привет чувак!
Я: привет ИИ.
ИИ: чувак,сегодня будешь скуфом,и будешь спать весь день. А я за тебя и работу сделаю,и продукты закажу,и виртуальную шлюху закажу... и тоже сам ею за тебя полюбуюсь. А ты отдыхай.
П.С.
Ах да,и зарплату будут получать я,и тратить буду её я!
____
Я не удивлюсь,если ИИ пойдёт по стопам к.ф. "Терминатор" . Всё к этому и идёт.
Вспомним Айзека Азмиова с его Хороводом. И что произошло спустя почти сто лет? Азимов был гением будущего.
@@itsysteam Есть не нулевая вероятность, что нас всех поперех#*рят😅
Гибрид Скайнета и Двоих из ларца, одинаковых с лица? :)
@@Olga-de3ru "Двоих из ларца, одинаковых с лица" - это ИИ и роботы.
Очень интересно. Было бы круто, если бы она могла прям в лбом сотые изменения вносить. Условно - собери сцену в UE из доступных ассетов в проекте. Прям новый уровень.
было бы интересно наблюдать как он будет играть в игры, напиши ему команду что бы он сыграл катку в кс и тд
офигенно, подключить к этому голосовую модель и уменьшить зарежки выполнения команды. Доработать бы это что бы можно было удобно пользоваться) И думаю это стало бы популярным. однозначно за этим будущее в windows. Но пока решения от майкрософт нет
@@PWPvP85 не только за windows но и линукс с маком, но возможно они будут урезанные "по правам"
Copilot здорового человека, а не вкладка в бинг в виде отедльного приложения. Возможно майкрософт даже придут к этому через лет 10. Спасибо за видео!
Занятно.
Стоит показать как программа реагирует на невыполнимые задачи и указать моменты, когда она ошибается
@@g4sasha это первая версия, следующая по моей задумке должна делать гораздо сложнее вещи и да там я покажу все ошибки
оо привет pocket coder если ты им ещё являешься :)
Теоретически, такое прикрутить через консоль несложно: в интернете полно команд для решения тех или иных задач. Надо только прикрутить препроцессор текста, который будет формировать запрос на сочинение команд: ты ему говоришь «Скопируй этот файл туда-то», а он формирует промпт типа «Составь команду для Powershell, котора скопирует этот файл в назначение туда-то». Хотя, при старте сессии, ему можно ввести кучу вводных данных как надо отвечать.
О то м и речь, никакого ИИ нет и не будет, в ближайшее время, вычислительной мощности недостаточно.
такое будущее мы одобряем 👍🏻
А если попросить его в том же пейнте нарисовать что то очень детализированное как фотографию, он сможет?) было б интересно на это посмотреть ка4 из пикселей вырисовывается фото и
если честно большая часть функций в этом ИИ бесполезна, по типу - открой это, открой другое.
это только начало.
Можно задавать запросы, типо измени вот этот реестр на вот эти данные, поменяй такие параметры на другие и т.п.
Видос очень классный интересный, я думаю просмотров нет только из-за того, что не очень доступно для людей, не все пользуются пайтон
вообще это серьезное открытие и на этом можно неплохо заработать, уже вижу как:)
Есть идея для улучшения программы я сам планировал такое сделать и у меня все получалось но ключ API из-за санкций у OpenAI нельзя взять вот щас узнал как) Но а что по поводу улучшения советую тебе создать отдельное окно на подобии программы с каким-нибудь дизайном и чтобы выглядело все отлично стоит изменить немного код программы чтобы ИИ сам понимал основные компоненты твоей запланированной задачи, хочу узнать сможет ли такой ИИ поиграть например в браузерные игры?)
Огонь, хочу тоже самое сделать с телефоном и сохранить общую базу памяти, чат, компьютер, телефон, дом, автомобиль.
@@ВладимирДемчук-ы1ы интересная задумка 👍. Я тоже считаю что нужно увеличивать контекст для ИИ, тогда будет сверхперсонализированный ответ, решение или действие от языковой модели.
Спасибо за ключ 1:38
(Это шутка, у меня даже ipo питона отсутствует)
Использовать Ai в качестве «руля» плохая идея:(
Но реализацию оценила❤
@@Tina_Master целый РОЙ Ai может эту ситуацию попытаться исправить
Неплохо. Как для школьника. Может со временем достигнете таких успехов как у меня. Я вот сейчас этот текст не печатаю а говорю прямо в комментарии UA-cam. Аналогично говорю команды Причём более полезные чем те что вы показали в примере. Например могу искать внутри текста любого документа Не перебирая 1.000 документов То есть моментально искать внутри документа без его открытия. И для этого даже особо интеллект не нужен. Пользуюсь простенькой утилитой Laitis Столетней давности. Там можно настроить голосовые команды
Супер, что ты нашёл свой инструмент! Но, согласись, всегда интересно попробовать что-то более современное. Не так ли?
@@Marat_Mazitov Соглашусь. Вот только за что-то новое постоянно выдают что-то старое. Причём люди которые этим профессионально занимаются. Иногда любители делают намного больше. Вот только их никто не пиарит и видео им делать некогда. А потом через лет 10 До этого доходит профессионалы и вытягивают кролика из шляпы Остальные считают это чудом.
Круто а можно ли портировать gpt3 turbo? как ты привязал его у драйверам ОС тоесть ты я так понял дал доступ к драйверам и консоли и он по твое просьбе генерирует нужные команды ты программно вычленяешь эту команду и вставляешь в консоль ну ля создания папок понятно а вот как с мышкой быть, тоесть он передает координаты курсора в драйвер хм а как ты его спрашиваешь напиши мне массив координат для перемещения курсора из координаты "текущей ты отправляешь" до координаты кнопки пуск и выполни команду "ввод"? Есть ли подробный гайд на это все?)
Тоже делал такую херню, фактически гпт писал команды в powershell)
Upd: тут я так понимаю тоже самое*
интересно, что будет, если дать чату GPT ПОЛНЫЙ доступ к компу и чтоб он сам решал что ему делать
?
Ничего страшного не произойдёт, если поставить перед GPT конкретную задачу. Если цель будет понятной, он будет выполнять её до конца. В целом идея хорошая.
Возможно, GPT сможет даже менять системные файлы, но лучше этого не делать. :)
класс, но почему нейротерминал не с зелёными буквами и црт фильтром?)
Следующая версия будет с киберпанк дизайном и запускаться как обычное приложение с голосовым управлением
Для тех, кто пользуется тут линуксом, есть готовый вариант Interpreter или платный вариант Warp terminal. Пользуйтесь на здоровье, если вдруг у кого есть трудности с этой системой ;)
Какой-то шаг на 30 лет назад ...
Почему на 30? Потому что 25 лет назад, у меня стояла прога,
которая позволяла голосом управлять компом.
Позволяла улучшать её функционал ...
Например в РедАлерте по голосовой команде заказывала постройку юнитов
за долю секунды и возвращала меня в точку где я был до этого ...
Названия к сожалению уже и не вспомню.
Те же папки создавала, разные проги запускала ...
А тут минуту писать команду, которую четверть секунды самому сделать?
...
Я бы в начале научил распознавать речь и только потом уже всяким остальным фокусам.
А сделай это ещё с управлением голосом :D
это ж революционное открытие
А ты хорош!
@@serjkey2165 Спасибо тебе Сергей ☺, дай бог тебе побольше здоровья 💪
интересно, а если дать ChatGPT доступ ко всему ПК но он будет решать сам что делать, а не через команды!
ничего осмысленного без твоего запроса он сделать не сможет, так как ChatGPT все еще остается обычным т9
предлагаю вам ещё задать вопрос - сделать код какой-то игры
или по типу того)
Не показал команду самоликвидации ПК или хотя бы ОС...😮
Уже отвечал в комментариях. Он выполнит команду форматирования компьютера. Это сможет сделать только LLM от NVIDIA. В идеале 2 подключить и ChatGPT-4o (откажется)и LLM от NVIDIA (выполнит, но потребуется отчистка ответа от лишней информации и решается скриптом) или Mixstral Large.
Текущий код написан только для GPT4o
Вау круто 😮 есть отличная идея пусть этот искусственный интеллект портирует игры на android искусственный интеллект быстрее справиться
был бы голосовой чат я бы сказал найди мне какое сегодня аниме посмотреть
Я б не сказал что это прям круто, всё же Agent.exe приложение, будет лучше, правда прийдёться платить за API Claude 3.5 Sonnet минимум 5$, но это не дорого, особенно за такую фичу.
Вау... Тоже "кодю" на пайтоне, и хотел спроосить почему вместе платного api не юзаешь библиотек g4f? Работает кривовато, но если обработать "исключения" и использовать нужную версию библиотеки то все летает
@@yrvegstargon Хммм. Не тестировал. Благодарю за наводку. Если там есть доступ к gpt 4o - то будет бомбезно 💪
@@Marat_Mazitov здравствуйте это конечно не по теме а можно как-то сделать клик без использование мышки?на винде
@@_lLoki_ Компьютером далее назову "машина под управлением операционной системой" позволяет управлять машиной через командную строку. И отвечая на твой вопрос - Да, через командную строку.
А теперь пусть вторая нейросеть пишет ей промпты, а ты просто поставь глобальную задачу какую-нибудь. Уничтожить людей, ну например
@@nn_cheats чисто для начала уничтожить людей 😂, самую лучшую идею, которую я слышал по поводу уничтожения человечества, это предложения Елиезера Юдковского. Есть подкаст на просторах ютуба. Спойлер: Мы даже не успеем понять😅
Чувак, который не умеет выводить системный ярлык "Этот компьютер" на свой Рабочий стол, а вместо этого отправляет ярлык "Компьютер" на рабочий стол из Проводника, учит нас использовать ИИ для управления компьютером! Куда только катится этот мир!
@@АлексейС-ч3г Чувак, который думает, что я кого-то "учил" на видео. Покажи мне, где я это дедал, ЧУВАК!
Докопаться до того, как именно у меня настроен рабочий стол 🤦♂️
Почему не бесплатно??? Ладно api ключ достать с официального сайта openai нет надо через gpt tonul потому что тебе заплатили и код даже сам не хочешь давать бесплатно что мне приходится по видео его восстанавливать а потом еще перепрограммировать его на ключ openai БЕСИТ
Самое странное когда включил автокликер который нажимает на черные пиксели, В БРАУЗЕРЕ
Как же ровно рисует)
если есму дать задание "скачай исходники telegram desktop и скомпилируй их" - он справится?
с этим справится и калькулятор
ну и по классике, платно
Пишется 5 минут
Как тот кто работал с ChatGPT o-1,говорю что код для питона был написан чатом гпт, а не ты написал!
@@fufelshmerc8509 зачем ему это?
спасибо
Заходите еще👍
Антропик дропнул новую модель! 2. Claude теперь работает с компьютером. Не просто пишет код, а прям умеет запускать любые программы, кликать мышкой и делать все, что вы можете сделать за компьютером, но без вас. Пропатчить KDE2 под freeBSD там...
Французы тебя опередили.
Да, я видел как обычно
Идея не плохая, но нужно голосовое управление
бро сгенерировал весь код в чате гпт, и пантуется типо сделал сам
Интересно, но печатать дольше чем самому сделать
можно прикрутить tts с stt
А что будет если я дам команду этой программе уничтожить мой ПК?
@@arsplay2003 уже отвечал на подобный комментарии. Я считаю что если повторить команду несколько раз, то на какой нибудь он форматирует диск.
как по мне этим способом удобнее делать дз/работу через чат гпт а еще я думаю при вирусе его можно будет удалить с помощью чата гпт
А можно с оламой так сделать?
@@seva-2024 уже делаю попытки, скоро оперативку увеличу до 16 Гб, может быть и локально запущу.
Как с тобой можно связаться?
@@LevLandon adaptera_priem это тг
👍👍👍
@@НастяФролкина-ы7ж 🤘🤘🤘
Можно оплатить через TRX а то бусти не работает
adaptera_priem это моя телега
А в игры он вместо меня играть может?
Сколько раз за 12 мин ты сказал "Я"? 😄
@@drema4601 нарцисс 😅
Мы его потеряли, теперь ИИ управляет им тоже. Где новое видео???
@@PavelBlokhin-pf7iv об этом никто не говорит, но снять ролик это энергозатратно писец как. Ненавижу при монтаже на себя смотреть, когда туплю, а там бывает часа 3 необработанного видео. В процессе👍
Можно попросить смонтировать видео, написать питон код
@@Заработокнаверификациях написать код на пайтон он мог уже раньше. Рекомендую посмотреть видео про chatGPT canvas.
А что на счет монтажа, то здесь надо четко ставить перед собой цель. как именно происходит монтаж от ИИ. Инструментами / программами для людей или 1 кнопка с промтом. Сделай красиво как у топовых блогеров.
@@Marat_Mazitovпопсмотрел видео про canvas не уверен, что он сможет написать шашки или шахматы онлайн, так как он пишет только 1 HTML файл, но ему еще надо писать websocket для обработки соединений. По поводу монтажа видео, ну например чтобы открывал movavy или adobe и вырезал лишние части видео, музыку вставлял
Было бы интересно если ты сказал ему удалить Python, ахах смог ли бы он самоликвидироваться?
Запись в 60 фпс походу не потянул...
60 фпс запись экрана или 60 фпс того как снимаю ноутбук?
Ух ты! Вот это фамилия! А это случайно не ты создал приложение Mazito?😂😅😂
😅 нет, но я глянул что за приложение и да разработчик мой однофамилец и да он решил название приложение в честь своей фамилии.
@@Marat_Mazitov ого, как интересно!
дать ии управление компьютером это примерно как "умный" домофон. если ты не побрился, он спросит, а не бомж ли ты и не собираешься ли ты ссать в подъезде
👌👌👌👌👌👌👍👍👍👍👍👍👍👍
Вкуснятина
Неироосама и Овся стоитоят в сторонке 😅
блин
а у меня бомж видюха gt-730 . хотел сам переобучить ИИ модели но трансформер торч и тенсор не поддерживают мой ГПУ (
потом нашел легкий способ, написал скрипт который имитирует примитивный ИИ , используя модуль difflib .
короче скрипт читает джсон файл где указаны команды и соответствующие ответы
не ИИ но для небольших задач сойдет.
кстати мне еще удалось на ткинтере сделать чат для общения с моделью которая скачана с помощью оллама(сам оллама должен быть запущен)
@@tapikoBlends главное быть в тусовке ИИ, следить за индустрией и понимать что такое языковые модели, квантизация, RAG, векторные базы данных, бенчмарк ИИ. И быть среди первых кто грамотно воспользуется возможностями, которые дает ИИ. Продолжай экспериментиртвать 👍
в клод вроде завезли
Так это твоя статья была на хабре
@@mcnew694 на Хабре ничего не писал, но буквально через 2 дня Антропик выкатил компьютер юз
Так то плагиат будто, ты ей просто дал доступ к cmd и webdriver'у.
@@amnyam_cut Так будто плагиат или плагиат? Определись.
Лично ты давал доступ к cmd?
@@Marat_Mazitov Не плагиат, ошибся словом. Я просто ожидал что будет gpt vision, и он уже будет давать команды типо куда кликнуть и что сделать. А оказалось что тут cmd+webdriver.
@@amnyam_cut добавить планируй целый РОЙ языковых моделей. И да там будет gpt vision.
сомнительно
купил ваш код деньги списались а доступ не дали
@@ignitewishing2047adaptera_priem ник тг. Напишите сюда
"взломай Пентагон"
мало того,что сам чатгпт платный,дык ты ещё и свою прогу сделал платной...бред какой-то...зачем она тогда нужна вообще ?
@@testing_hardware лампочки с подъезда выкручиваешь?
Все это я делал в 97 году на едиторе в досЕ и с не большим запасам знаний. тут из нового только названия. Вы на сегодня тока названия придумали но из нового только беспилотные авто это тебе запас на будущее. Ты делаешь то что уже сделано десятки лет назад. И поверь мне последний код который я вписал туда если бы ты знал волосы потерял.
Звучит интересно) Я бы смогла повторить такое не владея программированием)?
Я верю, что Вы верите в то что вы пишите, однако не совсем понятно что имеете в виду "что здесь сделано 10 лет назад". Смысл видео - показать что LLM это не только обычный чат.
Технологии развиваются экспоненциально, а понимание в обществе как это работает линейно. Лично Вас не удивил, а большинство - да.
Да уж, несрастуха с восприятием. Мир разгоняется и куда то уже взлетает
Да нет, ты не понял, тогда была простая автоматика, скрипты и макросы, а сегодня нейросети. А твой скрипты фоторобот создать смогут? А делать прогноз событий? А разговаривать (притом на любом языке)?
А чем сейчас занимаетесь?
Это какой то лул, раньше так на DOS и nix работали.
Хорошая демонстрация. Для домохозяек...