Как работают поисковые системы? Разбирался математик Вольфсон
Вставка
- Опубліковано 31 лип 2018
- Наш телеграм: t.me/qwerty_live
Сегодня в ролике разберём, как работают поисковые системы. Захватите блокнот, чтобы записывать!
Не забывайте подписываться:
ua-cam.com/users/qwrtru?s...
Мы ВКонтакте: qwrtru
Мы на Facebook: / qwerty-905854752769231
Мы в Instagram: / qwrtru
#РеальнаяМатематика #Математика #научпоп
Над выпуском работали математик Георгий Вольфсон, режиссер монтажа Дмитрий Веселов, главный редактор канала QWERTY - Ирина Тихонова.
При поддержке студии интернет-маркетинга Mevix.
Есть идеи, вопросы и предложения?
Пишите нашему главному редактору на почту irina.tikhonova@mevix.ru - Наука та технологія
Оригинальный и качественный контент. Ваш канал просто космос ребята!
Общий курс SEO для чайников) То что обсуждается, было актуально до 2011 года, с тех пор начали усиливать(и усиливают) своё значение поведенческие факторы.
Mx App именно!
В Гугле до сих пор ссылочный профиль основа. Для Яндекса согласен, все так. Тестировал это все на своих сайтах.
Позволю себе усомниться, что вы знали, что алгоритмы именно такие, как рассказано.
2011ый? Да вы как-то приуменьшили. Значительно раньше
На моей практике тупая закупка ссылок на seopult, rookee и тд перестала работать с конца 2011(насколько помню). Беглая внутренней оптимизация + автозакупка ссылок давали значительный результат, практически любой говносайт можно было привести к относительному успеху. Разумеется если говорить про высоко конкурентные ниши, там далеко не всё так просто.
Отличный ролик, но, честно говоря, две вставки с пинанием компа сильно отвлекли. Не соответствуют сложности рассказываемого материала. Пришлось аж переслушивать.
Согласен.
Хааа )) тоже отвлекся и мотал назад заново слушал )
есть такая штука, спинер называется :DDD
Аналогично
Ага, тоже мотал. Да ещё и два раза. Второй, чтобы удостоверится, что на мопеде гребаная панда.
Спасибо ! Очень интересно !
Спасибо! Очень интересно! Хотелось бы продолжения этой темы.
Какая же крутая эта рубрика матчасти
Браво! Понятно и очень интересно😊
Замечательный выпуск. Комментарий в поддержку.
Господин Волков излагает интересно и познавательно
Спасибо за полезный видос про сео) Лайк!
Работала в 2008 году, сейчас это минимальная часть от общего алгоритма) Пример, сколько времени пользователь находиться на сайте и т/п не связанные с ссылками факторы.
расскажите как работают букмекерские сайты кто и как меняет в реальном времени коэффициенты ставок.
Сами игроки и меняют коэфициенты своими же ставками). Это же элементарно))
Они работают на наёбе, дружище
пожалуй я ваш фанат.все понял.о чудо.
Прикольная музычка)
Давольно таки понятно , если хоть чуть чуть знаком с математикой и логикой . А так как всегда супер по больше физики и математики на канал .
А мне больше ролики про логические задачки понравились. Хотелось бы больше роликов с задачами.
Хороший обзор!
Было бы здорово сделать более развернутый обзор
Так можно случайно SEO-шником стать, не советую.
Ссылки - это на данный момент всего лишь 1 из тысячи факторов ранжирования страниц. Но познания в сео улыбнули)
Доброе дело делаете. Молодёжь Возможно ещё больше уйдёт в айти. А я так и останусь при деле механиком.
- "Для начала нужно куда-то собрать все эти страницы"
Тем временем в гугл просто понастроили эксабайтных хранилищ по всему миру
- "это уравнение быстро не решить даже на компьютере"
Тем временем в гугл просто производят свои процессоры и консолидируют в огромные вычислительные центры
- ...
Тем временем в гугл проложили свои терабитные кабели по дну океана
Не то что бы фраза "может однажды вы придумаете алгоритм лучше западных программистов" имеет отношения к реальности.
Гугл производят свои процессоры?! Ничоси. Пойду гуглить :)
Это к чему? Если гугль ищет так же один в один как и хуяндекс, и мыло, алгоритмы одни и те же, криво работающие. Способны выдать только тупейшую инфу.
Portal2x2
А гугль ты не обгадил в названии из патриотических соображений?
Что-то я не слышал и не видел нигде, чтобы Гугл разрабатывал свои процессоры. Но вот что они действительно имеют своё, так это файловую систему Гугла, которая как раз оптимизирована на поисковые запросы в огромных хранилищах данных. Структура и принципы этой файловой системы, естественно, засекречены.
Хуяндекс вообще-то это отдельный ресурс.
Расскажи о фрактальной геометрии
Хорошо говоришь. Ни одного лишнего слова
Спасибо
... а ещё туда добавляется история запросов, геолокация, и ещё куча "личных" данных. Например если я напишу в Яндексе "замена салонного фильтра", Система чётко выдаёт именно ближайшие ко мне мастерские и магазины, и знает, что я езжу на Хонде. )
Интересная Базовая информация. Понятно, что сейчас все на много сложнее. Но с чего все начиналось теперь ясно. И наконец стало понятно нахрена раньше сеошники закупали ссылки.
Что за музыка играет на заднем фоне?
про комрьютерное обучение плиз!
Устаревшие данные. Количество факторов ранжирования намного выше, а рейтинг страниц поисковики уже давно отменили. Хорошо конечно, что основы рассказываете, но информация не полная.
Да, этих факторов том же Яндексе несколько сотен, а ссылочное ранжирование по коммерческим запросам официально было отменено уже лет пять назад
С радостью подождал бы минуту для вывода более точного результата. Но будет ли он точен?
Показали структуру работы поисковиков на первых этапах их становления. Сейчас уже параметров ранжирования за 300 (по словам Google) и все больший вес приобретает поведенческий фактор, а покупные ссылки могут помочь разве что под санкции попасть.
ну ка покажи где гугл утверждает что поведенческий фактор оказывает влияние на ранжирование?
ну он ведь SEO не занимается, нарыл статью - зачитал на камеру. Народу заходит
Логично если я обращаюсь к поиску, значит данного поведения небыло в моей системе, в 85% и выше, в таком случае накой ляд оно нужно?
@@user-tx8lz5hq4w сапа, перелогинься
Давайте лудше ждать минуту , но получать ответы точнее чем новый чат GPT , который и так профи во многих облостях. И это хороший поисковик , лудше гугла и минуту не ждет
По поводу 6:50 - 7:00 Я бы подождал 1-2 минуты(да хоть 10). Лишь бы информация была точнее.
Ну да, так, упрощенно, как рецепт бигмака - огурцы салат и лук, все на булочке с кунжутом)
Очень крутое видео
✌️
Георгий, нынешние все поисковые системы работают с помощью методов машинного обучения!
Proofi? Krome sozdanija Deep Blue dlja neponjatnih celei? Otkuda vi znaete kak rabotaut poiskovie sistemi? Rabotaete v kompanijah? A za4em raspostranjaete kommer4eskuu tainu? Prosto tak ljapnut intuitivno i4evidnuu vesh legko a vot dokazat? Ili matematika bez dokazatelstv vas ustraivaet?
Проблема более точной выборки даже не столько во времени обработки запроса а еще и в затраченных ресурсах сервера на обработку этого самого запроса, что скорее всего для компании более важно чем скорось обработки.
Binarnoe derevo? Kesh samih populjarnih zaprosov? Eto je elementarno i prosto. Pri dostato4nih objemah pamjati obrabotka momentalnaja.
Сейчас самый важный параметр при поиске- это количество денег заплаченных гуглу за рекламу. Вот это и является приоритетом, а остальное вторично, до тех страниц всë равно никто не долистывает. Кто пользуется гуглом лет 20, тот заметит разницу между сейчас и тогда, сечас очень много выдает всë,что угодно, но не то, что надо, в основном это рекламма по продаже чего-нить, хотя, в принципе, большинство чего-нить купить и ищут.
Всё круто и понятно...кроме одного. Почему ты не можешь выщипать свою бровь?
Вроде все понятно, но я походу все равно мало что понял)
что такое индексирование страниц в поисковиках?
и что такое индексирование файлов в компьютере ?
это очень ускоряет поиск но как ?
doc Как оглавление в словарях (книгах). Ты быстро узнаешь, на какой странице интересующее тебя слово (глава), без необходимости листать всю книгу
Вася Пупкин видимо обиделся))
Я занимался этим, скорость подачи информации важнее за ее корректность, люди не любят ждать...
Как математически расчитать поиски максимально качественного порна?
Актуальная тема. А главное чтобы твоим запросам соответствовала
Дякую 🤗
Почему у тебя за спирой, на доске, в уравнение, знак неравенства ?
программисты поисковика сами могут любой странице присвоить вес и она будет выходить в списке выше других
2:56 не Васи бубкина, а Васи Уткина)
описание интересное. но как-то осталось за кадром, каким чудом поисковики узнают, сколько времени пользователь просидел на сайте. При переходе-то браузер не пишет доклады всем поисковикам!
Я помню первую поисковую систему под названием aport ,еще не было ни гугола ни яндекса ни рамблера.
Апорт не был первым и даже вторым и даже третьим и даже десятым. В середине 90-х многие компании создавали своих поисковых ботов, но не в России. Если же говорить про российский поиск то в 1996 году был реализован поиск с учётом русской морфологии на поисковой машине Altavista и запущены оригинальные российские поисковые машины Рамблер и Апорт. 23 сентября 1997 года была открыта поисковая машина Яндекс. При этом Рамблер начал работать в 1996 году, а Апорт официально презентовали только в ноябре 1997 года. В результате чего получается полное противоречие вашему комментарию - и Рамблер и Яндекс заработали раньше Апорта.
Информация 15 летней давности... Алгоритмы ссылочной массы уже давно не используются. Верней они используются, но отошли на задний план.
Мне кажется, заголовок не соответствует разобранному в ролике материалу. Вместо объяснения, как работает поисковая система в целом, разобран только вопрос ранжирования результатов в поисковой выдаче. А как же сбор информации? Индексация? Разбор поискового запроса и выбор соответствующих ему результатов?
Итого: видео хорошее, но совсем не оправдало моих ожиданий.
То чувство когда ты Вася Пупкин
Я смотрела, может, год назад это видео, сейчас пересматриваю и думаю: Георгий часто говорит "порядка 20 млрд", "порядка 15%". Это действительно в смысле "математический порядок" или это значит "около"?
Кликерство одна из бичей современных поисковых систем, так же проблемы создают рейтинги типа яндекс систем ТИЦ или как их там, и до сих пор их практикуют.
Если со страницы васи Пупкина много репостов на разные сайты? )
Всем маленькая ценность
Как убрать звук пиликает что-то
Захожу в гугл, делаю запрос, внизу страницы пишет: мы удалили несколько результатов бла, бла, бла по требованию правообладателя. Риторический вопрос : и какой смысл совершенствовать поисковые алгоритмы, если нужные результаты поиска не выдаются?
это предположения или это так и есть?
Ваш виртуальный серфер загнеться на первом же цикле
В следующем ролике расскажи, как кремлеботы накручивают дизы....
Кремлеботы знатно путину на нг накрутили дизлайков на его обращение! Диссананс!)
@@user-le9ck5qp8j Видать он обещал им что-то и не выполнил!)))
@@azzyyy734 😁
Лучше бы рассказали что нибудь про SEO. Ощущение, что попал на кликбейт.
Точной информации нет (так как она защищена поисковиками) но насколько мы осведомлены, у гугла более 200 критериев ранжирования сайтов, а вот эти перелинковки описанные в видео, неактуальны года так с 2009.
Я в истории
алгоритмы все решают алгоритмы
Internet урок ?
подписка на кверти
в видео 849 тысяч подписчиков
а на деле 844
хмммммм.....
Так работают не поисковые системы, а системы ранжирования(когда-то давным давно работали), это совсем разные вещи!. Потом это решается не приблизительно, а точно с помошью айгн валуе айгн вектор разложения. А вообще алгоритм PageRank это уже совсем баян
Как создать поисковик:
1) Добавить фильтр цензуры
2) Сделать дизайн
3) Искать в гугле и цензурировать результаты
за счёт рекламодателей работают
Графы с весами на нейро сети похожи
Как-то совсем скудно, анализ страниц в поисковиках по глубже будет.
Ну это только такой основной базис. Типа один из первых основных алгоритмов поисковиков из середины 1990-х годов. И про анализ страниц здесь вообще ничего и не сказано. Если же обсуждать всякие прочие алгоритмы ранжирования, семантический анализ, системы хранения данных и т. д. и т. п. то это будет видео на десятки часов и это уже будет курс лекций на стыке SEO, математики, ИИ и программных архитектур. А так - небольшое лёгкое видео про простейший алгоритм.
5+
Ну нафиг. На четвертой минуте мозг скипел
Вольфсон, я вас очень уважаю, поэтому не могу пройти мимо- ну зачем вводить в заблуждение?! То что вы рассказали- это некий условный ссылочный пейджранк. Ранжирование на нем уже 10 лет как не делают, все заменили нейросети, которые обучаются асессорами..
Щас вовсю нейросети трудятся и улучшают поисковые алгоритмы. Так что это так, заглянули в прошлое. Хотя все равно интересно)
Я не думаю о том как работает данная система, я думаю о том как она работает криво!
А причём тут сёрфер? И зачем он нужен? Не поняла...
Тут говорится о интернет-серфинге - перемещение по гиперссылкам на страницах сайтов в сети Интернет в ознакомительных целях. Вот поисковики и определяют сколько людей куда заходит, а сейчас как писали люди выше определяется по интересам отдельного человека, например человек интересуется рисованием ему по запросам будет выводить ссылки связанные с этим или на которые переходят люди интересующиеся рисованием.
Александр Иванов, ок. Спасибо. Все же про сёрфира было запутанно...
Александер Всевластный, спасибо, похоже я сам не очень понял.
Александер Всевластный, спасибо.
а вообще есть серферы люди, которых нанимают чтобы придавать весу страницам. за это даже деньги платят
Видеоряд сильно отвлекает )
Нихуя не понял но интересно
Сколько цыфр между 1 и 2 ? Бесконечное
Цифры - ни одной. Чисел - бесконечное множество.
Ответ: если ты после посещенной страницы не перешёл куда то ещё, значит на этой странице был найден ответ. Вес этой странице +1.
Садись, два!
Ролик как всегда отличный (хоть я еще и недосмотрел), но вот есть одна рекомендация: Георгий, смени фамилию, а то уж очень как-то нескромно ))
Поэтому современные поисковики после модернизации по начали выдавать ерунду
Учителя с интернет урока)
Они нам не партнёры
Давайте создадим граф. Давайте придадим вес вершинам.
А давайте без давайте. Мотивация действий не понятна.
P.S. у гугла есть множество документов в свободном доступе о том как работают его поисковые алгоритмы.
Множество "сделайте ресурс полезным" и прочих абстрактных формулировок и немного советов по техническому SEO. Никогда гугл не расскажет о своих алгоритмах в виде формул.
Кто сможет сделать поисковик на коленках?
Я просто напрочь забыл о чем он рассказывает, когда увидел сюжет с дебилом, выкидывающим свой комп из окна
Никто никогда не переплюнет гугл туда вложено миллиарды долларов и миллиарды человек часов. Забудьте
Капец он умный
У меня по запросу игры для программистов сайт на 1-2 месте в яндексе. Доволен, как слон )
Запрос, если чесно, херня полная. Частота 470. Реклама в комменте разве что отличная =)
а если ввести "игры для программистов онлайн без регистрации и смс" находит?
да, находит, 2 и 3 место + немного ниже паблос на сайт
хотя слово "смс" никогда в ключах не использовал. В целом помогли тематические ссылки с сайтов и форумов.
Можешь описать немного как этого добивался, какими ресурсами пользовался? А то я вот тоже хочу подобное дело провернуть)
1 Ссылки на форумах про программистов (в подписи, в профиле).
2 Ищем, где обсуждается данная тема и вставляем партизанскую ссылку.
И главное, правильное ся и уникальный текст со скриншотами и видосом по прохождению. и тп.
Вот почему говорят что программист должен знать математику, а раньше математик-это и был программист.Сейчас когда все упрощается, есть куча библиотек,фреймворков и т.д. значимость математики для рядового программиста упала. Если же брать какие-то серьезные проекты, то там чистейшая математика описанная языками программирования.
Если досмотреть видео до середины, то станет понятно, что математически решить задачу не вышло. ;) А я вам так скажу, пока что массово математика нужна только для ML-разработчиков и всяким основателям наукоёмких стартапов (честно в голову ничего не приходит, но такие должны быть, есть куча прикладного ПО (типа игровые движки (матрицы в основном) или GPS-системы (всякие штуки со временем)), но мне кажется это не в счёт).
Mr Kurolesov Математика нужна чтобы банально описать столкновение двух тел в самой простой казуальной игрушке, что уж говорить о программах посложнее
MsTim159 Tim не удачный пример, это дальше школьной математики не идёт. Любой разберётся как оно работает.
MsTim159 Tim, изменение двух переменных через fma mad или avx вот это математика конечно же, стоило ради неё убивать столько лет жизни. Омг, на самом деле даже какой-нибудь начинающий ui css дизайнер разберётся потому, что скорость ускорения и квадратничные\логарифмические и т.д. изменения - хлеб с водой даже простейшей анимации. В видео вообще показали, что не матан нужен, а сбор статистики. Вот и получается, что avx\fma\параллельные вычисления знать куда полезнее, а тригеры и бд просто жизненно необходимо. Из математики понадобится разве что булевская, а точнее массовые операции сравнения. Да и современные пограммисты уже давно не пишут быстрый код, куда важнее читаемость.
Если бы английское слово "CODER" не переводили как "Программист" -то таких вопросов не возникало бы.
Ждем видео по раскрутке и обходу блокировки дорвеев
Точно, а можно сразу лям закинуть?
Ни слова про сами документы, конвертацию термов(слов/наборов символов) в вектора. Удивительно, что даже мельком не озвучили TF-IDF(или что-то посерьёзнее). Как по вектору-запроса находить подходящие документы? Где математика?
Про ссылки и PageRank знали все недо-СЕОшники ещё 10 лет назад. И как верно подметили в конце видео это не так уж сейчас важно.
Очевидно, никто из просмотревших не собирается затмить гигантов с миллиардными бюджетами, но многие вполне способны написать вменяемый поиск для своего сайта или сделать подобие spotlight. Но, к сожалению, для этой аудитории у вас не нашлось элементарных ответов. Браво кверти, настолько хренового контента я у вас ещё не видел)
PS: Для тех, кто здесть наделся найти ответы, но обломался, посоветую замечательную книгу Кристофера Маннинга "Введение в информационный поиск", на сколько помню, переведенную на русский добрыми людьми из Яндекса :) всем добра
Инфа устарела лет на 15, но для начальных классов пойдёт.
У гУгл, а не у гуглА. Это, просто, ад для уха.
Nu nedavno bil v so4ah, tam vse govorjat "so4i" i "gugl". Okazivaetsja ne sklonjaetsja ;..;