ЕДИНСТВЕННАЯ СТРУКТУРА ДАННЫХ, КОТОРАЯ ПОКРЫВАЕТ ВСЁ
Вставка
- Опубліковано 4 жов 2023
- Научись создавать нейросети:
go.skillfactory.ru/wndtngpt
Скидка 45% по промокоду PULLUPHARD
Запишись в октябре и получи мини-курс по применению нейросетей в подарок.
Реклама. ООО «СКИЛФЭКТОРИ» ИНН 9702009530 erid: 2VtzqvRwR1d
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
Если бы у меня спросили про единственную структуру данных, которую нужно знать, это была бы Хэш-Таблица.
Фишка в том, что при изучении именно хэш-таблиц, ты узнаешь про все остальные структуры.
Связные списки, мапы, сеты, деревья...
Короче, в видео собрана вся база для тех, кто начинает или пытается окунуться в структуры данных, и конкретно в Ассоциативные массивы.
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
Я wndtn, мне 20 c чем-то лет, и я изучаю computer science и программирую ~10 лет.
Я into С++, и всякие low-level штуки.
У меня есть небольшой проект, xplatform, который вы сможете найти на github, и через него практиковаться в изучении всей базы программирования, и если вам повезет(если вы упорный), вы станете хорошим программистом %)
Если нужна помощь в программировании 1 на 1, чекайте ссылки .
всем добра
Телега - t.me/wndtn
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
Полезные материалы:
На русском:
• Базовый курс C++ (MIPT...
На английском:
• Hash table hash function
www.amazon.com/Introduction-A...
Тут есть около 50-100 страниц про ХэшТаблицы. Почитайте
Тут про ADT:
www.amazon.com/Algorithms-4th...
Если нужны какие-то ссылки из видео - пишите комментарий, я добавлю.
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
Подпишись сюда, бро:
Telega и чатик - t.me/wndtn
Boosty(менторинг для РФ) - boosty.to/wndtn
Instagram - / winderton
Github проекта(код с канала) - github.com/winderton
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
Оборудование:
Камера - Sony a7ii
Объектив - SIgma F1.4 DG
Микрофон - AudioTechnica at2035
Звуковая карта - Scarlett Solo
Петличка - Rode smartlav+
Клавиатура - HyperX Alloy
Вторая клавиатура - apple magic keyboard(black edition)
Монитор DELL 25'
Монитор Asus mg248q
Iphone 11 pro(зеленый)
CAMLINK elgato - для стриминга
JBL headset
Телик LG nanocell 50
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
Музыка:
KATworkshop - тема
НАЧАЛ УЧИТЬ ХЭШТЭЙБЛ, В ИТОГЕ ВЫУЧИЛ СВЯЗНЫЙ СПИСОК, МАССИВ, СЕТ, МАП, И ДЕРЕВЬЯ....
Топчик
ГОУ видосик про декомпозицию предметной области😊
Спасибо за годный контент, а в чем если не секрет, ты монтируешь и делаешь графику?
Такой же путь прошел)
я вот не понял что происходит, слова знакомые что для чего не понятно
можно еще быстрее говорить? ну и мужиков не надо, а так лойс поставлен)
Полезно всё, что ты делаешь! Из этого складывается собственная логика и понимание ,как в это влиться🎓🧠👁
Больше видосов по алгоритмам и структурам данных и ещё сними видос где ты решаешь задачи на литкоде с объяснениеми для чайников
Донат скинь
И в сообщении попроси
dict в python это хештаблица с двойным хешированием, сохранение порядка вставки поддерживается особенностями реализации, а не мапой
Питон лоховской язык
@@user-zf5vn2lw8b адепты js подъехали
@@user-zf5vn2lw8b😂😂😂 absolution верно
А где комментарии? Ладно, тогда распишу че хочу. Вариант ответа на вопрос в конце: когда известен ключ и не надо перебирать все возможные варианты, что бы найти один единственный. Видос полезный, но надо будет еще утром посмотреть, а то всё забуду. И хотелось бы попросить рассказать про деревья. Бинарные, черно-белые и т.д. Смотрел в интернете - нудно, много воды и надо прям вчитываться в каждую букву что бы понять. Вроде всё. За видосы +реп ❤
Невероятный кладезь знаний за 10 минут. Если бы меня спросили как понять такие сложные штуки, то я бы, не думая, ткнул пальцем в канал Winderton. Спасибо, мужчина)
нет, dict в Python это тоже хеш-мапа, не RB-tree
В Python dict был неупорядоченным до версии 3.6, для упорядоченного существовал OrderedDict().
Затем dict стал упорядоченным, при этом он остался хеш-таблицей, в итоге теперь в Python две реализации упорядоченного словаря)
Да только упорядоченность дерева подразумевает упорядоченность по значению, а OrderedDict это упорядоченность по времени вставки. Иногда бывает полезно и то и другое, но все же упорядоченность по значению более полезная штука. Например если у тебя ордеред сет в виде дерева то ты можешь искать upper/lower bound за логарифмическое время что покрывает очень большой класс задач. Ордеред дикт по факту совмещает две структуры и в этом плане не совсем уже чистая хэшмапа
Требуем 10 часовой ролик по современным плюсам !!!!!
На современный с++ нужно десятигодовой 😂
Ну все же он обещал на вроде 40к выпустить 10 часовой
Лучше уж Раст тогда 😎
@@AivanF ну раст вообще создан для прокачки мышления для плюсов
Спасибо. Отличный ликбез. Хотелось бы послушать про красночерное дерево
Ответ на вопрос в конце
1)Хэш-таблицы, работают быстрее при поиске элементов, в массивах нужно перебрать все элементы, чтобы найти тот самый, в то время как в хэш-таблице вы переходите непосредственно к элементу.
2)Вставка элемента выполняется быстрее в хэш-таблицах, так как вы просто хешируете ключ и вставляете его; в массивах важно сначала переместить элементы, прежде чем вставлять еще один.
Про первое, если у нас есть индекс, то мы сразу перейдем к элементу в массиве и будет O(1) как и в хэш-таблице. Индекс это же альтернатива ключу в хэш-таблице
@@Xname00 поэтому нихуя и не понятно - нахуя хэш-таблицы, если можно юзать обычные массивы -- доступ по ключу равен доступу по индексу. Жопой чую, что тут извечная дилемма по выбору "память-vs-процессор", но автор в видосе это не затронул.
@@Xname00 В том же и суть, что при поиске вы не знаете наличествует ли элемент в массиве/хэше, так о каком индексе речь? При поиске подразумевается не доступ (access), а конструкция типа "if something in array", в этом случае в массиве нужно будет перебирать каждый элемент до тех пор, пока "something" не будет найден, что в худшем случае и будет O(n). В хэшиках элемент вытаскивается сразу без этой беготни.
@@TheUnderLike почти все правда, но если трогать биг О то можно понять, что поиск в HshTable это 0(N) так же как и в массиве из за колизий. А мы программисты как наверное знаешь выбираем надеямся на самый наихудший вариант.
невсегда при заполнение HashTable обычно это на 70%, то HashTable пересоздается с увеличиной длиной в 2 раза как правило.Поэтому по Big O это будет 0(N)-вставка. Да конечно можно сказать что HashTable не заполнен и тд. Но в Big O всегда выбирают самый хужший вариант.Так же как с поиском и удаление все это 0(N) но в среднем да 0(1).
Привет чумваки, через два месяца упорного бодания рогами в землю, я пробил этот кокон и понял что дойду до конца и все уже стало понятным и логичным. Если вдруг у вас начался кризис обучения и вы хотите бросить, может быть вы прочтете и это придаст вам сил. Не опускай руки, бро!
о кто то поставил лайк, а после нг праздников так и не сел обратно, но всё ещё знаю что могу, новое видео Виндерпуфена смотрю и оно придаёт мотивации. Всем йоу!
Классный видос по супер базе. Теперь я чуть больше шарю за ассотивные массивы.
в С++ строки изменяемые
Восхищаюсь этим человеком. И его смотрят такие же свехнутые люди, кто любит компы и хочет понимать их лучше.😂 А уже потом кодеры.
В с++ можно так:
using namespace std;
unordered_map data {
{"Ivan",1},
{"John",2}
}
Реально годные видосы, очень быстро и по делу,продолжай так же
Отлично рассказываешь, думаю нужно больше такого контента)
Очень полезная инфа. От души. Единственное замечание. Почему вставка и удаление из сбалансированных деревьев - это O(log(n)). Может больше? А как же дополнительные операции на перебалансировку дерева? Так называемые вращения (rotations)
Шикарный материал 👍👍👍
Как говорят мудрецы, если завис с задачей, то брось на нее хеш таблицу и все будет шикарно.
А лучше положи на нее хрен😂
скорее всего на русскоязычном сегменте, ты первый кто будет объяснять это для "чайников". Я только начал учиться, но благо тебе есть "неусталость" обучению. TY❣
А смысл? Ведь этого будет недостаточно, однако ты рано или поздно дойдешь до них и изучишь уже на более глубоком уровне сам.
"А вот С++ .... сделал строки неизменяемыми" - это ошибка.`std::string` имеет изменяемый контент, как и область памяти, на которую указывает `char *`
Думаю он имел ввиду const char*
Требуем адское мессиво на 10 часов по плюсам
Вот это контеент!😂🎉
Я присоединяюсь к требованию десятичасового курса по плюсам !❤
Боже как долго я тебя искал, ты шикарен 😍😍😍 хз кто еще так может информативно рассказывать
Как раз думал, где видосы, как раз дропнул. Тупо сказка перед сном)
Вы как то говорили про обучение? Где можно посмотреть информацию об этом??
Ответ на вопрос в конце ролика. Хэш-таблицы могут быть быстрее массивов в двух случаях: 1. Когда известно только значение которое необходимо найти. В случае массива придется перебирать весь массив в случае с мапой ключом будет являться само значение пропущенное через хэш-функцию. 2. Массив хранит в себе сам объект а мапа указатель на память где лежит объект. Соответственно при условии что объекты могут динамически изменять свой размер массив будет требовать переаллокации памяти и переноса себя в эту память что довольно медленно а мапа нет. Возможно есть еще какие то кейсы но сходу в голову пришли эти.
У классического массива, доступ к памяти, осуществляется как: + * size_of(),
Если значение функции size_of() не является константой для данного типа, то создать классический массив, из этих элементов невозможно. Переменные(объекты/структуры) чей размер нельзя определить на этапе компиляции - всегда хранятся в куче. Массив из таких элементов всегда будет массивом из указателей. (Даже если сам массив тоже хранится в куче и доступен по указателю).
Поэтому второй ваш пример, мне кажется не состоятельным.
Ты лучший, продолжай свои уроки!!!❤❤❤
Хорош хорош братан, давай ещё! Можно такого побольше?
Спасибо. Нравится, что без воды.
В питоне до 3.7 dict был беспорядочный. В 3.7 его упорядочили (ради оптимизации памяти немного переработали dict, упорядочивание вышло просто полезным плюсом).
Понимание линейних массивов тоже очень важно. Везде где можно скешировать и проитерироваться, очевидно лучше соблюдать линейность, нежели таблицу или слинкованные структуры данних.
А вообще, лучше изучать и практиковать разные структуры и самому тоже делать (без использования стандарта std или boost)
йо, очень крутой видос! хотелось бы послушать про деревья и алгоритмы к ним
Спасибо за видос. Непонятно, конечно, но очень интересно =)
хешмап быстрее массива в случаях, когда нужен поиск по значению, а не по порядковому номеру (индексу)
ну и когда размер массива такой, что пробег по нему, дольше вычисления хеша )
5:35 в питоне это тоже хеш таблица. Для упорядоченной таблицы есть ordereddict.
при поиске и вставки элементов, это лучше всего сочетается в большом объёме данных или когда тебе по ключу что либо найти надо, вооот...
Найс. Как всегда база на языке народа. Красавчик 🎉
Массив быстрее хеш таблицы в случае поиска/замены так как арифметика указателей быстрее хеш функции
Но если нужно удалить/добавить элемент то в случае с массивом нужно найти !неприрывную! область в памяти размером {старый массив+новый/новые элементы}, скопировать всё старое и добавить новое и только потом удалить из памяти старый массив весь этот процесс на словах долгих, а не только на деле
Хеш таблица же таким не страдает и память выделяется только на новый объект который будет добавлен, а всё старое остаётся на месте
Например тот же вектор в с++ частично решает проблему со вставкой, но только в конец и до того момента пока не понадобится амортизация
В python dict реализован с использованием структуры данных hash table
Мне понравилось, интересно смотреть. Но это первое видео в моей жизни которое я замедлял, до 0.75. Речь изначально ускорена?
Может чуть помедленней стоит, обдумывать не успеваю что ты рассказываешь) А так спасибо, интересный материал, однозначно лайк
зависит от матриала и твоих знаний - я некоторые наборот побыстрее включаю
6:36 С какого это лысого O(1), если нужно пролистать по структуре до попадания на нужный хэш? Мы не адрес всё-таки там храним. Сразу нужно понимать, что структура с абстрактным множеством эл-тов не будет выдавать такие низкие сложности.
Спасибо!
бомба бро, супер базированная база, мб попробую использовать вместо векторов
Интересно, но пока непонятно. Язык на котором пишу (Autoit) знает только про массивы. Ничего лишнего)
Неизменяемые строки в C++? Расскажите, будьте добры, если я чего-то не знаю...
офигенский материал, супер
А потом возникают вопросы:
*"Какого хрена такой низкий ФПС?!"*
или
*"Откуда такие сумасшедшие мин требования?!"*
или
*"Почему такая УЙНЯ занимает NN гигабайт?!"
нужно чуть больше комментариев про O(1), почему не учитывается время вычисления хэш-функции?
Потому что вычисление хэша это константа, а она в нотации большого О не учитывается. Большое О говорит о том, как увеличивается сложность в зависимости от количества данных, поэтому там константа не важна. Действительно, реальная производительность у массива может быть выше на всех операциях при малом размере данных, когда эффект константы больше, чем вклад увеличения сложности.
@@KoMedVed только хэш от строки например не константа 🤔в питоне удобно там все хэши заранее вычислены)
@@tonybard Не знаю как в питоне, но в java строки неизменяемые и хэш считается 1 раз - при создании
@@KoMedVed также, но в плюсах не так)
Dude you ain't talking about quantum physics, it feels like this guy wants to sell you that it's a hard concept. Lol, it's not.
Полезный контент, автор достойно доступным языком всё разжевал👍
гений на челе смог мне объяснить мне принцип работы этой структуры... прошел универ, но так и не понимал, как работают словари и причем тут хеш)) спасибо
Э, в смысле Удзумаки 10, там все 100 должно быть!
А видео четкое:)
Во всех случаях, где больше 1 элемента, хэш таблица быстрее массива
Но ведь часто нужно хранить сортированные данные, для поиска по больше, меньше, ренжам, префиксам.
Так что далеко не всё хэшмапа покрывает.
Саурон был бы в восторге от массивов в PHP.
В питоне хэш мама, по крайней мере взятие элемента и проверка делаются за константу точно
Lua: смотрите, как они извращаются, чтобы достичь 1% моей силы!
Лучший канал по айти
ответ на вопрос: при поиске {"one":1,"two":2} искать по ключу "two" будет быстрее чем искать 2 в массиве [1,2]. если я правильно пончл вопрос..
Написал недавно мапу, сет и мультисет шаблонные) почему я не посмотрел это видео до?)
Топ!
dict в python реализован с помощью хэш-таблицы, а не дерева
А почему вставка и удаление log(n) ? Там же еще перестроение дерева должно быть
Медленно говоришь, можно еще быстрее?
Вот вы говорите что в Хеш таблицах переход происходит по индексу?
Если массив с Int индексами, то теоретически переход происходит к элементу методом умножения к адресу, где непрерывно находятся данные.
Но если Хеш это некая сумма элементов (символов) то как происходит "мгновенный" переход? :)
Ведь всё в итоге компилится в ассемблер и код.
И как бы не очень понятно как без "тупого" перебора таких хеш индексов происходит поиск нужных данных?
Или я что-то пропустил? ;)
Задача в том, чтобы найти индекс по значению. Поиск перебором это простой проход по массиву/списку и сравнение каждого элемента О(N). Очевидно, это не касается деревьев и сортированных массивов (где есть бинарный поиск), O(log n). В хэш-таблице индекс получается из значения вызовом хэш-функции. Соответственно проверяется малое количество элементов (те, у которых совпало значение хэш-функции), O(1).
Только благодарность!
Мужик, это всё хорошо, но когда будет стрим по С++, ну или по написанию Компилятора, очень ждём
было очень интересно
Бро, где обещаенные уроки по С++ ?
2:22 в плюсах строки изменяемые
В стандарте да. Если использовать std::string.
Возможно он имел ввиду const char*
@@cheerwizard21 Согласен, но, например, char* - тоже строка, и она вполне изменяемая)
Инфа полезная и вроде бы даже понятная, но приходится ставить видео на 0.75 :)
Я думаю автору видео очень понравится Кложура.
Все круто, но Juniorу работу хрен найдёшь. А так да, объявления есть 🙂
JS бы еще в примеры добавить...
ребят, подскажите, стоит ли учить Php или Python для Бэк-Энда?
питухон
Годнота!
Контент годный, объяснение самобытное, чёткое, понятное. Вообще канал классный. А вот запомоиться об остопи3девшую всему интернету Скулль-FUСК-тори - это позор. Лучше бы казино какое рекламировал, чем этих вонючих лохотронщиков (они сами признались, что львиная доля бюджета у них идёт на рекламу - скупили почти всех блогеров-проституток - даже Гоблин не устоял, продал свою жопку и честное имя за пачку баксов).
Летс гоооу. Новое видео. Виндертон сделай видео о нейронках
А можешь объяснить, почему поиск в хэшмапе происходит за константное время ? Надо же найти в ней запись с нужным ключом, а для этого нужно пробежаться по всем элементам. Если они отсортированы, то можно использовпть бинарный поиск, но это все равно логарифмическое время, а не константное. В любом случае оно зависит от количества элементов в мапе и константным быть не может.
Потому что, в мапе ключи уникальны и не повторяются, поэтому за O(1), а не за О(n)
Вроде как-то так ))
Одна из реализаций хеш таблицы - это массив бакетов. В каждом бакете хранится список пар (ключ, значение). Чтобы в этом массиве найти ключ, нужно от ключа посчитать хеш (какое-то число, посчитаное каким-нибудь алгоритмом). Если взять остаток от деления хеша на количество бакетов, то получится индекс бакета в массиве. Дальше по этому бакету можно пробежаться и найти нужный ключ. По факту, каждая отдельная операция работает не совсем за константное время, а за количество объектов в бакете, но количество бакетов и хеш функции подбирают так, чтобы в каждом бакете было очень мало элементов. Всякими математическими методами можно доказать, что среднее количество элементов в бакете не растёт с увеличением количества элементов.
Когда элементов в таблице становится больше чем какой-то порог, то количество бакетов увеличивается и все элементы раскидываются заново.
@@user-nh5vg2jr9gЕсли искать не по ключу, а по какому-то другому предикату, то поиск будет O(n), и даже хуже чем в линейном массиве. Потому-что тебе нужно итерироваться по указателях, потом считать память указателя, а потом только использовать предикат.
10:30 хм, вряд ли хэш функция может быть быстрее массива🤔
👍🏻👍🏻👍🏻👍🏻в поддержку, пока не учу плюсы, но попал в реки и в будущем буду смотреть твои видосы. Лайк, подписка)
dict стал ordered начиная с python 3.7, до этого был unordered
Прикольно
Блин я прошёл эту тему на курсе Пайтон, то что ты рассказываешь, вообще нифига не понятно, для других программистов со стажем 5 лет может всё ясно. Для новичков всё быстро сумбурно как то. На других канал даже более сложные темы умудряются рассказать, что всё понятно, тут даже такую простую тему с выносом мозга.
вот уж что-что, а таблицы стоило бы на Lua объяснять
виндертон, удачи тебе, счастья, зайка моя любимая
Выдал базу ;)
Жду ролик на 10 часов по плюсам
А почему комментариев нет? Давайте поддержите молодого программиста
Спасибо.
С ещё 4 слова.
Годный контент 🎉
В стандартной библиотеке питона нету unordered hashmap, нужно создать кастомный класс для своих нужд
👍💯🗣️🗣️💅
питон иногда такой питон...
там всегда unordered, там проблемы дийкстру писать с несортированным сетом, это да
а зачем тебе анордеред? ордеред хэшмапа дает гарантию порядка при перечислении значений, а анордеред не дает. Поэтому ордеред всегда может заменить анордеред но не наоборот.
Я думал, что функция вычисления индекса будет посложнее: hash & (bucket_amount - 1). Или так для упрощения видоса просто слелали?
Это просто оптимизация. Чтобы не вычислять каждый раз остаток от деления (а это довольно тяжёлая операция), делают размер массива равный степени двойки. Тогда остаток от деления будет такой же как в вашей формуле, а битовые операции значительно быстрее вычисления остатка. Но для понимания работы хеш таблицы эта формула не нужна.
8:52 - ни добавить, ни убавить. Квинтесенция.
изучая хештейбл познал основы мироздания
А есть видео, где вы рассказываете о том как перешли от джава к с++?