Что такое SQL ИНДЕКСЫ за 10 минут: Объяснение с примерами

Поділитися
Вставка
  • Опубліковано 1 січ 2023
  • События и статьи про анализ и проектирование ИТ-систем - t.me/itsysdes_events
    В этой статье мы узнаем:
    - Что такое индексация в SQL
    - Для чего нужна индексация
    - Как работает индексация
    - Что такое двоичный поиск
    - Что такое план выполнения запроса
    - Когда лучше использовать индексы
    - Когда лучше НЕ использовать индексы
    - Что такое кластеризованный индекс
    - Что такое некластеризованный индекс
    Поддержать канал разово - yoomoney.ru/to/410012243709514
    Поддержать канал подпиской - boosty.to/listenit
    Я.Дзен - zen.yandex.ru/listenit
    Телеграм-канал - t.me/listenit_channel
    По вопросам сотрудничества - t.me/ed_akimov
    Ссылка на статью 1 - / %d1%81%d1%83%d0%bf%d0%...
    Ссылка на статью 2 - webformyself.com/sql-indeksy/...
    Что такое SQL и реляционные базы данных - • Что такое SQL и реляци...
    Синтаксис SQL запросов: Часть 1 - • Синтаксис SQL запросов...
    Что такое NoSQL за 6 минут - • Что такое NoSQL за 6 м...
    Что такое ACID за 9 минут - • Что такое ACID за 9 минут
    Что такое UML за 7 минут - • Что такое UML за 7 мин...
    Что такое Scrum за 8 минут - • Что такое Scrum за 8 м...
    Обзор Agile - • Обзор Agile. Это метод...
    Приоритизация бэклога за 4 минуты - • Приоритизация бэклога ...
    Что такое Kanban - • Что такое Канбан-метод...
    Что такое Канбан-доска - • Канбан-доска - это не ...
    Что такое HTTP и HTTPS за 9 минут - • Что такое HTTP и HTTPS...
    Машинное обучение для чайников - • Машинное обучение для ...
    Что такое Big Data за 6 минут - • Что такое Big Data за ...
    Что такое CRUD за 6 минут - • Что такое CRUD за 6 минут
    Введение в REST API за 7 минут - • Введение в REST API за...
    Различия REST и SOAP за 4 минуты - • Различия REST и SOAP з...
    Что такое middleware за 7 минут - • Что такое middleware з...
    Что такое UML за 7 минут - • Что такое UML за 7 мин...

КОМЕНТАРІ • 112

  • @user-bx5jw2ws7h
    @user-bx5jw2ws7h Рік тому +88

    10/10 за разъяснение этой темы. Все наглядно и понятно. Проходил обучение по SQL на степике : там это максимально непонятно объяснили. Поделюсь ссылкой в обучении

  • @LeonidYakovlev85
    @LeonidYakovlev85 7 місяців тому +2

    Большое спасибо за выпуск. Интересно, содердательно и информативно 👍

  • @user-kw7vn6vd8k
    @user-kw7vn6vd8k Рік тому +5

    Спасибо за видео. Для начинающих то что надо!
    С Новым Годом!!! Удачи и развития канала!!!

  • @old-empire
    @old-empire Рік тому +2

    Офигенно! Спасибо!

  • @nyaetotmogno
    @nyaetotmogno Рік тому +1

    Спасибо большое! отличная статья!

  • @blindbird1619
    @blindbird1619 2 місяці тому +1

    Очень доходчиво объясняете. Спасибо!

  • @user-le6ix1ud3f
    @user-le6ix1ud3f 5 місяців тому +1

    Спасибо большое. Было очень интересно ❤

  • @natielsanti407
    @natielsanti407 Рік тому +1

    Спасибо за видео!

  • @user-qj5jr8ps8s
    @user-qj5jr8ps8s 2 місяці тому

    Подача огонь, спасибо!

  • @user-qj1sp9ve9c
    @user-qj1sp9ve9c 8 місяців тому +1

    Прекрасная подача материала, ёмко, доступно, понятно; оформление презентаций очень стильное, на манер граф. оболочки под Dos😎 Лайк, подписка, приметил и другие ролики на канале после этого, в частности, оконные функции:).

  • @yandoru
    @yandoru 11 місяців тому +1

    Отлично, спасибо!

  • @cor4win
    @cor4win Рік тому +28

    Странно, что тут не упомянуто самое главное - почему же собственно поиск по индексу быстрее, чем поиск по оригинальному полю таблицы. А все потому что индекс имеет структуру, оптимизированную под поиск, например, сбалансированное дерево в случае sql server.
    Но в целом неплохо, и за дизайн заставок к роликам большой лайк :)

    • @agelyuri
      @agelyuri 11 місяців тому +1

      6:50 объяснение производительности индекса

  • @SuperWolchara
    @SuperWolchara Рік тому +1

    спасибо за разъяснения, сейчас как раз занимаемся оптимизацией индексов из за падения производительности

  • @dmitrylerner1378
    @dmitrylerner1378 Рік тому +3

    В некластерном индексе маленькая ашипка: сначала должен идти shoes, затем sports-) Но в целом это не умаляет вклад автора в доступное и быстрое развитие интересующихся! Спасибо!

  • @shutka80
    @shutka80 7 місяців тому +2

    Классный у тебя канал. Очень понятно рассказываешь о неочевидных вещах. И круто, что раскрываешь принцип работы под капотом, очень помогает понять логику работы, а следовательно и смысл всего происходящего. Спасибо!

    • @ListenIT_channel
      @ListenIT_channel  7 місяців тому

      Спасибо тебе, очень приятно! И, конечно, авторам статей спасибо, прежде всего

  • @user-rt4ye5xg1h
    @user-rt4ye5xg1h Рік тому +1

    От души, парни! С новым годом вас))

  • @user-lq5xw7hm4c
    @user-lq5xw7hm4c 11 місяців тому +1

    прикольно. как раз стало интересно что такое SQL.

  • @andrewbelikov8772
    @andrewbelikov8772 Рік тому +1

    Круто объясняешь! Вначале не понял отличия по индексам, почитал на сайтах, снова глянул и как понял ))) Ну или показалось, что понял )) Пока сам не сделаешь, вроде все понятно

  • @sonic-fan-play4817
    @sonic-fan-play4817 14 днів тому

    от души спасибо было полезно интересно

  • @shmeserworking7596
    @shmeserworking7596 Рік тому +7

    Прекрасная подача материала, приятная речь, минималистичное оформление в стиле DOS вообще блеск. Ставлю 5, давай зачётку))

    • @dingo05
      @dingo05 8 місяців тому

      Вы что препод?

  • @tomozi1
    @tomozi1 Рік тому +1

    Отличная статья

  • @leopard184
    @leopard184 Рік тому +1

    Хороший канал.

  • @Kvit_Domosed
    @Kvit_Domosed Рік тому

    Спасибочки

  • @Cp3aloona
    @Cp3aloona 7 місяців тому +1

    лучший канал, надеюсь тут все ответы получу, на свои вопросы.

    • @ListenIT_channel
      @ListenIT_channel  7 місяців тому

      Буду работать над тем, чтобы получил) Спасибо!

  • @farukhkarimbayev7178
    @farukhkarimbayev7178 Рік тому +8

    Лучший канал, на который подписался в 2022)

  • @firston5360
    @firston5360 Рік тому +1

    Ну это просто 🔥🔥🔥 на пальцах, как ребёнку из детского сада объясняется😅 так и должно быть

  • @user-qv2de6vg2f
    @user-qv2de6vg2f Рік тому

    Thank you

  • @Igor245390
    @Igor245390 Рік тому

    Спасибо, подчерпнул для себя нужную информацию. Но остался вопрос. Если при создании таблици создается столбец и у него есть параметр 'UNIQUE'. Создается ли индекс, по аналогиис полем ID? или что происходит?

  • @user-bt4ew5cc6u
    @user-bt4ew5cc6u Рік тому +1

    огонь )))

  • @akimovvadim4736
    @akimovvadim4736 8 місяців тому

    А вы можете озвучить тот большой курс по Flask опубликованный на habr-е?

  • @abbc1999
    @abbc1999 14 днів тому

    Spasibo

  • @Dima_Bash
    @Dima_Bash Рік тому +1

    Спасибо) Понял как искать нужную инфу в таблицах. До этого просил ребят запрос состряпать)

    • @ListenIT_channel
      @ListenIT_channel  Рік тому

      Круто, что пригодилось) Удачи!

    • @lonelypaul69
      @lonelypaul69 8 місяців тому

      @@ListenIT_channel 9:50 "Методом двоичного поиска находит ..." Как по значению 'electronics' может производится двоичный поиск? Вопрос в том, что непонятно, как находятся все указатели исходя из ключа?

  • @Chel1k7
    @Chel1k7 9 місяців тому

    я правильно понимаю исходя из концовки видео, что ту же таблицу Product в бд магазина лучше не индексировать ? Ибо в ней часто происходят обновления (цен например) и добавления товаров. Тогда почему в самом начале пример про Амазон где явно так же часто происходят обновления товаров

  • @olzhikggg6915
    @olzhikggg6915 Рік тому +1

    молодец

  • @Tolmachovtv
    @Tolmachovtv 3 місяці тому +1

    Дуже просто, доступно і ефективно пояснив! Дякую, натхнення тобі!

  • @user-kk9vl4jd5y
    @user-kk9vl4jd5y Рік тому

    8:30 правильно понимаю, что в product_category_index две последние записи перепутаны местами?

  • @user-hw1gg1mp1f
    @user-hw1gg1mp1f Рік тому

    Очень поверхностно, но для введения в тему за 10 минут хорошо.

  • @user-bk1wk7ey1s
    @user-bk1wk7ey1s 3 місяці тому +1

    Я не понял как по не кластеризованному индексу БД ищет двоичным поиском? Там Id должен быть отсортирован для этого?

  • @jy4apa165
    @jy4apa165 2 місяці тому

    По поводу правильного использования индексов не до конца понял. Что подразумевалось под обновлением БД? Новые какие-либо записи или обновление таблиц при миграциях?

  • @Denisko123
    @Denisko123 Рік тому +3

    Раньше тыркал индексы везде, но админы начали материться. Таблица весит несколько террабайт и почти на каждом поле индекс )

  • @TNamiNa
    @TNamiNa 3 місяці тому

    Очень поверхностно

  • @Kirill.Bogdanovich
    @Kirill.Bogdanovich 6 місяців тому

    Подскажите подажалуйста как делают такие видео? Как делают такую анимацию и где об этом модно узнать подробнее? Оочень буду благодарен вам за ответ)))

  • @sorryladies6191
    @sorryladies6191 3 місяці тому

    Поставил Вайк!

  • @scpfan4302
    @scpfan4302 Рік тому +4

    Кластеризованный индекс не использует первичный ключ для структуризации данных! Первичный ключ служит для целостности данных, и то, что он по умолчанию создаёт кластеризованный индекс - стандартное поведение, а не аксиома

  • @MichailFort
    @MichailFort Рік тому

    Nice)

  • @qlmanlp
    @qlmanlp Місяць тому

    5:44 Как индексы обновляются не будут, если несколько секунд ранее было сказано, что они обновляются после каждого добавления?

  • @walcermelodia
    @walcermelodia Рік тому

    а индексы ускоряют join'ы? когда например ... join ... where id = .... и т.п.

  • @uzurbatya
    @uzurbatya 2 місяці тому

    6:40 Зачем использовать бинарный поиск, когда известен первичный ключ?

  • @arthuryadgarov2375
    @arthuryadgarov2375 Рік тому

    Двоичный поиск очень похож на метод Ньютона для поиска решений уравнений. Это он?

  • @AlexanderZolnikov
    @AlexanderZolnikov Рік тому +2

    Видео, по определениям в нем, относится к мс скл, ван лав, но стоит об этом уточнить. Другие БД могут работать по другому..

  • @SuperWolchara
    @SuperWolchara Рік тому

    а как ведет себя кластеризованный индекс если первичный ключ является составным из двух внешних ключей в таблице и как таковой "физической" колонки первичного ключа нет

  • @racoobina
    @racoobina Рік тому

    А есть подкасты на яндекс-музыке с тем же материалом?

    • @ListenIT_channel
      @ListenIT_channel  Рік тому +1

      Всё планирую, но пока руки не дошли сделать подкаст

  • @yodapunishes
    @yodapunishes 3 місяці тому

    То ли я прослушал, то ли автор не уточнил:
    1. В видео рассмотрен только самый популярный тип BTree
    2. BTree применяется не ко всем типам данных, потому и существуют другие (GIN, GIST, etc)
    3. У других методов доступа (индексов) алгоритмическая сложность другая
    4. Бывают ещё условные, покрывающие, функциональные и другие разновидности индексов

  • @user-ub6cv6nk5u
    @user-ub6cv6nk5u 6 днів тому

    Хотел посмотреть про SQL инъекции, оказалось, что название не правильно прочитал.

  • @don-kg2hh
    @don-kg2hh Рік тому +1

    Вроде поиск по индексам не всегда считается за logn. Все зависит от структуры данных, в которой они и хранятся. Можно выбрать индексацию с помощью хэш-таблицы, где сложность поиска O(1), но есть нюансы, связанные с хранением.

    • @andriipetko8684
      @andriipetko8684 Рік тому +2

      Нюанс заключаеться в том в том что не будут работать с индексом операции , только равенство в запросе. Так как без понимания в "какую сторону" идти бинарный поиск использовать не получиться.

  • @dimass67
    @dimass67 6 місяців тому +1

    На 5.35 примерно какая-то противоречивость которая осталась без объяснения.
    При постоянных обновлениях БД (а именно при добавлении данных как я понял в данном примере) индексы обновляться не будут. При этом ранее было сказано что при добавлении данных сначала обновляется исходная таблица а затем ее индексы.
    Вот через какой промежуток времени между добавлениями, БД будет считаться постоянно обновляемой?.
    И в конце на 10.10 сказано про какие-то столбцы которые часто обрабатываются. Как это связано с предыдущей информацией? Ведь добавление в БД это инсерт а значит добавляется строка со всеми её столбцами. Следовательно обрабатываются все столбцы и их лучше не индексировать.

  • @imuqqieg9274
    @imuqqieg9274 Рік тому +1

    Если таблица делится пополам, и искомые данные есть и в первой и во второй половине таблицы, как тогда поиск происходит?

    • @user-ix4cm7ch5z
      @user-ix4cm7ch5z Рік тому

      скорее всего другой поиск тогда работает ,либо возвращается потом во вторую половину

    • @mihax56
      @mihax56 Рік тому +2

      не существует в природе таблиц, отсортированных по первичному ключу - на диске это всегда фарш. поиск всегда идет по индексу, т.е. бинарному дереву в общем случае.

    • @dmitriypolynin7273
      @dmitriypolynin7273 Рік тому +2

      Поиск идет по отсортированному по условию индексу, файлу индекса, который отдельно от таблицы и много меньше таблицы. После по ссылке прыгаем на запись таблицы. Все это происходит автоматически во время запроса, ничего не нужно мудрить. Если индексы правильно сделаны то работает быстро.
      На собеседованиях умные девочки мнящие себя программистами задают вопросы типа - чем пользуетесь что бы оптимизировать работу БД, подразумевая что ты должен им живо рассказать о владении какой ни будь модной программой оптимизатором. Я всегда говорю что пользуюсь мозгом.

  • @IlyuhaaaSuper
    @IlyuhaaaSuper Рік тому

    В примерах в которых сказано, где лучше не использовать индексы было сказано, что лучше не индексировать столбцы, которые часто обрабатываются. Что понимается под обработкой столбцов?

    • @user-md8gg5ef6c
      @user-md8gg5ef6c 10 місяців тому +1

      скорее всего автор имел ввиду операции UPDATE, т.к. после них обязательно будет реиндекс таблицы, что накладно

    • @uzurbatya
      @uzurbatya 2 місяці тому

      Где там такое сказано? Таймкоды всегда ставь, если хочешь, чтобы тебе ответили

  • @alexalex543
    @alexalex543 3 місяці тому

    Как ищет бинарно число понятно, а как ищет категорию, где значение это строка?? Как он сравнивает текст по бинарному поиску... (пример некластеризованного индекса)? Кто то может пояснить?

    • @yodapunishes
      @yodapunishes 3 місяці тому

      Любой текст это представление в определенной кодировке, то есть где символу соответствует число

  • @renatsu_dev
    @renatsu_dev 4 місяці тому

    Разве индексы не эффективней проверять столбцы на NULL. Мне кажется проиндексированный столбец эффективнее решит задачу SELECT * FROM TABLE WHERE smth IS NOT NULL

  • @arshanskiysergey2791
    @arshanskiysergey2791 11 місяців тому +1

    а зачем нужен кластеризованный индекс, если он полностью копирует колонку с первичным ключом? Почему тогда сразу по таблице и не искать - по этой самой колонке?

    • @arshanskiysergey2791
      @arshanskiysergey2791 10 місяців тому

      наверное для оптимизации: чтобы была возможность быстро выгрузить таблицу индексов в память и найти в ней нужный элемент. А основная таблица может быть во много раз больше, поэтому ее лучше всю без надобности не выгружать.

  • @VaeV1ct1s
    @VaeV1ct1s Рік тому

    Нихрена не понятно. Если у нас записей 'electronics' больше одной, то таблица индексов будет реализовывать o2m? Тогда, нужно будет получить все внешние ключи из индексной таблицы, и для каждого провести поиск по ключу в основной таблице?

  • @volodymyranufriev2553
    @volodymyranufriev2553 Рік тому +2

    При постоянных обновлениях индексы обновляться не будут и станут бесполезны - ну это очень сильное заявление. Если есть БД, где дела именно так обстоят - это какая-то очень ограниченная БД.
    Но заявлять такое про все базы данных - это неправильно.
    В целом ролик симпатичный, но вредный для начинающих, и режет глаз спорными заявлениями для опытных

  • @---fq2cz
    @---fq2cz Рік тому

    4:05. Не бывает САМОГО оптимального пути😅Он либо оптимальный, либо нет. Мой препод дал бы по шапке за это😂

    • @reepka4871
      @reepka4871 Рік тому +2

      Это скорее придирка к словам..
      А так то можно ещё вспомнить, что есть локальные оптимумы, а САМЫЙ оптимальный тогда - отнести глобальному оптимуму 🤷‍♀️

  • @MrCursedsin
    @MrCursedsin Рік тому

    Всё же не совсем понятно, как проверить была ли колонка проиндексирована или нет

  • @o1ego1eg
    @o1ego1eg Рік тому

    когда не использовать индексы: *перечисляются все реальные кейсы :)

  • @Evgeniy19856
    @Evgeniy19856 Рік тому

    Есть ещё фильтрованные индексы.

  • @dmitriypolynin7273
    @dmitriypolynin7273 Рік тому +1

    не мучайтесь, пользуйтесь средой разработки а не websql например dbforge для mysql тогда создание или удаление индексов делается через интерфейс так проще и нагляднее.
    Хотя и синтаксис нужно знать, но так нагляднее и структура видна и данные и индексы и триггеры и все что нужно.

  • @ulmasjonkilichov487
    @ulmasjonkilichov487 Рік тому +1

    Очень вводная информация. Нет ничего про b-tree, hash table, gist и тд

  • @user-bk9mn8de5c
    @user-bk9mn8de5c Рік тому +2

    Очень поверхностное и спорное, нередко просто ошибочное изложение материала. Что-то из серии - попробую понять материал, объясняя его другим. Может автор имел ввиду какую-то конкретную экзотическую СУБД?

  • @MyxaTcakatuha
    @MyxaTcakatuha Рік тому

    в чем разница один индекс на два столбца или два отдельных индекса на эти столбцы? никто нигде этого не объясняет

    • @jumper_in_maple4814
      @jumper_in_maple4814 Рік тому

      Ну вот если у тебя это столбцы "категория" и "подкатегория" и ты напишешь запрос на поиск по отдельности (where category = 1 в одном запросе и where subcategory = 2 в другом), то тогда надо бы 2 индекса, будет больше места занимать.
      А если у тебя связанные поля, когда ты точно знаешь, что нет товаров без категорий и подкатегорий и поиск будешь вести всегда по связным - делаешь индекс на оба поля сразу. Места меньше, индекс один, обновляться будет быстрее. А поиск что так будет быстро работать, что сяк.

  • @AlexanderZolnikov
    @AlexanderZolnikov Рік тому +12

    Видимо, автор, как и я, в прошлом, ms sql разработчик. В той же сап хане, что all memory, постгре, оракле, нет явного деления на кластерные и не кластерные индексы. Так что видео, в целом, такое себе авно. Там все работает по другому, в отличии от мс скл, особенно с тригерами. В той же сап хане, постгре, оракле, нет явного деления на кластерные и не кластерные индексы. Так что видео, в целом, такое себе, мягко говоря, ждал большего. Отчасти, это и моя боль, пока я не стал работать с другими субд и не ощутил разности.. Автор не знает о чем говорит.

    • @turkeyrelocation
      @turkeyrelocation Рік тому +3

      Поддерживаю. Похоже на пересказ статьи ради пересказа, без какого либо погружения в тему. Тогда уж пусть какая-нибудь тян с сексуальным голосом читает текст

    • @dmitriypolynin7273
      @dmitriypolynin7273 Рік тому

      знает, но в рамках мускля , для ознакомления достаточно.

  • @StrangerInTheKy
    @StrangerInTheKy Рік тому +1

    "При постоянных обновлениях БД индексы обновляться не будут" - адская чушь. Как и весь раздел "когда применять индексы".

    • @evgeniynoble6064
      @evgeniynoble6064 11 місяців тому

      Я тоже этого не понял, начал гуглить и ничего не нашел. Объяснит кто?

    • @uzurbatya
      @uzurbatya 2 місяці тому

      Когда народ таймкоды начнёт приводить к своим словам?

  • @hellohowareyou267
    @hellohowareyou267 10 місяців тому

    Фак ё инглиьиш

  • @vladimirlos5432
    @vladimirlos5432 Рік тому

    Триста страниц типовой книги по "введеню в SQL" - за 9 минут... :)

    • @nicholasspezza9449
      @nicholasspezza9449 Рік тому +4

      только дурачки так считают

    • @vladimirlos5432
      @vladimirlos5432 Рік тому

      @@nicholasspezza9449 У вас - проблемы...

    • @nicholasspezza9449
      @nicholasspezza9449 Рік тому +1

      @@vladimirlos5432 не спамь своей чушью, клоун

    • @vladimirlos5432
      @vladimirlos5432 Рік тому

      @@nicholasspezza9449 У вас - очень серьёзные проблемы.

  • @user-rg3sp6yk3b
    @user-rg3sp6yk3b 3 місяці тому

    пилляя, я и сам умею читать, лучше б картинки какие-нибудь запихал вместо бесполезного текста. А так, в принципе, понятный материал, спасибо

  • @nikolosmiron1481
    @nikolosmiron1481 Рік тому +1

    Слабое видео

  • @konanvarvar353
    @konanvarvar353 3 місяці тому

    Нихуя не понял

  • @RoaringOrange
    @RoaringOrange Рік тому +1

    6:29 Кластеризованный индекс использует первичный ключ? Большей бредятины не слышал...