Python парсинг динамических страниц сайтов с JavaScript Ajax

Поділитися
Вставка
  • Опубліковано 14 гру 2024

КОМЕНТАРІ • 79

  • @aquabogira
    @aquabogira Рік тому +4

    Python Hub Studio,
    Ваши простые и понятные объяснения СЛОЖНЫХ ВОПРОСОВ делают обучение настоящим удовольствием.
    Благодарю за возможность воспользоваться вашим ПРОФЕССИОНАЛИЗМОМ!
    Спасибо за ценные уроки и поддержку!

  • @ДанилЕфимов-г9п
    @ДанилЕфимов-г9п Рік тому +6

    Еще одна огромная благодарность вам. Очень благодарен вам за ваш труд. Бриллиант в океане туториалов! 💎

  • @Vladislav_Maliuk
    @Vladislav_Maliuk 2 роки тому +8

    Спасибо за урок! Как всегда информативно и доступным языком👍

  • @raketa12
    @raketa12 2 роки тому +5

    это чудо. ролик по requests появился через день, после того как я начал изучать эту библиотеку. вчера я столкнулся проблемами в практике по парсингу, и тут это видео! лайк

  • @АрсланОчиров-щ5д
    @АрсланОчиров-щ5д 2 роки тому +3

    Лайк и благодарность по умолчанию 👍

  • @АндрейМиронов-в3с
    @АндрейМиронов-в3с 8 місяців тому

    Нашёл, что искал. Спсибо, Python Hub Studio!

  • @igorratnik2357
    @igorratnik2357 Рік тому

    Спасибо, все четенько, по делу и без лишней воды!

  • @stradys
    @stradys Рік тому +2

    Спасибо за видео! Понятно объясняете, приятно смотреть. Сделайте также пожалуйста урок с использованием Selenium для динамических сайтов. Думаю многим пригодится.

  • @limonello1964
    @limonello1964 3 місяці тому

    огромное спасибо благодаря знанию что хчр это инъекция быстро выполнил свою задачу

  • @oleg3141
    @oleg3141 2 роки тому +2

    Спасибо!! Отличный урок.

  • @aleksejborovinskij1155
    @aleksejborovinskij1155 Рік тому

    Спасибище! Однозначно в закладки видео.

  • @negonifas
    @negonifas 2 роки тому +2

    Спасибо тебе добрый человек

  • @nickalt2585
    @nickalt2585 5 місяців тому

    Оч крутой разбор, спасибо!

  • @birdwatcher_channel
    @birdwatcher_channel Рік тому

    Видео очень понравилось. лайк не забыли поставить)

  • @alikhanguluzada9576
    @alikhanguluzada9576 2 роки тому +2

    Спасибо большое!

  • @mylife-ej8et
    @mylife-ej8et 2 роки тому +2

    Хороший видос

  • @fsoky
    @fsoky Рік тому

    Полезная информация, спасибо ;3

  • @iprahka
    @iprahka Рік тому

    Супер полезный видос

  • @Вадим-ф9ч9ш
    @Вадим-ф9ч9ш 9 місяців тому +1

    Пол года назад, начал учить Пайтон язык, по вашим Видео урокам
    И...? Я стал маленьким программистом)
    Я успешно сдал свой первый заказ на фрилансе и продолжаю дальше учится!)
    Но остается много тумана и неясностей
    В частности, если web разработка не зашла, а именно frontend (backend ещё норм), куда ещё можно посмотреть? На чем ещё можно зарабатывать?
    За аналитиков данных , или машинное обучение вы что-то знаете? Там интересно?)

    • @PythonHubStudio
      @PythonHubStudio  9 місяців тому +1

      Я так понимаю автоматизация, вроде парсинга и ботов в портфолио тоже есть... Аналитика и ML очень хорошая тема, но не особо для фриланса с нуля, так как уровень ответственности с точки зрения заказчика намного выше, и разнородность требований/задач больше, а значит количество заказов на старте которые вы сможете взять меньше. Это если про фриланс. А так, то направление максимально перспективное.

  • @trotskijandrew
    @trotskijandrew Рік тому

    Спасибо ! Много подчерпунул

  • @NiceAndNeat
    @NiceAndNeat Місяць тому

    Здравствуйте! Пытаюсь спарсить телефонный справочник, но там разные url в запросе и ответе, есть токены, api в url запросов и я вообще не могу понять что делать и куда копать. Вроде бы можно сделать через селениум, но хотелось бы разобраться и сделать без него. Помогите

  • @Tak0ri
    @Tak0ri 10 місяців тому

    Пробовал потренироваться парсить защищенные сайты. Пока не получается вытащить json простым get запросом. Хотя если в браузере на странице посмотреть в инспекторе где XHR там все JSON, которые через API получаются можно найти. Вариант только через selenium? Или может есть какой путь более быстрый?

  • @mak32
    @mak32 2 роки тому +1

    Разберите пожалуйста обновлённый selenium

  • @DmitryMartynov-w8s
    @DmitryMartynov-w8s Рік тому +1

    Здравствуйте. Не могли бы Вы подсказать, почему Chrome не видит "ajaxdetail/" и прочие такие файлы, в чем может быть проблема?

    • @PythonHubStudio
      @PythonHubStudio  Рік тому

      Все браузеры это видят, только может называться вкладка по другому xhr, fetch, ajax, и тд

    • @franek-82
      @franek-82 Рік тому

      @@PythonHubStudio У меня тоже в браузере не отображается ajaxdetail/. На вкладке xhr/fetch вместо него стоит: ?sentry_key=547...., у которого статус 200 и POST-запрос, а не GET. На вкладке "Ответ/отклик" - пустой словарь. Можете подсказать почему так?

    • @franek-82
      @franek-82 Рік тому

      Разобрался в чём дело. Надо было кликнуть на другую страницу ("Mimicking Ajax requests") и уже там смотреть html-код.

  • @ЮраКуличенко-ф1н

    Добрый день!
    подскажите пожалуйста, как собрать информацию с сайта вайберриз а именно на каком месте находиться мой товар по различным запросам, возможно ли научиться этому с помощью PYTHON?

  • @aishuu848
    @aishuu848 Рік тому +3

    А что делать если на сайте не обновляется page в ссылке?

    • @ce2434
      @ce2434 2 місяці тому

      И не должно обновляться, это скрытая пагинация, сайт просто делает инъекцию при скроле страницы вниз. Советую использовать вебдрайвер для этих целей, легче получается и имитация работы пользователя

  • @man_with-no_name
    @man_with-no_name Рік тому

    Можно к вам куда-нибудь лично обратиться по вопросу парсинга?

  • @BelllLabs
    @BelllLabs Рік тому

    Здравствуйте, автор канала! Спасибо за контент! Какие источники информации (книги, ютуб.каналы, сайты) по Питону можете посоветовать новичку и вообще что нужно знать начинающему фрилансеру?

  • @bill8126
    @bill8126 Рік тому

    Привет, расскажи почему используешь Интернет Експлорер ? В чем плюсы ?

  • @LifterAndy
    @LifterAndy Рік тому +1

    Спасибо!

  • @alexlogan4678
    @alexlogan4678 Рік тому

    Хм, а как отработал print(response['title'])? в питоне возвращает ошибку формируется список а не словарь "TypeError: list indices must be integers or slices, not str". Через цикл For работает. for item in response:
    print(item['title'])

  • @ivan_lapitski
    @ivan_lapitski Рік тому

    подскажите пожалуйста, как распарсить сайт Майкрософта? нужно распарсить карточки с играми, а способ с видоса не работает, никак разобраться не моуг (((

  • @ЮрійМММ
    @ЮрійМММ 2 роки тому +1

    Респект

  • @fanteam5179
    @fanteam5179 10 місяців тому

    Что делать если обрезали доступ к этой ссылке. Когда захожу по по подобной ссылке из url-запроса то мне пишет: 403 Forbidden
    nginx/1.18.0. Но на сайте можно открыть нужную мне информацию по нажатию кнопки и появится модальное окно, (которое не видно в элементе без нажатия этой кнопки). Можно ли как-то с помощью requests нажать на эту кнопку чтобы потом взять элементы из этого модального окна?

  • @MrBooomsik
    @MrBooomsik Рік тому

    Добрый день, а geekjob возможно спарсить? Не будет ролика как это сделать?

    • @PythonHubStudio
      @PythonHubStudio  Рік тому

      Ролика не будет как этот ресурс парсить, парсинг на канале есть только в качестве тренинга для начинающих, чтоб была практика по python и понимание в запросах. Это не благодарное дело(парсинг), поэтому хоть и можно спарсить любой сайт и попытаться на этом заработать, как это делать обходя блокировки выпускать видео не буду. Это никому не нужно, это не то чем нужно себя занять в программировании.

  • @alexandrx6449
    @alexandrx6449 Рік тому

    Спасибо за видео!
    Подскажите пожалуйста есть ли сейчас возможность парсить avito? что только не использовал, ответ всегда 403 при попытке установить соединение на стартовой странице

    • @ДжонСмит-ч5ь
      @ДжонСмит-ч5ь Рік тому

      неделю назад написал его на Selenium отлично работает, но для моего случая нужна была авторизация в начале по смс для получения большего числа данных

  • @giftingif7667
    @giftingif7667 Рік тому

    На 14 минуте вы сказали про код 200 и код 300 с копеечкой и про перенаправление. А если на сайте есть перенаправление и 304 код, то как тогда быть? И если не xhr, а fetch запрос и ещё есть graphql. Будут ли видео про парсинг ещё у вас?

    • @orthodox-chanel
      @orthodox-chanel Місяць тому

      все коды 200 по умолчанию успешные, задай диапазон status >=200 and < 300, если хочешь знать причины ошибки 5хх(серверна) или 4хх(клиентская) делай так-же а лучше оберни в try exception чтобы ловить полный лог ошибок и понимать что с ней дальше делать. Но если я не ошибаюсь можео еще сделать status.success и он сам решит успешный это код или нет

  • @CrazyDark
    @CrazyDark 2 роки тому

    Будет ли видео по JS и React ?

  • @badgearlogo
    @badgearlogo 2 місяці тому

    А можно через питон спарсить запросом, если подгружает скриптом js и ответ я получаю jsonом

  • @reddmon7213
    @reddmon7213 11 місяців тому

    давай видео как парсить сайты с каптчей запросами(без селениума) пожалуйста

  • @Ia-Magnifico
    @Ia-Magnifico Місяць тому

    Сейчас пробую на другом сайте и там всё совершенно по другому. Уже четыре часа вожусь и не могу понять что и где!

  • @ГюставЭйфель-б3б

    ошибка TypeError: 'str' object is not callable

  • @MadinaAbaeva-b4w
    @MadinaAbaeva-b4w Рік тому

    Здравствуйте, у меня есть 30 тыс ссылок и мне нужно из каждой ссылки собрать - артикул, описание и картинку. Заметила, что сайт не любит большое количество запросов. Есть ли способ обойти эту защиту используя прокси или что-то другое. Хотела купить прокси, но это дорого

    • @imeyk
      @imeyk Рік тому

      Выставить задержку? И есть бесплатные прокси.

    • @alexbritwa9873
      @alexbritwa9873 Рік тому

      33 рубля в месяц вовсе не дорого

  • @eugenex8892
    @eugenex8892 Рік тому

    Как это без обновления страницы? Страница-же обновилась... Ты имеешь ввиду БЕЗ ЗАГРУЗКИ/ПЕРЕЗАГРУЗКИ страницы....

  • @luispakvard5681
    @luispakvard5681 2 роки тому +1

    А помните вы видео записали как сделать Питон флешку а я написал скрипт который парсит мой гитхаб и выводит список менюшку с питон скриптами когда выбираете оно скачивает и запускает я так могу прийти в офис и напоназапускать своих скриптов на любом компе где пайтон не установлен ну и скрипт который ищет питон скрипты на моей флешке и запускает в виртуальном окружении venv

  • @ismailagasiev
    @ismailagasiev 2 роки тому

    Привет! Как можно задонатить тебе из России?

  • @metanlife9476
    @metanlife9476 2 роки тому

    Можешь сделать видео что нужно знать для data science для устройство на работу)

  • @usyf14
    @usyf14 2 роки тому

    Уважаемый автор, я прошел ваш семичасовой курс по Python и хочу поблагодарить вас за проделанную работу, но в моей стране нет функций спасибо. Как бы я смог отправить вам денег?

  • @ЕгорГуторов-р7я
    @ЕгорГуторов-р7я 2 роки тому

    Всем привет!
    Кто знает, как обойти вот это?
    Ваш браузер не смог пройтипроверку.Для доступа к веб-ресурсу включите в настройках вашего веб-браузера поддержку JavaScript или воспользуйтесь другим веб-браузером, который поддерживает JavaScript.

    • @firstandlast4435
      @firstandlast4435 2 роки тому +1

      Попробуй с помощью selenium загружать страницу, и потом уже сохранять ее и отправллять в bs4.
      Это может быть не очень хороший совет потому как я сам только учусь, но если я правильно понял твою проблему, то selenium поможет

    • @ЕгорГуторов-р7я
      @ЕгорГуторов-р7я 2 роки тому

      @@firstandlast4435 Спасибо за комментарий!
      Да, я как раз и использовал selenium. Но , увидев данный ролик, подумал, что смогу справляться с задачей скроллинга на сайте и без selenium.
      Протестировал через requests, но сервер не пускает меня, потому что, как понял, не прохожу проверку на "человечность".

    • @firstandlast4435
      @firstandlast4435 2 роки тому

      @@ЕгорГуторов-р7я мне по сообщению показалось что сайт проверяет не на человечеость а на совместимость с яваскрипт, так как использует его для отображения контента. Это логичная проверка и я думаю что отнюдь нередкая

    • @firstandlast4435
      @firstandlast4435 2 роки тому

      @@ЕгорГуторов-р7я просто насколько я знаю когда то не все браузеры поддерживали яваскрипт. Хотя сейчас все популярные браузеры это делают

    • @ЕгорГуторов-р7я
      @ЕгорГуторов-р7я 2 роки тому

      @@firstandlast4435
      Попробую через selenium зайти и в метод get отправлять запросы имитирующие скроллинг. Но почему-то у меня устоявшийся в голове принцип, что селениум чисто для имитации действий пользователя, и что он не может в запросы API.

  • @ArchieWh1te
    @ArchieWh1te 2 роки тому

    почему не использовать Pycharm ? VS Code смотрится фигово

    • @PythonHubStudio
      @PythonHubStudio  2 роки тому +3

      Или наоборот.
      И для меня важны преимущества vscode, а VStudio чрезмерно тюнингованая.

  • @АркадийНалимов-р1э
    @АркадийНалимов-р1э 3 місяці тому

    Под каждым видео такие эмоциональные комменты... Сектанты прям 😂 хоть 1 конструктивная критика автора есть где??

  • @everything_is_simple8
    @everything_is_simple8 Рік тому

    Это не парсинг динамических страниц
    А парсинг страниц которые присылают json

    • @PythonHubStudio
      @PythonHubStudio  Рік тому

      В этом видео парсинг по ajax запросам, которые сайт отрисовывает динамически(без перезагрузки) по средствам JavaScript - json и фрагменты разметки.

    • @everything_is_simple8
      @everything_is_simple8 Рік тому

      @@PythonHubStudio сайт ничего не отрисовывает, рендерит драйвер.... поэтому как я и сказал это не то, я искал как без этого ссаного хром драйвера + селениум который жрет кучу ресурсов получать уже отрендеренные страницы

  • @Cyr173
    @Cyr173 Рік тому +1

    задержка time.random излишняя.

    • @ДжонСмит-ч5ь
      @ДжонСмит-ч5ь Рік тому

      вообще не понял зачем она? для обхода антипарсиноговой блокировки?