Python парсинг динамических страниц сайтов с JavaScript Ajax

Python Hub Studio

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 14 гру 2024

КОМЕНТАРІ • 79

@aquabogira Рік тому ⁺⁴
Python Hub Studio,
Ваши простые и понятные объяснения СЛОЖНЫХ ВОПРОСОВ делают обучение настоящим удовольствием.
Благодарю за возможность воспользоваться вашим ПРОФЕССИОНАЛИЗМОМ!
Спасибо за ценные уроки и поддержку!
@ДанилЕфимов-г9п Рік тому ⁺⁶
Еще одна огромная благодарность вам. Очень благодарен вам за ваш труд. Бриллиант в океане туториалов! 💎
@Vladislav_Maliuk 2 роки тому ⁺⁸
Спасибо за урок! Как всегда информативно и доступным языком👍
@raketa12 2 роки тому ⁺⁵
это чудо. ролик по requests появился через день, после того как я начал изучать эту библиотеку. вчера я столкнулся проблемами в практике по парсингу, и тут это видео! лайк
@АрсланОчиров-щ5д 2 роки тому ⁺³
Лайк и благодарность по умолчанию 👍
@АндрейМиронов-в3с 8 місяців тому
Нашёл, что искал. Спсибо, Python Hub Studio!
@igorratnik2357 Рік тому
Спасибо, все четенько, по делу и без лишней воды!
@stradys Рік тому ⁺²
Спасибо за видео! Понятно объясняете, приятно смотреть. Сделайте также пожалуйста урок с использованием Selenium для динамических сайтов. Думаю многим пригодится.
@limonello1964 3 місяці тому
огромное спасибо благодаря знанию что хчр это инъекция быстро выполнил свою задачу
@oleg3141 2 роки тому ⁺²
Спасибо!! Отличный урок.
@aleksejborovinskij1155 Рік тому
Спасибище! Однозначно в закладки видео.
@negonifas 2 роки тому ⁺²
Спасибо тебе добрый человек
@nickalt2585 5 місяців тому
Оч крутой разбор, спасибо!
@birdwatcher_channel Рік тому
Видео очень понравилось. лайк не забыли поставить)
@alikhanguluzada9576 2 роки тому ⁺²
Спасибо большое!
@mylife-ej8et 2 роки тому ⁺²
Хороший видос
@fsoky Рік тому
Полезная информация, спасибо ;3
@iprahka Рік тому
Супер полезный видос
@Вадим-ф9ч9ш 9 місяців тому ⁺¹
Пол года назад, начал учить Пайтон язык, по вашим Видео урокам
И...? Я стал маленьким программистом)
Я успешно сдал свой первый заказ на фрилансе и продолжаю дальше учится!)
Но остается много тумана и неясностей
В частности, если web разработка не зашла, а именно frontend (backend ещё норм), куда ещё можно посмотреть? На чем ещё можно зарабатывать?
За аналитиков данных , или машинное обучение вы что-то знаете? Там интересно?)
@PythonHubStudio 9 місяців тому ⁺¹
Я так понимаю автоматизация, вроде парсинга и ботов в портфолио тоже есть... Аналитика и ML очень хорошая тема, но не особо для фриланса с нуля, так как уровень ответственности с точки зрения заказчика намного выше, и разнородность требований/задач больше, а значит количество заказов на старте которые вы сможете взять меньше. Это если про фриланс. А так, то направление максимально перспективное.
@trotskijandrew Рік тому
Спасибо ! Много подчерпунул
@NiceAndNeat Місяць тому
Здравствуйте! Пытаюсь спарсить телефонный справочник, но там разные url в запросе и ответе, есть токены, api в url запросов и я вообще не могу понять что делать и куда копать. Вроде бы можно сделать через селениум, но хотелось бы разобраться и сделать без него. Помогите
@Tak0ri 10 місяців тому
Пробовал потренироваться парсить защищенные сайты. Пока не получается вытащить json простым get запросом. Хотя если в браузере на странице посмотреть в инспекторе где XHR там все JSON, которые через API получаются можно найти. Вариант только через selenium? Или может есть какой путь более быстрый?
@mak32 2 роки тому ⁺¹
Разберите пожалуйста обновлённый selenium
@DmitryMartynov-w8s Рік тому ⁺¹
Здравствуйте. Не могли бы Вы подсказать, почему Chrome не видит "ajaxdetail/" и прочие такие файлы, в чем может быть проблема?
@PythonHubStudio Рік тому
Все браузеры это видят, только может называться вкладка по другому xhr, fetch, ajax, и тд
@franek-82 Рік тому
@@PythonHubStudio У меня тоже в браузере не отображается ajaxdetail/. На вкладке xhr/fetch вместо него стоит: ?sentry_key=547...., у которого статус 200 и POST-запрос, а не GET. На вкладке "Ответ/отклик" - пустой словарь. Можете подсказать почему так?
@franek-82 Рік тому
Разобрался в чём дело. Надо было кликнуть на другую страницу ("Mimicking Ajax requests") и уже там смотреть html-код.
@ЮраКуличенко-ф1н Рік тому
Добрый день!
подскажите пожалуйста, как собрать информацию с сайта вайберриз а именно на каком месте находиться мой товар по различным запросам, возможно ли научиться этому с помощью PYTHON?
@aishuu848 Рік тому ⁺³
А что делать если на сайте не обновляется page в ссылке?
@ce2434 2 місяці тому
И не должно обновляться, это скрытая пагинация, сайт просто делает инъекцию при скроле страницы вниз. Советую использовать вебдрайвер для этих целей, легче получается и имитация работы пользователя
@man_with-no_name Рік тому
Можно к вам куда-нибудь лично обратиться по вопросу парсинга?
@BelllLabs Рік тому
Здравствуйте, автор канала! Спасибо за контент! Какие источники информации (книги, ютуб.каналы, сайты) по Питону можете посоветовать новичку и вообще что нужно знать начинающему фрилансеру?
@bill8126 Рік тому
Привет, расскажи почему используешь Интернет Експлорер ? В чем плюсы ?
@LifterAndy Рік тому ⁺¹
Спасибо!
@alexlogan4678 Рік тому
Хм, а как отработал print(response['title'])? в питоне возвращает ошибку формируется список а не словарь "TypeError: list indices must be integers or slices, not str". Через цикл For работает. for item in response:
print(item['title'])
@ivan_lapitski Рік тому
подскажите пожалуйста, как распарсить сайт Майкрософта? нужно распарсить карточки с играми, а способ с видоса не работает, никак разобраться не моуг (((
@ЮрійМММ 2 роки тому ⁺¹
Респект
@fanteam5179 10 місяців тому
Что делать если обрезали доступ к этой ссылке. Когда захожу по по подобной ссылке из url-запроса то мне пишет: 403 Forbidden
nginx/1.18.0. Но на сайте можно открыть нужную мне информацию по нажатию кнопки и появится модальное окно, (которое не видно в элементе без нажатия этой кнопки). Можно ли как-то с помощью requests нажать на эту кнопку чтобы потом взять элементы из этого модального окна?
@MrBooomsik Рік тому
Добрый день, а geekjob возможно спарсить? Не будет ролика как это сделать?
@PythonHubStudio Рік тому
Ролика не будет как этот ресурс парсить, парсинг на канале есть только в качестве тренинга для начинающих, чтоб была практика по python и понимание в запросах. Это не благодарное дело(парсинг), поэтому хоть и можно спарсить любой сайт и попытаться на этом заработать, как это делать обходя блокировки выпускать видео не буду. Это никому не нужно, это не то чем нужно себя занять в программировании.
@alexandrx6449 Рік тому
Спасибо за видео!
Подскажите пожалуйста есть ли сейчас возможность парсить avito? что только не использовал, ответ всегда 403 при попытке установить соединение на стартовой странице
@ДжонСмит-ч5ь Рік тому
неделю назад написал его на Selenium отлично работает, но для моего случая нужна была авторизация в начале по смс для получения большего числа данных
@giftingif7667 Рік тому
На 14 минуте вы сказали про код 200 и код 300 с копеечкой и про перенаправление. А если на сайте есть перенаправление и 304 код, то как тогда быть? И если не xhr, а fetch запрос и ещё есть graphql. Будут ли видео про парсинг ещё у вас?
@orthodox-chanel Місяць тому
все коды 200 по умолчанию успешные, задай диапазон status >=200 and < 300, если хочешь знать причины ошибки 5хх(серверна) или 4хх(клиентская) делай так-же а лучше оберни в try exception чтобы ловить полный лог ошибок и понимать что с ней дальше делать. Но если я не ошибаюсь можео еще сделать status.success и он сам решит успешный это код или нет
@CrazyDark 2 роки тому
Будет ли видео по JS и React ?
@badgearlogo 2 місяці тому
А можно через питон спарсить запросом, если подгружает скриптом js и ответ я получаю jsonом
@PythonHubStudio 2 місяці тому
просто requests
@reddmon7213 11 місяців тому
давай видео как парсить сайты с каптчей запросами(без селениума) пожалуйста
@Ia-Magnifico Місяць тому
Сейчас пробую на другом сайте и там всё совершенно по другому. Уже четыре часа вожусь и не могу понять что и где!
@ГюставЭйфель-б3б Рік тому
ошибка TypeError: 'str' object is not callable
@MadinaAbaeva-b4w Рік тому
Здравствуйте, у меня есть 30 тыс ссылок и мне нужно из каждой ссылки собрать - артикул, описание и картинку. Заметила, что сайт не любит большое количество запросов. Есть ли способ обойти эту защиту используя прокси или что-то другое. Хотела купить прокси, но это дорого
@imeyk Рік тому
Выставить задержку? И есть бесплатные прокси.
@alexbritwa9873 Рік тому
33 рубля в месяц вовсе не дорого
@eugenex8892 Рік тому
Как это без обновления страницы? Страница-же обновилась... Ты имеешь ввиду БЕЗ ЗАГРУЗКИ/ПЕРЕЗАГРУЗКИ страницы....
@PythonHubStudio Рік тому ⁺¹
Игра слов
@luispakvard5681 2 роки тому ⁺¹
А помните вы видео записали как сделать Питон флешку а я написал скрипт который парсит мой гитхаб и выводит список менюшку с питон скриптами когда выбираете оно скачивает и запускает я так могу прийти в офис и напоназапускать своих скриптов на любом компе где пайтон не установлен ну и скрипт который ищет питон скрипты на моей флешке и запускает в виртуальном окружении venv
@PythonHubStudio 2 роки тому
Круто!
@ismailagasiev 2 роки тому
Привет! Как можно задонатить тебе из России?
@metanlife9476 2 роки тому
Можешь сделать видео что нужно знать для data science для устройство на работу)
@usyf14 2 роки тому
Уважаемый автор, я прошел ваш семичасовой курс по Python и хочу поблагодарить вас за проделанную работу, но в моей стране нет функций спасибо. Как бы я смог отправить вам денег?
@Nightmare-sw4nz 2 роки тому
описание смотри
@ЕгорГуторов-р7я 2 роки тому
Всем привет!
Кто знает, как обойти вот это?
Ваш браузер не смог пройтипроверку.Для доступа к веб-ресурсу включите в настройках вашего веб-браузера поддержку JavaScript или воспользуйтесь другим веб-браузером, который поддерживает JavaScript.
@firstandlast4435 2 роки тому ⁺¹
Попробуй с помощью selenium загружать страницу, и потом уже сохранять ее и отправллять в bs4.
Это может быть не очень хороший совет потому как я сам только учусь, но если я правильно понял твою проблему, то selenium поможет
@ЕгорГуторов-р7я 2 роки тому
@@firstandlast4435 Спасибо за комментарий!
Да, я как раз и использовал selenium. Но , увидев данный ролик, подумал, что смогу справляться с задачей скроллинга на сайте и без selenium.
Протестировал через requests, но сервер не пускает меня, потому что, как понял, не прохожу проверку на "человечность".
@firstandlast4435 2 роки тому
@@ЕгорГуторов-р7я мне по сообщению показалось что сайт проверяет не на человечеость а на совместимость с яваскрипт, так как использует его для отображения контента. Это логичная проверка и я думаю что отнюдь нередкая
@firstandlast4435 2 роки тому
@@ЕгорГуторов-р7я просто насколько я знаю когда то не все браузеры поддерживали яваскрипт. Хотя сейчас все популярные браузеры это делают
@ЕгорГуторов-р7я 2 роки тому
@@firstandlast4435
Попробую через selenium зайти и в метод get отправлять запросы имитирующие скроллинг. Но почему-то у меня устоявшийся в голове принцип, что селениум чисто для имитации действий пользователя, и что он не может в запросы API.
@ArchieWh1te 2 роки тому
почему не использовать Pycharm ? VS Code смотрится фигово
@PythonHubStudio 2 роки тому ⁺³
Или наоборот.
И для меня важны преимущества vscode, а VStudio чрезмерно тюнингованая.
@АркадийНалимов-р1э 3 місяці тому
Под каждым видео такие эмоциональные комменты... Сектанты прям 😂 хоть 1 конструктивная критика автора есть где??
@everything_is_simple8 Рік тому
Это не парсинг динамических страниц
А парсинг страниц которые присылают json
@PythonHubStudio Рік тому
В этом видео парсинг по ajax запросам, которые сайт отрисовывает динамически(без перезагрузки) по средствам JavaScript - json и фрагменты разметки.
@everything_is_simple8 Рік тому
@@PythonHubStudio сайт ничего не отрисовывает, рендерит драйвер.... поэтому как я и сказал это не то, я искал как без этого ссаного хром драйвера + селениум который жрет кучу ресурсов получать уже отрендеренные страницы
@Cyr173 Рік тому ⁺¹
задержка time.random излишняя.
@ДжонСмит-ч5ь Рік тому
вообще не понял зачем она? для обхода антипарсиноговой блокировки?

Наступне

Автоматичне відтворення

Python requests http, https запросы, requests методы get и post, подключаемся к api через python