gracias lasfito, eres un crack, muchisimas gracias por hacer contenido de tanta calidad :) esta clase es digna de verla una y otra vez por toda su calidad en todos los sentidos y por los varios detalles de genialidades que contiene. Enfocado genialmente en todos los sentidos, incluso en el literal con el codigo genial como puro y bien cerca :)
pense que solo se podia con Python, y selenium, seria genia que hagas un video de como ingresar a una pagina y hace ciertos clics o guarda informacion.
Hermano que buen video, algo ando haciendo mal que la primera vez que lo hice lo hice de mi manera y no me funsiono despues copie tu codigo y el mismo problema :( sin embargo aqui sigo tratando de encontrar el por que. gracias por el video!!!
@@lasfito internal/process/promises:288 triggerUncaughtException(err, true /* fromPromise */); ^ page.waitForNavigation: Timeout 30000ms exceeded. =========================== logs =========================== waiting for navigation until "networkidle" ============================================================ es a timeoutError. por alguna razon no este es el error que me a parece, no uso mucho javascrip pero por el momento tengo un preyecto con python selenium y queria ver otras posibilidade de hacer scrapping en tik-tok pero he tenido algunos problemas con la automatizacion de login. cualquier opinion seria buena!!!
Ahí es más complicado porque tendrías que iniciar sesión en Google en el navegador de playwright, con lo cual Google podría tomarlo como bot y no pasaría. Lo que podrías hacer es que la sesión esté iniciada y tengas los datos guardados al momento de lanzar el navegador con playwright, pero me parece que cuando se inicia la instancia de browser parte de cero datos compartidos 🤔
@@lasfito Existe una función llamada "reuse authentication state" y permite guardar la sesión para que el navegador que abra playwright sea el que contiene esta.
Significa que hubo un problema con la carga de la página o que el markup del sitio cambió. Puedes tomar una captura de pantalla para revisar el estado de la página
Para ese video no tengo repo. Lograste resolver el problema? El error de autenticación es con IG? Lo más seguro es que sea Meta quien te bloquee porque deben tener rastreo de bots y el scrapping entra en esa definición
Eso es porque la página tardó más de 30 segundos cargando contenido. Por defecto tiene 30s como límite, puedes desactivarlo o cambiar el método de networkiddle a otro "trigger" para saber cuando haya terminado de cargar.
graciass!! me estaba peleando mucho con playwright porfin encuentro un video que va al grano y explica sencillamente 😆
Espero que te haya servido 🤙🏼
gracias lasfito, eres un crack, muchisimas gracias por hacer contenido de tanta calidad :) esta clase es digna de verla una y otra vez por toda su calidad en todos los sentidos y por los varios detalles de genialidades que contiene. Enfocado genialmente en todos los sentidos, incluso en el literal con el codigo genial como puro y bien cerca :)
Gracias, tal parece que a este volviste jaja
Veamos si el destino te trae de nuevo en algun futuro 🤙🏼
Excelente video hermano, estuve esperándolo. Explicas de lo mejor 10/10
Gracias, Fer
Espero que te haya servido
Saludos 🤙🏼
excelente video , gracias compa , estas mamadisimo
Jajaja
Un leve 7u7
pense que solo se podia con Python, y selenium, seria genia que hagas un video de como ingresar a una pagina y hace ciertos clics o guarda informacion.
Sí, es buena idea de video. Más adelante haré uno así ✌🏼
@@lasfito gracias
Por nada
hola por que me pasa que await page.type('input[name="q"]',query); type aparece tachado como si no funcionara
justo aprendí a hacer scraping con python :D
Si aprendes con JS serás imparable :v
@@lasfito eso espero :v
una consulta los comparadores de precios hacen web scraping para obtener los datos como el precio, la actualización de ofertas de los ecommerce?
La mayoría usa una combinación de scrapping/APIs
Hermano que buen video, algo ando haciendo mal que la primera vez que lo hice lo hice de mi manera y no me funsiono despues copie tu codigo y el mismo problema :( sin embargo aqui sigo tratando de encontrar el por que. gracias por el video!!!
Hola, Ángel
¿tendrás algún código de error?
@@lasfito
internal/process/promises:288
triggerUncaughtException(err, true /* fromPromise */);
^
page.waitForNavigation: Timeout 30000ms exceeded.
=========================== logs ===========================
waiting for navigation until "networkidle"
============================================================
es a timeoutError. por alguna razon no
este es el error que me a parece, no uso mucho javascrip pero por el momento tengo un preyecto con python selenium y queria ver otras posibilidade de hacer scrapping en tik-tok pero he tenido algunos problemas con la automatizacion de login.
cualquier opinion seria buena!!!
Exclente video, ¿y para el caso en que quiero información de una web con un usuario google en especial?
Ahí es más complicado porque tendrías que iniciar sesión en Google en el navegador de playwright, con lo cual Google podría tomarlo como bot y no pasaría. Lo que podrías hacer es que la sesión esté iniciada y tengas los datos guardados al momento de lanzar el navegador con playwright, pero me parece que cuando se inicia la instancia de browser parte de cero datos compartidos 🤔
@@lasfito Existe una función llamada "reuse authentication state" y permite guardar la sesión para que el navegador que abra playwright sea el que contiene esta.
No la conocía, suena muy bien. Le echaré un ojo, gracias ✌🏼
Para desplegar este script de scraping alguna opción que no requiera un path ejecutable?
No que yo sepa
que alternativas me recomiendas para los proyectos que no usan node, solo JS y JSP
Ya platicamos por Discord, pero igual te paso este link
medium.com/@sushain_Dilishan/building-web-scraping-api-with-spring-boot-jsoup-a0cc19dbd5dd
Buen video
Gracias,
Un saludo Ryax 🤙🏼
recibo un page.waitForSelector: Timeout 30000ms exceeded.
Call log:
- waiting for locator('input[name="q"]') to be visible
Significa que hubo un problema con la carga de la página o que el markup del sitio cambió. Puedes tomar una captura de pantalla para revisar el estado de la página
tienes la repo ? es que estoy intentando hacer lo mismo con perfiles publicos de instagram pero solo las imagenes
ya que como recientemente hubo una actualización generar error de autorizacion
Para ese video no tengo repo. Lograste resolver el problema? El error de autenticación es con IG? Lo más seguro es que sea Meta quien te bloquee porque deben tener rastreo de bots y el scrapping entra en esa definición
recibo un page.waitForNavigation: Timeout 30000ms exceeded.
=========================== logs ===========================
waiting for navigation until "networkidle"
ya coloque las esperas
await page.goto(url)
await page.waitForTimeout(0); // wait for 1 seconds
await page.waitForNavigation({ waitUntil: 'networkidle' });
Eso es porque la página tardó más de 30 segundos cargando contenido. Por defecto tiene 30s como límite, puedes desactivarlo o cambiar el método de networkiddle a otro "trigger" para saber cuando haya terminado de cargar.