🌍 Cómo Hacer WEB SCRAPING con PYTHON | Extraer Datos de una Web 🔎

Поділитися
Вставка
  • Опубліковано 17 січ 2025

КОМЕНТАРІ • 88

  • @ElPinguinoDeMario
    @ElPinguinoDeMario  8 місяців тому +2

    🚀 Aprende ciberseguridad y hacking ético desde cero con nuestra academia El Rincón del Hacker!! elrincondelhacker.es
    🎓 Curso Preparación eJPT: elrincondelhacker.es/courses/preparacion-certificacion-ejptv2/
    🎓 Curso de Linux y Bash Scripting: elrincondelhacker.es/courses/curso-de-linux-y-bash-scripting/
    🎓 Curso de Docker: elrincondelhacker.es/courses/curso-de-docker/
    Hosting que recomiendo: raiolanetworks.com/landing/hosting-elpinguinodemario/

  • @rgonzalezz
    @rgonzalezz 7 місяців тому +4

    El mejor video que he visto sobre web scraping. Muchas gracias, ¡saludos!

  • @jack.rincon
    @jack.rincon 9 місяців тому +1

    Buena explicación, soy principiante en python y me quedo claro

  • @hernandezsosaemilio6651
    @hernandezsosaemilio6651 Рік тому +10

    Al verificar si la maquina existe o no en la página html, pueden utilizar en vez de iterar en la lista para comprobar si la última máquina sigue ahí, utilizar
    if maquina_noob in maquinas_final:
    print("No hay máquinas nuevas")
    else: print("Hay una nueva máquina")
    Lo que hace el in es verificar si el elemento presentado esta en el arreglo, lista, set, etc, creo que simplifica más ese for

    • @ManuelAntonioMoraArce
      @ManuelAntonioMoraArce Рік тому

      Cómo amo está comunidad!!!!❤❤❤ Optimizando ese código 🤜🤛

    • @xguidosan
      @xguidosan 10 місяців тому

      El problema con este código que presentas es que, al estar iterando elementos e imprimiendo dentro del bucle if, cada vez que itere un elemento de la lista te va a imprimir si hay o no maquinas nuevas, teniendo tantos print como elementos de la lista. en cambio, controlandolo con una variable booleana, el print se ejecutará solo una vez al final y su resultado estará condicionado por el true o false.

  • @CocoReformed
    @CocoReformed Рік тому +3

    Muy bien explicado, me servirá para implementarlo a mi bot de discord, muchísimas gracias!

  • @enrique7649
    @enrique7649 Рік тому +3

    Excelente video bastante buena la calidad de tus videos Mario siempre me sorprendes! 👍

    • @ElPinguinoDeMario
      @ElPinguinoDeMario  Рік тому +1

      Muchas gracias por el apoyo!! Seguiré a tope 😁👍🏻

  • @G.S.R.D.
    @G.S.R.D. 4 місяці тому

    Muy buen vídeo, me estaba costando entender cómo se hacía. Y la verdad que se ve mucho más sencillo así 🤟🏾

  • @1ismae3
    @1ismae3 Рік тому +6

    Me gustan mucho tus videos y aprendo mucho como lo explicas paso a paso, me gusta mucho python por que en pocas lineas se pueden hacer muchas cosas y con tu permiso me gustaria aportar una expresion regular para este caso
    print(list(set([x.group(2) for x in re.finditer( r'(href="\/entry\/)(.*)(?=,)', content)])))
    Gracias.
    Un saludo.

  • @Autoscraping
    @Autoscraping Рік тому +1

    Fabuloso video que ha sido de gran ayuda para orientar a nuestros nuevos miembros. ¡Tu generosidad es muy valorada!

  • @jl5856
    @jl5856 11 місяців тому +1

    interesante, gracias. En el caso de que al inspeccionar la web el nombre la búsqueda contenga espacios?? al igual que
    es el salto de linea... que signidica o que utilidad tiene \w- en la linea de la variable patrón,.... y el *?

  • @adolfozamorapescador626
    @adolfozamorapescador626 Рік тому +3

    en la linea 3 el request, dice, module not encontrado, que puede ser y como lo soluciono, por favor su ayuda

  • @lio-ok-messi
    @lio-ok-messi Рік тому

    Sos mi idolo ❤ tus videos son excelente!!!

    • @ElPinguinoDeMario
      @ElPinguinoDeMario  Рік тому

      Muchísimas gracias por el apoyo!! Se agradece mucho 😁💪🏻

  • @taun_1053
    @taun_1053 Рік тому +5

    me gustaría saber como hacer para que recoja datos de todas las paginas de esas, que esa era solo la primera, sin tener que hacerlo manualmente

    • @elblackmagister1014
      @elblackmagister1014 11 місяців тому +1

      Me he hecho la misma pregunta, si has encontrado algo, por favor, no dudes en compartirlo, gracias.

    • @polsalvador1898
      @polsalvador1898 9 місяців тому +1

      Hola buenas, a mí me interesa también si has encontrado algo 😊

  • @JuanCarrosa-vz3no
    @JuanCarrosa-vz3no Рік тому +1

    Hola, ¿ cómo se consulta las páginas 2 en adelante?

  • @jhavytxu
    @jhavytxu 7 місяців тому +1

    falto que si no encuentra la maquina agrege esa a la lista y elimine la que se estaba evaluando y ver como saber cual es la siguiente maquina a evaluar.

  • @71MizuCos
    @71MizuCos Рік тому

    que epico con musica de minecraft de fondo xd IDOLO

  • @znorluxtm7981
    @znorluxtm7981 Рік тому

    Excelente video, este y el de bash me han parecido increíbles, muy buen contenido bro

  • @efrensoto3273
    @efrensoto3273 5 місяців тому

    Muy buena explicación, lo entendí y son nuevo en esto de programar. Por favor, ¿Tienes algun video explicando como hacer Web Scraping a tablas de datos con python visual studio code? He buscado pero no encuentro. Gracias de antemano.

  • @leonvenditasdescargas2259
    @leonvenditasdescargas2259 7 місяців тому

    Me gusto mucho el video!

  • @Alejandroponce00
    @Alejandroponce00 6 місяців тому

    muy bueno,gracias

  • @eliasmedina9532
    @eliasmedina9532 11 місяців тому

    tengo una pregunta, si quiero publicar esos datos extraídos de la pagina web en tiempo real y publicarlas en otra pagina web q yo cree y q se actualice cada 1hs, es necesario almacenar los datos en una base de datos ?

  • @k1i415
    @k1i415 Рік тому

    Al poner print a lo que seria maquinas repetidas no me aparece nada, y la pagina q estoy usando no tiene el entry 😢

  • @NicooRamirez
    @NicooRamirez 9 місяців тому

    Buenas, quisiera saber como hacer para crear algo automático que entre a una página y recoja datos que van saliendo, supongamos que en una página van saliendo números y el "bot" vaya guardando esos números que van saliendo y este automáticamente hasta que se cierre

  • @subliangel3387
    @subliangel3387 Рік тому

    Gracias. Muy útil

  • @rodrigoestrada2661
    @rodrigoestrada2661 2 місяці тому

    Que hacer si no encuentro un patron en la lista de productos?

  • @Mr._MauroFerrera
    @Mr._MauroFerrera Рік тому

    Comparto que si no tienen la pagina de peliculas en ingles es posible que no encuentren el /entry/ y les aparezca otro valor y a la hora de imprimir maquinas_repetidas no les saldra .
    deben tener la pagina en ingles y ahi si aparece el /entry/

  • @michelsalas9045
    @michelsalas9045 8 місяців тому

    muy buen video, ¿como se puede automatizar y pasar de pagina en pagina y obtenga los títulos. al final obtenerlos todos. gracias.

  • @mauespinola
    @mauespinola 4 місяці тому

    muy muy bueno

  • @imagenesolo
    @imagenesolo Рік тому

    Que bueno!!!, tengo una duda que no he podido solucionar, quiero tener en un archivo de texto plano todas las url de un dominio (website), lo hago con un wget (en linux y funciona perfecto) pero me encontré con un botón js que un usuario normal, da clic y muestra más enlaces, pero con mi comando no funciona, puedes mostrarme o enseñarme como hacerlo.
    Gracias de antemano

  • @elcampitosilvestre
    @elcampitosilvestre Рік тому +3

    ya no esta funcionando import request :C

    • @SeudoCoca
      @SeudoCoca Рік тому

      Si funciona Man, chance no la tienes instalada
      Ve a CDM y escribe "pip install requests"
      Si no pasa nada chance tampoco tienes instalado "pip" y vas a tener que agregar las rutas de python y pip a la variable de entorno
      Cualquier cosa respondes y te ayudo

    • @LuluDecarTon-vs2vr
      @LuluDecarTon-vs2vr 8 місяців тому

      Igual es requests con s al final yo no puse la s y también me daba error y si tenía instalada la librería

  • @ThornTech-Cyber
    @ThornTech-Cyber Рік тому

    Muy buen video 👌👌

  • @sebastiannietor9724
    @sebastiannietor9724 Рік тому

    Que hago si al momento de ver el codigo desde el inspector me aparece el elemento con su respectiva clase y ids, pero cuando intento acceder con beatiful soup me aparece None, y miro en el codigo fuente presionando (CTRL+U) y ahi no me aparece ese elemento, entonces supongo que por eso el beatiful soup response None
    Qué podria hacer ahi?

  • @claudiozenteno8368
    @claudiozenteno8368 6 місяців тому

    Muy bueno.

  • @luislopez8300
    @luislopez8300 Рік тому

    Como sería entrar a una página web de mis tarjetas de visa. Entrar y extraer archivos de excel

  • @xxLopodoxx
    @xxLopodoxx 8 годин тому

    nadie va a apreguntar que ocuerre si la maquina noob fue eliminada? va a detectar maquina nueva y no es correcto

  • @RyanTyan-u5f
    @RyanTyan-u5f Рік тому

    una pregunta como abro esa terminal

  • @milemontivero3662
    @milemontivero3662 11 місяців тому

    Sirve para sacar datos de un casino online?

  • @jcjsupportmas...3242
    @jcjsupportmas...3242 10 місяців тому

    Saludos: gracias por tus aportes muy buenos y bien explicado.
    Si es posible que puedas hacer un Vidio donde explique: Existe una página web que contiene los resultados de sorteo de rifas los miércoles y sábados. Quisiera poder leer esa página y sacar los resultados de los últimos 6 sorteos apartir de la consulta del usuario. Y que imprima en pantalla los resultados de los numeros ganadores indicándome las fecha de cada uno.

  • @alexgarces6950
    @alexgarces6950 Рік тому

    pregunta como saco esa ventanita que el usa para ejecutar el codigo

    • @ElPinguinoDeMario
      @ElPinguinoDeMario  Рік тому +1

      Hola!! Clic derecho sobre el código das en ejecutar en una ventana interactiva 💪🏻

  • @gloriafulguera3869
    @gloriafulguera3869 4 місяці тому

    me dan error los import, y no me aparece alguna ayuda para instalar

  • @Fredix2019
    @Fredix2019 Рік тому

    Bro una pregunta para aprender programar se nesecita el inglesh me respondes porfa 😢

    • @BlueTeamBorja
      @BlueTeamBorja Рік тому

      Yo te diría que no es necesario. A fuerza de utilizar la sintaxis te la vas aprendiendo. Saludos.

    • @Fredix2019
      @Fredix2019 Рік тому

      @@BlueTeamBorja gracias mi bro te lo agradesco mucho

    • @Fredix2019
      @Fredix2019 Рік тому

      @@BlueTeamBorja Nuevo seguidor

    • @ElPinguinoDeMario
      @ElPinguinoDeMario  Рік тому

      Yo pienso lo mismo que borhacking, con saber un poco inglés escrito ya de sobra 😁

    • @BlueTeamBorja
      @BlueTeamBorja Рік тому

      @@Fredix2019 Gracias. Ya empezaré a subir alguna cosa.

  • @menillasotelo
    @menillasotelo 6 місяців тому

    "Detestar" o "Detectar" ?????

  • @romotoons
    @romotoons 7 місяців тому

    los pasos siempre son los mismos ?

  • @Juankchopy
    @Juankchopy Рік тому

    👏👍

  • @romeoteni8461
    @romeoteni8461 10 місяців тому

    grande excelente video

    • @ElPinguinoDeMario
      @ElPinguinoDeMario  10 місяців тому

      Muchas gracias por el apoyo!!

    • @46668
      @46668 10 місяців тому

      @@ElPinguinoDeMario como hago en el minuto 2:52 dijiste ejecutarlo, donde? o como ? ahi video? me amas?

  • @gianfrancoeduardobravolude3388

    Alguien sabe como mandar lo obtenido con el Web Scraping a mi pagina HTML ¿?

  • @campos0.196
    @campos0.196 Рік тому

    como hago para obtener por ejemplo el contenido de un div
    ejemplo quiero obtener el contenido de una etiqueta en este casi un zapato que esta asi 10.89$
    como hago para obtener el precio

    • @ElPinguinoDeMario
      @ElPinguinoDeMario  Рік тому

      Buenas! Puedes hacerlo de una forma parecida a la del vídeo, utilizando la librería re y con expresiones regulares ir filtrando la información hasta llegar al precio 👍🏻

  • @DavidArangosoychon
    @DavidArangosoychon Рік тому

    from colorama import Fore
    ModuleNotFoundError: No module named 'colorama' porque me sale asi :(

    • @ElPinguinoDeMario
      @ElPinguinoDeMario  Рік тому

      Hola!! Debes hacer un pip install colorama desde el terminal 👍🏻

    • @DavidArangosoychon
      @DavidArangosoychon Рік тому

      @@ElPinguinoDeMario pero ya está instalado probé hasta cambiar de python ;(

  • @elgrillodelanoche
    @elgrillodelanoche Рік тому

    Se puede hacer un script para extraer solo las preguntas importantes y desechar las preguntas tontillas

  • @sergiocotero6622
    @sergiocotero6622 10 місяців тому

    Hola

  • @lucascaskajillo540
    @lucascaskajillo540 Рік тому

    Soy yo, o esto ya lo he vivido🤔

  • @luislopez8300
    @luislopez8300 Рік тому

    Busco como hacerlo por ejemplo en mi cuenta de banco que tienenhasta kaptcja de numeros y letras ybextraer informacion de mi cta bancaria. Y no veo algun video con eso