Curso de Web Scraping en Python | Web Scraping MUY FACIL con Beautiful Soup [Nivel Básico]

Поділитися
Вставка
  • Опубліковано 13 лип 2024
  • 🔥 Curso Completo de Web Scraping en Python 8 horas (Udemy): www.udemy.com/course/curso-co...
    🎁 Promoción (Solo en mi página): Hasta 50% y 100% de descuento por la compra del segundo/tercer curso. thepycoach.teachable.com/p/sp...
    En este tutorial, te voy a enseñar un método para extraer datos de páginas web conocido como Web Scraping. En este video haremos Web Scraping con Beautiful Soup, la cual es la librería de web scraping más fácil de aprender en Python.
    Si tienes dudas sobre comprar el curso, revisa el playlist debajo 😉
    🖥 Playlist gratuito de 2 horas de web scraping: • Curso Completo de Web ...
    🔗 Link de página: subslikescript.com/movie/Titanic-120338
    👨🏻‍💻 Código y/o dataset usado en este video: github.com/ifrankandrade/data...
    🎮 Discord (aquí puedes descargar mi formulario de Python): / discord
    📩 Recibe emails semanales en mi Substack: andradefrank.substack.com/
    📝 Puedes encontrar más información sobre este tema en este artículo que escribí: betterprogramming.pub/how-to-...
    ✅ Sígueme en Medium: / frank-andrade
    Fuente original del dataset usado en este video:
    --------------------
    Contenido del video:
    0:00 Instalar Beautiful Soup y Requests
    3:31 ¿Cómo Obtener el Documento HTML de una Página Web?
    8:13 ¿Como Hacer Web Scraping a una Página?
    18:56 Exportar Data Extraída a un Archivo TXT

КОМЕНТАРІ • 82

  • @togakurerotten4801
    @togakurerotten4801 2 роки тому +5

    Me ha sido útil, muy fácil, la explicación fue fácil de entender y aprendí bastante en pocos minutos, ya me he suscrito para seguir tu contenido nuevo :)

  • @sergiocastillo2259
    @sergiocastillo2259 3 місяці тому +1

    Contenido: 100, Explicacion: 100, gracias!

  • @mauroe.leguizamon5801
    @mauroe.leguizamon5801 2 роки тому

    Excelente explicación. Muy claro!

  • @al7240
    @al7240 Рік тому

    Muy entendible, gracias!

  • @rbermejoa
    @rbermejoa Рік тому

    Gracias por esta lista de reproducción!

  • @carloseduardocarhuaricraja1705
    @carloseduardocarhuaricraja1705 2 роки тому

    Buenísimo Frank, gracias

  • @claudiamasut9857
    @claudiamasut9857 2 роки тому +1

    muy util y claro

  • @mrtutzee
    @mrtutzee Рік тому

    Curso comprado, muchas gracias.

  • @ochoonce9882
    @ochoonce9882 2 роки тому

    Muchas gracias amigo!

  • @facundoattala4916
    @facundoattala4916 Рік тому

    Muchas gracias!

  • @dondotcom9901
    @dondotcom9901 Рік тому

    Todo me salio perfecto, excelente video! Tienes el otro video que mencionas para hacer web scraping a varias paginas, con beautiful soup? Muchas gracias!!

  • @TheTotte669
    @TheTotte669 Рік тому

    Works well!! DANKEEE

  • @thepycoachES
    @thepycoachES  2 роки тому +3

    🔥 Curso Completo de Web Scraping en Python 8 horas (Udemy): www.udemy.com/course/curso-completo-de-web-scraping-en-python-de-cero-a-experto/?referralCode=8F4DE225290091734DAC
    🎁 Promoción (Solo en mi página): Hasta 50% y 100% de descuento por la compra del segundo/tercer curso. thepycoach.teachable.com/p/spanish

    • @TheEltictacdicta
      @TheEltictacdicta Рік тому

      Tengo muchas ganas de hacer este curso, pero estoy esperando a que me ofrezca un descuento Udemy ¿Tienes algún cupón de descuento actualizado? Suelo esperarme a que el curso me valga entre 9 y 15€. Saludos!

  • @hugocorvalan8176
    @hugocorvalan8176 2 роки тому

    gracias

  • @fabianconde8325
    @fabianconde8325 2 роки тому

    Frank gracias por el video, estoy aprendiendo y me viene muy bien. Solo me gustaría saber como hacer para que dentro del txt me traiga no solo el transcript, sino también el title colocando una separación de un renglón entre cada dato que le pido. Muchisimas gracias. Tenes un nuevo seguidor :)

  • @federicocoronado1935
    @federicocoronado1935 Рік тому

    Excelente Frank, tengo una duda, antes de llegar a la pagina en la que estan los datos debo loguearme. pensaba hacer esto con un logueo manual en chorme, pero me parece que BS abre una instancia nueva del navegador. puedo hacerlo dentro del script o me paso a Selenium. mucha sgracias

  • @romicc123
    @romicc123 2 роки тому +1

    Muchas gracias!!

    • @thepycoachES
      @thepycoachES  2 роки тому

      De nada! Me alegra haberte ayudado

  • @joseguillermocastro4333
    @joseguillermocastro4333 2 роки тому +2

    Muchas gracias 🖥️🐍

  • @juansebastianacosta8815
    @juansebastianacosta8815 2 роки тому +1

    Gracias!

  • @vicentejimenez1504
    @vicentejimenez1504 Рік тому +15

    a los que les aparezca este error "Traceback (most recent call last)" al crear el txt deben de agregar enconding="utf-8"
    quedaria asi:
    with open(f'{title}.txt', 'w', encoding="utf-8") as file:
    file.write(trans)
    espero que a alguien le sirva

  • @projas43
    @projas43 8 місяців тому

    Hola, que recomiendas para obtener información de un supermercado?

  • @miguelberlanga7657
    @miguelberlanga7657 Рік тому

    que codigo tengo que añadir para loguearme en la página?
    y para que recorrar la página hasta el final?
    me mostrará todos los links de los videos incurstados?

  • @alexisbustamante8368
    @alexisbustamante8368 11 місяців тому

    BUENISIMO

  • @davidpelaez3137
    @davidpelaez3137 Рік тому

    Que pasaría si quisiera tener acceso al buscador de manuscritos, si por ejemplo ya no quiero ver el del Titanic sino el de Volver al futuro, puedo enviar el nombre del manuscrito que quiero buscar y acceder e él desde código python? saludos

  • @andresaguirre08
    @andresaguirre08 2 роки тому

    Hola una consulta el txt me lo importa como 0k sin datos en una extensión .file porque sera?

  • @user-rz6nc3wg4u
    @user-rz6nc3wg4u 4 місяці тому

    hola frank estoy buscando el video donde explicabas como hacer scraping usa do python y chat gpt. no puedo encontrarlo me dejarias el link?

  • @StrangeGhost_
    @StrangeGhost_ 7 місяців тому

    Cuál es el IDE que usaste?

  • @gianfrancoeduardobravolude3388
    @gianfrancoeduardobravolude3388 8 місяців тому

    Hola, una consulta: si solo me muestra una parte del código HTML de la página, ¿qué puedo hacer?

  • @cesardiaz9789
    @cesardiaz9789 Рік тому

    Hola, muchísimas gradicias por el video, excelente explicación... Yo uso Visual Studio y en el terminal no encuentro la lupa del buscador y no puedo avanzar... Agradecido de antemano por tu ayuda al respecto...

  • @ProgramandoMaricadas
    @ProgramandoMaricadas 4 місяці тому

    tu video me lo recomendo gemini

  • @fernandopalacios5656
    @fernandopalacios5656 4 місяці тому

    Buen día, con visual code no muestra todo el código, en mi caso con Pycharm si se ve todo el código html. Saludos Frank

  • @agustinrodriguez6198
    @agustinrodriguez6198 2 роки тому +1

    Hola amigo como estás! Mira, yo necesito Scrapear únicamente enlaces de Webs, pero necesito hacerlo cada x tiempo, es decir programar un scrapeo cada tanto tiempo de los enlaces, porque se irían modificando.. podría hacer eso con BeautifulSoup? No serían más de 100 enlaces por día, de distintos sitios webs.
    Por otra parte, para aprender a Scrapear con BeautifulSoup es necesario saber Python? Saludos Frank, espero tu respuesta!

    • @thepycoachES
      @thepycoachES  2 роки тому +1

      No entiendo muy bien tu pregunta.
      - En caso de que quieras scrapear cada X segundos puedes usar una espera implicita; por ejemplo, si quieres 5 segundos harías time.sleep(5)
      - En caso de que quieras programas a que hora se corre el script, puedes usar el programador de tareas de windows. Revisa el video en este canal llamada "Como Automatizar Scripts en Pyrhon"

  • @diversionfunny
    @diversionfunny 11 місяців тому

    ¿como se ponen las comillas simples en pycharm?

  • @lucasserafin7184
    @lucasserafin7184 Рік тому

    en que plataforma estas escribiendo?

  • @AlaGrandeLePuseCuca23
    @AlaGrandeLePuseCuca23 2 роки тому

    tengo un problema a la hora de hacer la impresion,
    AttributeError: 'NoneType' object has no attribute 'get_text'
    me sale este error, alguien me ayuda?

  • @diversionfunny
    @diversionfunny 11 місяців тому

    al poner from bs4 import BeautifulSoap me da este problema: Unused import statement 'from bs4 import BeautifulSoup'

  • @sebastianjoseruizmorales8534
    @sebastianjoseruizmorales8534 4 місяці тому

    Ayuda, no me deja instalar bs4 y requests, que hago?

  • @telematicos
    @telematicos Рік тому

    que hacer cuando al parecer esta protegida la pagina?

  • @saydiegog
    @saydiegog 2 роки тому +1

    Hola, a veces funciona excelente y a veces me sale este error
    Traceback (most recent call last):
    File "/Documents/Scripts/CRXillions/crxillions.py", line 20, in
    box = soup.find(class_='nft_attr').get_text()
    AttributeError: 'NoneType' object has no attribute 'get_text'
    A que se debe? es un div al que le estoy haciendo scraping

    • @thepycoachES
      @thepycoachES  2 роки тому

      Lo que sucede es que el objeto box no tiene contenido (a veces). Seguro estás haciendo web scraping a una pagina donde no siempre todo el contenido está disponible.
      Lo que puedes hacer en esos casos es usar un try/except. Para poder ignorar el error en una iteración y pasar a la siguiente iteración sin problemas.

  • @OtakuEli
    @OtakuEli Рік тому

    Está bastante genial el vídeo!!
    Quisiera saber si para hacer web scrapping en facebook también se puede usar ese mismo método?

  • @ericguzman4367
    @ericguzman4367 Рік тому

    Hola, a mi me imprime el archivo .txt en una sola linea.

  • @scarysticks66
    @scarysticks66 Рік тому

    me sale un error al instalar lxml, ya trate de arreglarlo pero no encuentro solución.

  • @liathshaivasqueznochebuena1072
    @liathshaivasqueznochebuena1072 2 роки тому +6

    Hola! Gracias por el vídeo!. Lo hice tal cual el video y me surge un error al compilar el programa.
    Este es el error que me marca: UnicodeEncodeError: 'charmap' codec can't encode character '\ufb02' in position 32153: character maps to
    Espero puedas ayudarme, gracias!

    • @thepycoachES
      @thepycoachES  2 роки тому +13

      Hola. Tiene que ver con el encoding. Solo debes cambiar el encoding por defecto. Reemplaza las 2 últimas lineas por el código debajo:
      with open(f'{title}.txt', 'w', encoding='utf-8') as file:
      file.write(transcript)

    • @kevlpa9078
      @kevlpa9078 2 роки тому +2

      @@thepycoachES gracias por la respuesta, yo tenia el mismo problema

    • @togakurerotten4801
      @togakurerotten4801 2 роки тому +1

      @@thepycoachES tenia el mismo problema, con esta linea se resolvió, gracias!

  • @abelsena830
    @abelsena830 2 роки тому +1

    buenas tardes , quiero hacer scrampy a amazon despes convertirlo a exel como lo hago

    • @thepycoachES
      @thepycoachES  2 роки тому

      Puedes ver el video de cómo hacer web scraping con selenium. Debería servirte para hacer web scraping a Amazon

  • @AlexLab7
    @AlexLab7 2 роки тому

    tengo un problema mi pc no reconoce que es un pip

  • @vicentejimenez1504
    @vicentejimenez1504 Рік тому

    hola, me aparece este error "ModuleNotFoundError: No module named 'bs4'" y lo descergue tal cual dice el tutorial, alguien por favor ayúdeme

    • @tomascabrera6933
      @tomascabrera6933 Рік тому

      La descarga e instalación se realiza en el CMD u otro terminal. En algunos casos los comandos varían. En mi consola me funcionó con py -m pip install bs4

  • @gabrielacristinarodriguez1885

    Cuando traigo el codigo html, no lo trae completo..no se por que pasa eso, me falta toda la primer parte, las etiquetas de apertura, titulos...

  • @jefersonmartinez4778
    @jefersonmartinez4778 Рік тому

    " error: subprocess-exited-with-error" ese error me da cuando installa LXML y no puedo instalarlo, he intentado de varias maneras pero no paso

    • @trino01
      @trino01 Рік тому

      a mi no me tomaba lxml, instale html5lib y parece que va bien

    • @dondotcom9901
      @dondotcom9901 Рік тому +1

      @@trino01 X2

  • @Chestino
    @Chestino 2 роки тому

    Me devuelve none

  • @miguelmundiales2752
    @miguelmundiales2752 Рік тому +1

    taital no ,, titulo...

  • @tommys3932
    @tommys3932 Рік тому

    Excelente video! Lo único que me molesta (personalmente) es que pronuncies algunas palabras como un pelotudo pero tkm

  • @Robe_LC
    @Robe_LC Місяць тому

    Está bueno el video, pero detesto tu pronunciación forzada del ingles. Me da "cringe", como seguramente dirías tu. Pero claro, tu decides como hablar.

  • @darkoZeon
    @darkoZeon 2 роки тому +1

    Buen vídeo pero por favor deja de hablar así xd

  • @bulmavegeta23
    @bulmavegeta23 2 роки тому +7

    que horrible tu disque pronunciación en ingles, mejor dilo como lo lees

    • @thepycoachES
      @thepycoachES  2 роки тому +20

      ¿Y si mejor lo digo como me da la gana? 🤔

    • @JoseLuisMorales
      @JoseLuisMorales 2 роки тому +1

      @@thepycoachES 😂

    • @bernardofloresluna3782
      @bernardofloresluna3782 2 роки тому

      @@thepycoachES Pues es una certificación del idioma eso si les importa solo digo.

    • @deiviejaimes5650
      @deiviejaimes5650 Рік тому

      @@thepycoachES Asi es hermano, el amigo Oli se lo buscó, mas bien que agardesca su aporte. Sigue así hermano.

  • @DR3AD-nd6rm
    @DR3AD-nd6rm 2 роки тому

    Traceback (most recent call last):
    File "c:/Users/Denisse/Documents/CARLOS EMILIO/VISUALSTUDIOCODE/tes.py", line 13, in
    title = box.find('h1').get_text()
    AttributeError: 'NoneType' object has no attribute 'find'
    tengo ese error