Curso de Web Scraping en Python | Web Scraping MUY FACIL con Beautiful Soup [Nivel Básico]

Frank Andrade

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 13 лип 2024
🔥 Curso Completo de Web Scraping en Python 8 horas (Udemy): www.udemy.com/course/curso-co...
🎁 Promoción (Solo en mi página): Hasta 50% y 100% de descuento por la compra del segundo/tercer curso. thepycoach.teachable.com/p/sp...
En este tutorial, te voy a enseñar un método para extraer datos de páginas web conocido como Web Scraping. En este video haremos Web Scraping con Beautiful Soup, la cual es la librería de web scraping más fácil de aprender en Python.
Si tienes dudas sobre comprar el curso, revisa el playlist debajo 😉
🖥 Playlist gratuito de 2 horas de web scraping: • Curso Completo de Web ...
🔗 Link de página: subslikescript.com/movie/Titanic-120338
👨🏻‍💻 Código y/o dataset usado en este video: github.com/ifrankandrade/data...
🎮 Discord (aquí puedes descargar mi formulario de Python): / discord
📩 Recibe emails semanales en mi Substack: andradefrank.substack.com/
📝 Puedes encontrar más información sobre este tema en este artículo que escribí: betterprogramming.pub/how-to-...
✅ Sígueme en Medium: / frank-andrade
Fuente original del dataset usado en este video:
--------------------
Contenido del video:
0:00 Instalar Beautiful Soup y Requests
3:31 ¿Cómo Obtener el Documento HTML de una Página Web?
8:13 ¿Como Hacer Web Scraping a una Página?
18:56 Exportar Data Extraída a un Archivo TXT

КОМЕНТАРІ • 82

@togakurerotten4801 2 роки тому ⁺⁵
Me ha sido útil, muy fácil, la explicación fue fácil de entender y aprendí bastante en pocos minutos, ya me he suscrito para seguir tu contenido nuevo :)
@sergiocastillo2259 3 місяці тому ⁺¹
Contenido: 100, Explicacion: 100, gracias!
@mauroe.leguizamon5801 2 роки тому
Excelente explicación. Muy claro!
@al7240 Рік тому
Muy entendible, gracias!
@rbermejoa Рік тому
Gracias por esta lista de reproducción!
@carloseduardocarhuaricraja1705 2 роки тому
Buenísimo Frank, gracias
@claudiamasut9857 2 роки тому ⁺¹
muy util y claro
@mrtutzee Рік тому
Curso comprado, muchas gracias.
@ochoonce9882 2 роки тому
Muchas gracias amigo!
@facundoattala4916 Рік тому
Muchas gracias!
@dondotcom9901 Рік тому
Todo me salio perfecto, excelente video! Tienes el otro video que mencionas para hacer web scraping a varias paginas, con beautiful soup? Muchas gracias!!
@TheTotte669 Рік тому
Works well!! DANKEEE
@thepycoachES 2 роки тому ⁺³
🔥 Curso Completo de Web Scraping en Python 8 horas (Udemy): www.udemy.com/course/curso-completo-de-web-scraping-en-python-de-cero-a-experto/?referralCode=8F4DE225290091734DAC
🎁 Promoción (Solo en mi página): Hasta 50% y 100% de descuento por la compra del segundo/tercer curso. thepycoach.teachable.com/p/spanish
@TheEltictacdicta Рік тому
Tengo muchas ganas de hacer este curso, pero estoy esperando a que me ofrezca un descuento Udemy ¿Tienes algún cupón de descuento actualizado? Suelo esperarme a que el curso me valga entre 9 y 15€. Saludos!
@hugocorvalan8176 2 роки тому
gracias
@fabianconde8325 2 роки тому
Frank gracias por el video, estoy aprendiendo y me viene muy bien. Solo me gustaría saber como hacer para que dentro del txt me traiga no solo el transcript, sino también el title colocando una separación de un renglón entre cada dato que le pido. Muchisimas gracias. Tenes un nuevo seguidor :)
@federicocoronado1935 Рік тому
Excelente Frank, tengo una duda, antes de llegar a la pagina en la que estan los datos debo loguearme. pensaba hacer esto con un logueo manual en chorme, pero me parece que BS abre una instancia nueva del navegador. puedo hacerlo dentro del script o me paso a Selenium. mucha sgracias
@romicc123 2 роки тому ⁺¹
Muchas gracias!!
@thepycoachES 2 роки тому
De nada! Me alegra haberte ayudado
@joseguillermocastro4333 2 роки тому ⁺²
Muchas gracias 🖥️🐍
@thepycoachES 2 роки тому
¡De nada!
@juansebastianacosta8815 2 роки тому ⁺¹
Gracias!
@thepycoachES 2 роки тому
¡Me alegra haberte ayudado!
@vicentejimenez1504 Рік тому ⁺¹⁵
a los que les aparezca este error "Traceback (most recent call last)" al crear el txt deben de agregar enconding="utf-8"
quedaria asi:
with open(f'{title}.txt', 'w', encoding="utf-8") as file:
file.write(trans)
espero que a alguien le sirva
@cristianchristopherucharim7136 Рік тому ⁺¹
gracias bro.
@gabrielacristinarodriguez1885 Рік тому ⁺¹
Buenisimo, me pasaba eso y solucione, Gracias!
@correoregistros7434 Рік тому ⁺¹
Muchas gracias.
@katherineespitia3449 10 місяців тому ⁺¹
Gracias!
@mesteban2702 9 місяців тому ⁺¹
crack!!
@projas43 8 місяців тому
Hola, que recomiendas para obtener información de un supermercado?
@miguelberlanga7657 Рік тому
que codigo tengo que añadir para loguearme en la página?
y para que recorrar la página hasta el final?
me mostrará todos los links de los videos incurstados?
@alexisbustamante8368 11 місяців тому
BUENISIMO
@davidpelaez3137 Рік тому
Que pasaría si quisiera tener acceso al buscador de manuscritos, si por ejemplo ya no quiero ver el del Titanic sino el de Volver al futuro, puedo enviar el nombre del manuscrito que quiero buscar y acceder e él desde código python? saludos
@andresaguirre08 2 роки тому
Hola una consulta el txt me lo importa como 0k sin datos en una extensión .file porque sera?
@user-rz6nc3wg4u 4 місяці тому
hola frank estoy buscando el video donde explicabas como hacer scraping usa do python y chat gpt. no puedo encontrarlo me dejarias el link?
@StrangeGhost_ 7 місяців тому
Cuál es el IDE que usaste?
@gianfrancoeduardobravolude3388 8 місяців тому
Hola, una consulta: si solo me muestra una parte del código HTML de la página, ¿qué puedo hacer?
@cesardiaz9789 Рік тому
Hola, muchísimas gradicias por el video, excelente explicación... Yo uso Visual Studio y en el terminal no encuentro la lupa del buscador y no puedo avanzar... Agradecido de antemano por tu ayuda al respecto...
@dannyapellido5765 Рік тому
ctrl + f
@ProgramandoMaricadas 4 місяці тому
tu video me lo recomendo gemini
@fernandopalacios5656 4 місяці тому
Buen día, con visual code no muestra todo el código, en mi caso con Pycharm si se ve todo el código html. Saludos Frank
@agustinrodriguez6198 2 роки тому ⁺¹
Hola amigo como estás! Mira, yo necesito Scrapear únicamente enlaces de Webs, pero necesito hacerlo cada x tiempo, es decir programar un scrapeo cada tanto tiempo de los enlaces, porque se irían modificando.. podría hacer eso con BeautifulSoup? No serían más de 100 enlaces por día, de distintos sitios webs.
Por otra parte, para aprender a Scrapear con BeautifulSoup es necesario saber Python? Saludos Frank, espero tu respuesta!
@thepycoachES 2 роки тому ⁺¹
No entiendo muy bien tu pregunta.
- En caso de que quieras scrapear cada X segundos puedes usar una espera implicita; por ejemplo, si quieres 5 segundos harías time.sleep(5)
- En caso de que quieras programas a que hora se corre el script, puedes usar el programador de tareas de windows. Revisa el video en este canal llamada "Como Automatizar Scripts en Pyrhon"
@diversionfunny 11 місяців тому
¿como se ponen las comillas simples en pycharm?
@lucasserafin7184 Рік тому
en que plataforma estas escribiendo?
@AlaGrandeLePuseCuca23 2 роки тому
tengo un problema a la hora de hacer la impresion,
AttributeError: 'NoneType' object has no attribute 'get_text'
me sale este error, alguien me ayuda?
@diversionfunny 11 місяців тому
al poner from bs4 import BeautifulSoap me da este problema: Unused import statement 'from bs4 import BeautifulSoup'
@sebastianjoseruizmorales8534 4 місяці тому
Ayuda, no me deja instalar bs4 y requests, que hago?
@telematicos Рік тому
que hacer cuando al parecer esta protegida la pagina?
@saydiegog 2 роки тому ⁺¹
Hola, a veces funciona excelente y a veces me sale este error
Traceback (most recent call last):
File "/Documents/Scripts/CRXillions/crxillions.py", line 20, in
box = soup.find(class_='nft_attr').get_text()
AttributeError: 'NoneType' object has no attribute 'get_text'
A que se debe? es un div al que le estoy haciendo scraping
@thepycoachES 2 роки тому
Lo que sucede es que el objeto box no tiene contenido (a veces). Seguro estás haciendo web scraping a una pagina donde no siempre todo el contenido está disponible.
Lo que puedes hacer en esos casos es usar un try/except. Para poder ignorar el error en una iteración y pasar a la siguiente iteración sin problemas.
@OtakuEli Рік тому
Está bastante genial el vídeo!!
Quisiera saber si para hacer web scrapping en facebook también se puede usar ese mismo método?
@yorvymeza1546 Рік тому
Depende lo que tenga en mente hacer
@ericguzman4367 Рік тому
Hola, a mi me imprime el archivo .txt en una sola linea.
@scarysticks66 Рік тому
me sale un error al instalar lxml, ya trate de arreglarlo pero no encuentro solución.
@liathshaivasqueznochebuena1072 2 роки тому ⁺⁶
Hola! Gracias por el vídeo!. Lo hice tal cual el video y me surge un error al compilar el programa.
Este es el error que me marca: UnicodeEncodeError: 'charmap' codec can't encode character '\ufb02' in position 32153: character maps to
Espero puedas ayudarme, gracias!
@thepycoachES 2 роки тому ⁺¹³
Hola. Tiene que ver con el encoding. Solo debes cambiar el encoding por defecto. Reemplaza las 2 últimas lineas por el código debajo:
with open(f'{title}.txt', 'w', encoding='utf-8') as file:
file.write(transcript)
@kevlpa9078 2 роки тому ⁺²
@@thepycoachES gracias por la respuesta, yo tenia el mismo problema
@togakurerotten4801 2 роки тому ⁺¹
@@thepycoachES tenia el mismo problema, con esta linea se resolvió, gracias!
@abelsena830 2 роки тому ⁺¹
buenas tardes , quiero hacer scrampy a amazon despes convertirlo a exel como lo hago
@thepycoachES 2 роки тому
Puedes ver el video de cómo hacer web scraping con selenium. Debería servirte para hacer web scraping a Amazon
@AlexLab7 2 роки тому
tengo un problema mi pc no reconoce que es un pip
@vicentejimenez1504 Рік тому
hola, me aparece este error "ModuleNotFoundError: No module named 'bs4'" y lo descergue tal cual dice el tutorial, alguien por favor ayúdeme
@tomascabrera6933 Рік тому
La descarga e instalación se realiza en el CMD u otro terminal. En algunos casos los comandos varían. En mi consola me funcionó con py -m pip install bs4
@gabrielacristinarodriguez1885 Рік тому
Cuando traigo el codigo html, no lo trae completo..no se por que pasa eso, me falta toda la primer parte, las etiquetas de apertura, titulos...
@gabrielacristinarodriguez1885 Рік тому
Solucionado, utilizando strip y separator.
@jefersonmartinez4778 Рік тому
" error: subprocess-exited-with-error" ese error me da cuando installa LXML y no puedo instalarlo, he intentado de varias maneras pero no paso
@trino01 Рік тому
a mi no me tomaba lxml, instale html5lib y parece que va bien
@dondotcom9901 Рік тому ⁺¹
@@trino01 X2
@Chestino 2 роки тому
Me devuelve none
@miguelmundiales2752 Рік тому ⁺¹
taital no ,, titulo...
@tommys3932 Рік тому
Excelente video! Lo único que me molesta (personalmente) es que pronuncies algunas palabras como un pelotudo pero tkm
@Robe_LC Місяць тому
Está bueno el video, pero detesto tu pronunciación forzada del ingles. Me da "cringe", como seguramente dirías tu. Pero claro, tu decides como hablar.
@darkoZeon 2 роки тому ⁺¹
Buen vídeo pero por favor deja de hablar así xd
@bulmavegeta23 2 роки тому ⁺⁷
que horrible tu disque pronunciación en ingles, mejor dilo como lo lees
@thepycoachES 2 роки тому ⁺²⁰
¿Y si mejor lo digo como me da la gana? 🤔
@JoseLuisMorales 2 роки тому ⁺¹
@@thepycoachES 😂
@bernardofloresluna3782 2 роки тому
@@thepycoachES Pues es una certificación del idioma eso si les importa solo digo.
@deiviejaimes5650 Рік тому
@@thepycoachES Asi es hermano, el amigo Oli se lo buscó, mas bien que agardesca su aporte. Sigue así hermano.
@DR3AD-nd6rm 2 роки тому
Traceback (most recent call last):
File "c:/Users/Denisse/Documents/CARLOS EMILIO/VISUALSTUDIOCODE/tes.py", line 13, in
title = box.find('h1').get_text()
AttributeError: 'NoneType' object has no attribute 'find'
tengo ese error

Наступне

Автоматичне відтворення

Curso de Web Scraping en Python | Web Scraping Dinámico con Selenium [Nivel Intermedio]