En la pagina tal y como esta ahora, los grupos se encuentran en el rango range(12,68,7). Estuvo muy entretenido el video, ahora a animarse a ver mas modelos y a intentarlo hacer con mas caracteristicas en los datos e implantando modelos y redes neuronales de Machine Learning e Inteligencia Artificial. Este video ha sido estupendo para empezar a dar unos primeros pasos y empezar a tener unos enfoques de como hacerlo. Gracias
Muy bien..muy..bien.... Hay futuro como divulgador científico.... Conciso, práctico...,. Directo sin nada de relleno ni nada flow.... Que usan otros.... Like ,me suscribo...click... Campanita y toda esa weaaaaa que hay que hacer.... Felicitaciones...
Estamos en 2024, pero aun pueden usar este proyecto de predicción del 2022. Tienen dos opciones - Opción 1: En vez de usar el link de wikipedia que uso en el video (el cual ya tiene todos los resultados actualizados del 2022) pueden usar este link de Internet Archive donde verán la pagina tal como aparece en el video: web.archive.org/web/20221115040351/en.wikipedia.org/wiki/2022_FIFA_World_Cup - Opción 2: Pueden ir a mi GitHub (link en descripción) y descargar dentro de la carpeta data el archivo "dict_table" y luego usar la librería pickle para leerlo en Jupyter Notebooks como muestro en el video 2:17:46 🔥 Curso Completo de Data Science en Python: www.udemy.com/course/curso-completo-de-data-science-en-python-desde-cero-2022/?couponCode=D0EF9355A745E67AE09A
Tu canal es oro molido, el contenido que haces me ayuda a sintetizar y sentar todo lo que he estado aprendiendo en cursos de diferentes partes. Gracias por compartir este conocimiento tan valioso !
Me ha encantado este mini-curso de Data Science desde cero a la final del Mundial de 2022. Me ha servido para tener un primer contacto real con el mundo del Data Science y con el incentivo de conocer la predicción del Mundial, doble motivación. No se puede pedir más por menos. Muchísimas gracias!!
Gracias por compartir, existen varias oportunidades de mejora, sobre todo desde el punto de vista de: la cultura habla hispana, la ciencia de datos y las estadísticas y probabilidades aplicadas al futbol, quedo a la orden para compartir mi ángulo.
Chicos, si extrajeron la data con beautifulsoup, al parecer wikipedia arreglo las clases de las etiquetas, asi que funciona igual con beatifulsoup que con selenium. yo me di cuenta despues de hacer las dos! jaja
Hola excelente video, estoy intentanto hacer este proyecto un poco distinto pero con los resultados actuales de los grupos de la europa league. Tengo un problema que me impide tomar todos los grupos en un solo dataframe, sino en 8 df. Espero no tener problemas con eso jajaja
El throughput también es importante leerlo. Quiere decir con la configuración que le diste cuantos requests por segundo pudo procesar. Analizar el throughput podes ver donde está el cuello de botella o cuánto soporta. El desvío standard también: es cuán variables fueron esas respuestas. Si tiende a un número bajo esta ok y si se va muy arriba ya es muy variable las respuestas. Sds
Gracias por la info, aplicando la ley del Boomeran, como valor agregado comparto lo siuiente: (1:42:53) Para identificar de forma automatiada el tema de los espacios en blano en las cadenas de caracteres, probé esto y me fue bien: --- df_fixture_espacios = df_fixture['home'].str.contains(r"\s") df_fixture_espacios Salida: 0 True 1 True 2 True 3 True 4 True ... 59 True 60 True 61 True 62 True 63 True Name: home, Length: 64, dtype: bool
Dato curioso: en el mundial del 34 los cuartos de final entre Italia y España se jugo con dos partidos: el primero fue empate 1-1 y el segundo (que fue una especie de desempate o "replay") lo ganó la azzurra 1-0.
Місяць тому
Buen video amigo, solo pido que el codigo que subes a github este igual de ordenado que el video para un seguimiento mejor, pronto comprare tu curso crack
Hola. Desafortunadamente, en mi GitHub puedes encontrar un poco de desorden e incluso hay script con comentarios en ingles (no me da tiempo para ordenar/traducir). Sin embargo, los script de los cursos en Udemy están bien ordenados y traducidos al español
Cordial saludo @thepycoach . Cual seria el valor aproximado a cobrar en USD por un proyecto como este del video para una empresa o un particular. PD Es en general la pregunta independientemente de el tema o el fin con que se hizo el proyecto.
Está bueno el curso, aunque se me ha hecho un poco raro de seguir, ya que tanto selenium como en beautiful soup, en ambas recupera la misma cantidad de datos, y cuando hago el concat, concatena todos los mismos valores, pero con diferente indice.
Seguro la pagina se actualizo y por eso ya no hace falta dividir el web scraping en 2 partes como hice en el video. En ese caso, no seria necesario concatenar
@@thepycoachES Disculpa, sabes por que a la hora de hacer el split con no separa los numeros? es que en tu video parece como que los valores fueran tratados como string, pero a mi me salen como un arreglo.
al concatenar las tablas df_home y df_away las columnas the goals conceded y goals scored tienen diferente posicion, no afecta eso a la hora de efectuar el promedio? como que al juntar las dos tablas la columna de conceded the df_away quedara debajo de la de scored de df_home saludos
que capo!, como haces para estar de 0 a 100 en nivel de entendimiento de python. Empece a estudiar ciencia de datos el año pasado, soy analista pero super jr. Y veo estos videos y me re emociona poder llegar a ese nivel, tambien me da ansiedad jajaja
excelente el modelo, solo le agregaría una ponderación que de mayor peso a los promedios de los mundiales más actuales, con el objetivo de corregir el pasó de los años, por ejemplo hungria antes era bueno ahora no tanto.😅
también se podría ajustar el modelo dándole una ponderación a los promedios históricos de cada equipo de acuerdo al ranking fifa actual antes de empezar el mundial.😊
TIE tiene consignado autorizado para trabajar, fue otorgado en agosto/22, son estudios superiores oficiales. ¿puedo trabajar a tiempo parcial mientras espero respuesta de solicitud de prórroga?
Hola, en la parte de testear que todo lo del driver funciona, sólo me abre el navegador en blanco del chrome testing diciendo que esta versión es sólo para pruebas automatizadas, pero no me redirige a la página web.
Hola me encanto el video! Pero no puedo seguir resulta que el navegador(Google) que tengo justamente no es compatible con ninguno de chrome drive . de hecho en la pagina aparece en rojo... que se hace en este caso ? tengo que esperar a que chromedriver repare el problema ? = (
Hola, todo bien, pero al momento de querer visualizar los archivos exportados con pickle, me sale : Dict_tablas is not UTF-8 encoded saving disabled See console for more details. y si lo quiero abrir con block de notas u otro programa sale caracteres raros.
Saludos profesor. Gracias a sus videos me interesé mucho por la Ciencia de Datos, pero también me gusta JavaScript, pues tengo experiencia. ¿Cómo puedo vincular ambas tecnología?
Olvidate de JavaScript, la IA usa librerias de Python, Numpy, Pandas, MatplotLib, SkLearn, Scypy, Google TensorFlow, y Algebra Lineal, Calculo, Probabilistica y Estadistica.
Estoy siguiendo este proyecto para actualizarlo a predecir el campeon del 2026, pero por lo que entiendo, al no estar definidos los participantes del mundial 2026, es imposible determinar en este momento (agosto 2024) que equipo sera el ganador cierto?
Así es, aún no se podría. Sin embargo, aun puedes usar este proyecto/video para practicar. En la descripción deje un enlace de Internet Archive el cual muestra la pagina de Wikipedia del mundial Qatar 2022 como si aún no hubiese empezado (todos los equipos en fase de grupos tienen 0 puntos). De esa manera, podrías seguir el video, aprender Python y "predecir el mundial Qatar 2022"
Buenos dias, @ArtificialCorner quisiera hacerte una consulta. He intentado seguir este video pero me he estancado en un punto por que me aparece el siguiente error. matches = soup.find_all('div', class_='footballbox') home=[] score = [] away = [] for match in matches: home.append(match.find('th', class_= 'fhome').get_text()) score.append(match.find('th', class_= 'fscore').get_text()) away.append(match.find('th', class_= 'faway').get_text()) dict_football = {'home': home, 'score':score, 'away':away} df_football = pd.Dataframe(dict_football) df_football['year'] = '2014' print(df_football) Me arroja el siguiente error AttributeError Traceback (most recent call last) Cell In[14], line 14 10 away.append(match.find('th', class_= 'faway').get_text()) 12 dict_football = {'home': home, 'score':score, 'away':away} ---> 14 df_football = pd.Dataframe(dict_football) 15 df_football['year'] = '2014' 17 print(df_football) File ~\anaconda3\lib\site-packages\pandas\__init__.py:264, in __getattr__(name) 260 from pandas.core.arrays.sparse import SparseArray as _SparseArray 262 return _SparseArray --> 264 raise AttributeError(f"module 'pandas' has no attribute '{name}'") AttributeError: module 'pandas' has no attribute 'Dataframe' Usted me podria sugerir que podría yo hacer para corregir este error. Muchas gracias. Tengo Jupiter 6.5.4
¡Hola! No es Visual Studio, es Pycharm. Me siento más cómodo haciendo web scraping con Pycharm (porque autocompleta codigo) pero no es necesario usar Pycharm. Puedes usar Jupyter
Ahora no recuerdo muy bien, pero creo que quise asegurarme que no hubiese data faltante en ningún año (quizás había data faltante en el 2018) por eso tome todos los años
2 місяці тому
@@thepycoachES porfavor te suplico pongas modo oscuro en tu navegador porfa, y una consulta porque en 2:53:40 df_fixture_final=df_fixture [62:] .copy() no deberia ser "63:" ? porque la linea de arriba ya toma hasta 62
Simplemente usa el link de wikipedia que está en la descripción. Es el link “web archive” el cual muestra Wikipedia tal y como estaba cuando grabe el video.
@@thepycoachES lo hice pero no funcionó , de todos modos pude resolverlo, el bucle "for" debe hacerse desde 13 a 67, en pasos de 7 tal como lo hiciste en el video. Gracias!
Me encantó el proyecto, excelente video, quiero realizarlo pero no puedo extraer la base de datos con el nuevo link, me sale error. ¿Hay alguna otra manera de extraer lo datos?
hola estoy por iniciar este ejercicio, pero se me vino la interrogante si cabe la posibilidad de utilizar el visual code como interprete de python o es posible que existan algunos errores con las librerias o la sintaxis de VC
Hola, buen dia: La siguiente linea de codigo: df_data_historica['score'].str.split('-', expand=True) me da como resultado: 0 [41] 1 [10] 2 [30] 3 [10] 4 [63] ... 896 [01] 897 [10] 898 [20] 899 [12] 900 [00] No lo muestra como tendria que ser: [4, 1] y deduzco que es el causante del siguirente error. (codigo) df_data_historica[['HomeGoals', 'AwayGoals']] = df_data_historica['score'].str.split('-', expand=True) (error) : 399 if columns.is_unique: 400 if len(value.columns) != len(key): --> 401 raise ValueError("Columns must be same length as key") 402 else: 403 # Missing keys in columns are represented as -1 ValueError: Columns must be same length as key Me puedes ayudar en la solucon ? por favor.
Llevo toda la tarde averiguando como pero tampoco encuentro respuesta, es como si en vez de recuperarlo como un string por partes, lo recuperara como un solo bloque y acceder a cada parte es lioso.
Lo más probable es que la página de Wikipedia se haya actualizado. Por ello, puse en la descripción un segundo link que muestra la página de wikipedia tal y como estaba al momento de grabar este video. Prueba el 2do link que se llama algo así como “web archive”
"Predecir" es distinto que "Acertar". Cuando creas un modelo de prediccion nunca va ser 100% efectivo ya que siempre existira un porcentaje en el que puede fallar. Por lo cual el objetivo de un modelo de prediccion no es acertar. Si no que en base a la informacion que te da el modelo tu puedas tomar mejores decisiones y arriesgarte menos en la toma de decisiones
apenas puse import pandas as pd todas_tablas = pd.read_html('en.wikipedia.org/wiki/2014_FIFA_World_Cup') print(todas_tablas) Y no deja de salirme este error :c return codecs.charmap_encode(input,self.errors,encoding_table)[0] UnicodeEncodeError: 'charmap' codec can't encode character '\u2009' in position 135: character maps to Ayuda porfi, es en visual studio
Acabo de subir otro proyecto orientado a modelos de Data Science con Python:
- Proyecto #2: ua-cam.com/video/IgEHjwYQIEo/v-deo.html
En la pagina tal y como esta ahora, los grupos se encuentran en el rango range(12,68,7). Estuvo muy entretenido el video, ahora a animarse a ver mas modelos y a intentarlo hacer con mas caracteristicas en los datos e implantando modelos y redes neuronales de Machine Learning e Inteligencia Artificial.
Este video ha sido estupendo para empezar a dar unos primeros pasos y empezar a tener unos enfoques de como hacerlo. Gracias
Muy bien..muy..bien.... Hay futuro como divulgador científico.... Conciso, práctico...,. Directo sin nada de relleno ni nada flow.... Que usan otros.... Like ,me suscribo...click... Campanita y toda esa weaaaaa que hay que hacer.... Felicitaciones...
Está extremadamente lejos de ser un divulgador cientifico jajaj
Estamos en 2024, pero aun pueden usar este proyecto de predicción del 2022. Tienen dos opciones
- Opción 1: En vez de usar el link de wikipedia que uso en el video (el cual ya tiene todos los resultados actualizados del 2022) pueden usar este link de Internet Archive donde verán la pagina tal como aparece en el video: web.archive.org/web/20221115040351/en.wikipedia.org/wiki/2022_FIFA_World_Cup
- Opción 2: Pueden ir a mi GitHub (link en descripción) y descargar dentro de la carpeta data el archivo "dict_table" y luego usar la librería pickle para leerlo en Jupyter Notebooks como muestro en el video 2:17:46
🔥 Curso Completo de Data Science en Python: www.udemy.com/course/curso-completo-de-data-science-en-python-desde-cero-2022/?couponCode=D0EF9355A745E67AE09A
Tu canal es oro molido, el contenido que haces me ayuda a sintetizar y sentar todo lo que he estado aprendiendo en cursos de diferentes partes. Gracias por compartir este conocimiento tan valioso !
Oro en barra vale mas😂😂
Me ha encantado este mini-curso de Data Science desde cero a la final del Mundial de 2022. Me ha servido para tener un primer contacto real con el mundo del Data Science y con el incentivo de conocer la predicción del Mundial, doble motivación. No se puede pedir más por menos. Muchísimas gracias!!
Este canal vale oro puro. Eres todo un crack amigo. ¡Gracias!
Los que tienene problemas para hacer el for por la actualizacion de las tablas, tan solo tienen que cambiar los parametros
range (12, 67, 7)
Muchisimas gracias por este curso, lo voy a estar siguiendo y realizando. Muchas gracias!!!!
Muy buen video entendible para alguien que recien inicia
Gracias por compartir, existen varias oportunidades de mejora, sobre todo desde el punto de vista de: la cultura habla hispana, la ciencia de datos y las estadísticas y probabilidades aplicadas al futbol, quedo a la orden para compartir mi ángulo.
Chicos, si extrajeron la data con beautifulsoup, al parecer wikipedia arreglo las clases de las etiquetas, asi que funciona igual con beatifulsoup que con selenium. yo me di cuenta despues de hacer las dos! jaja
Excelente,muchas gracias hermano ud habla en Python gracias
La verdad espero algún día llegar a ese nivel...
llegaste a ese nivel?
Muy bueno, preciso en la hora y media que llevo. Excelencia para explicar.
Muchas gracias por el video , a echarle ganas para ser un buen CWI mañana voy a twilight a ver si aplicó gracias !!
Muchas gracias por el desarrollo de este proyecto!
Estuvo muy bueno el video!!!! casi le atinabas en la final jajaja
Hola excelente video, estoy intentanto hacer este proyecto un poco distinto pero con los resultados actuales de los grupos de la europa league. Tengo un problema que me impide tomar todos los grupos en un solo dataframe, sino en 8 df. Espero no tener problemas con eso jajaja
Excelente aporte! No hay mas que decir...
El throughput también es importante leerlo. Quiere decir con la configuración que le diste cuantos requests por segundo pudo procesar.
Analizar el throughput podes ver donde está el cuello de botella o cuánto soporta. El desvío standard también: es cuán variables fueron esas respuestas. Si tiende a un número bajo esta ok y si se va muy arriba ya es muy variable las respuestas. Sds
que genial se ve este video.. voy a intentar seguirlo!! :D
Gracias por la info, aplicando la ley del Boomeran, como valor agregado comparto lo siuiente: (1:42:53)
Para identificar de forma automatiada el tema de los espacios en blano en las cadenas de caracteres, probé esto y me fue bien:
---
df_fixture_espacios = df_fixture['home'].str.contains(r"\s")
df_fixture_espacios
Salida:
0 True
1 True
2 True
3 True
4 True
...
59 True
60 True
61 True
62 True
63 True
Name: home, Length: 64, dtype: bool
Saludos desde Chile!!
Excelente trabajo felicitaciones.
tu modelo predice que Francia estuvo en la final, eso es increíble.
Dato curioso: en el mundial del 34 los cuartos de final entre Italia y España se jugo con dos partidos: el primero fue empate 1-1 y el segundo (que fue una especie de desempate o "replay") lo ganó la azzurra 1-0.
Buen video amigo, solo pido que el codigo que subes a github este igual de ordenado que el video para un seguimiento mejor, pronto comprare tu curso crack
Hola. Desafortunadamente, en mi GitHub puedes encontrar un poco de desorden e incluso hay script con comentarios en ingles (no me da tiempo para ordenar/traducir). Sin embargo, los script de los cursos en Udemy están bien ordenados y traducidos al español
Es muy bueno, lastima que ganamos el mundial nosotros (Arg) pero si fue contra Francia. jajaj Sos crack
Cordial saludo @thepycoach . Cual seria el valor aproximado a cobrar en USD por un proyecto como este del video para una empresa o un particular. PD Es en general la pregunta independientemente de el tema o el fin con que se hizo el proyecto.
Genial, pude hacerlo todo!
Muy bueno tu video y muy util, una consulta, recomiendas estudiar en algun lugar en especial? Muchas Gracias
genial Frank!
Está bueno el curso, aunque se me ha hecho un poco raro de seguir, ya que tanto selenium como en beautiful soup, en ambas recupera la misma cantidad de datos, y cuando hago el concat, concatena todos los mismos valores, pero con diferente indice.
Seguro la pagina se actualizo y por eso ya no hace falta dividir el web scraping en 2 partes como hice en el video. En ese caso, no seria necesario concatenar
@@thepycoachES Disculpa, sabes por que a la hora de hacer el split con no separa los numeros? es que en tu video parece como que los valores fueran tratados como string, pero a mi me salen como un arreglo.
Gran trabajo. Podria hacer la limpieza de datos en Excel?
al concatenar las tablas df_home y df_away las columnas the goals conceded y goals scored tienen diferente posicion, no afecta eso a la hora de efectuar el promedio?
como que al juntar las dos tablas la columna de conceded the df_away quedara debajo de la de scored de df_home
saludos
Excelente video.
GRANDIOSOOO
que capo!, como haces para estar de 0 a 100 en nivel de entendimiento de python. Empece a estudiar ciencia de datos el año pasado, soy analista pero super jr. Y veo estos videos y me re emociona poder llegar a ese nivel, tambien me da ansiedad jajaja
Hola. Si ya tienes la base (pandas, estadística, Python, etc) lo mejor es resolver proyecto. En caso contrario, seria bueno aprender la base
Increible, muchas gracias
Como elimino palabras,caracteres alfanumericos de una celda de un DataFrame de Pandas?, es un archivo de 8000 mil filas aproximadamente x 8 columnas
excelente el modelo, solo le agregaría una ponderación que de mayor peso a los promedios de los mundiales más actuales, con el objetivo de corregir el pasó de los años, por ejemplo hungria antes era bueno ahora no tanto.😅
también se podría ajustar el modelo dándole una ponderación a los promedios históricos de cada equipo de acuerdo al ranking fifa actual antes de empezar el mundial.😊
Agregaría valor indicar cuales son los aspectos a considerar, para que una data esté limpia.
genial, buen trabajo
TIE tiene consignado autorizado para trabajar, fue otorgado en agosto/22, son estudios superiores oficiales. ¿puedo trabajar a tiempo parcial mientras espero respuesta de solicitud de prórroga?
Hola, en la parte de testear que todo lo del driver funciona, sólo me abre el navegador en blanco del chrome testing diciendo que esta versión es sólo para pruebas automatizadas, pero no me redirige a la página web.
BUENISIMO
Hola! Cuales plugins tienes en pycharm para ver el csv con colores?
Que genial el video!
Creo que no está jalando el cupon de udemy, me confirmas por favor
Éxirtos !
Hola. Si, disculpa. Se me olvido actualizar. Ya están los links de los 3 cursos con el descuento en la descripción.
@@thepycoachES Comprado 👍🏻
Hola me encanto el video! Pero no puedo seguir resulta que el navegador(Google) que tengo justamente no es compatible con ninguno de chrome drive . de hecho en la pagina aparece en rojo... que se hace en este caso ? tengo que esperar a que chromedriver repare el problema ? = (
1:49:04 ¿valdría la pena haber ordenado también por el index como segundo criterio para no no perder el orden real de los partidos?
Hola, todo bien, pero al momento de querer visualizar los archivos exportados con pickle, me sale :
Dict_tablas is not UTF-8 encoded
saving disabled
See console for more details.
y si lo quiero abrir con block de notas u otro programa sale caracteres raros.
existe alguna manera de visualizar las tablas como vos pero desde pycharm?
Alguna novedad? Yo tambient tengo la misma incomodidad
Pero si ganó Argentina, entonces por qué los datos dicen Brasil
Saludos profesor. Gracias a sus videos me interesé mucho por la Ciencia de Datos, pero también me gusta JavaScript, pues tengo experiencia. ¿Cómo puedo vincular ambas tecnología?
Olvidate de JavaScript, la IA usa librerias de Python, Numpy, Pandas, MatplotLib, SkLearn, Scypy, Google TensorFlow, y Algebra Lineal, Calculo, Probabilistica y Estadistica.
Estoy siguiendo este proyecto para actualizarlo a predecir el campeon del 2026, pero por lo que entiendo, al no estar definidos los participantes del mundial 2026, es imposible determinar en este momento (agosto 2024) que equipo sera el ganador cierto?
Así es, aún no se podría. Sin embargo, aun puedes usar este proyecto/video para practicar. En la descripción deje un enlace de Internet Archive el cual muestra la pagina de Wikipedia del mundial Qatar 2022 como si aún no hubiese empezado (todos los equipos en fase de grupos tienen 0 puntos). De esa manera, podrías seguir el video, aprender Python y "predecir el mundial Qatar 2022"
Tengo problemas en separar las columnas 2:02:50 , solo me devuelve una columna en vez de 2... Alguien sabe por qué? Saludos.
A mi la tabla del Grupo A no me aparece, la busque uno a uno y obviamente en el 11 no me salio, puedo visualizar recien la B en el 18
Buenos dias, @ArtificialCorner quisiera hacerte una consulta. He intentado seguir este video pero me he estancado en un punto por que me aparece el siguiente error.
matches = soup.find_all('div', class_='footballbox')
home=[]
score = []
away = []
for match in matches:
home.append(match.find('th', class_= 'fhome').get_text())
score.append(match.find('th', class_= 'fscore').get_text())
away.append(match.find('th', class_= 'faway').get_text())
dict_football = {'home': home, 'score':score, 'away':away}
df_football = pd.Dataframe(dict_football)
df_football['year'] = '2014'
print(df_football)
Me arroja el siguiente error
AttributeError Traceback (most recent call last)
Cell In[14], line 14
10 away.append(match.find('th', class_= 'faway').get_text())
12 dict_football = {'home': home, 'score':score, 'away':away}
---> 14 df_football = pd.Dataframe(dict_football)
15 df_football['year'] = '2014'
17 print(df_football)
File ~\anaconda3\lib\site-packages\pandas\__init__.py:264, in __getattr__(name)
260 from pandas.core.arrays.sparse import SparseArray as _SparseArray
262 return _SparseArray
--> 264 raise AttributeError(f"module 'pandas' has no attribute '{name}'")
AttributeError: module 'pandas' has no attribute 'Dataframe'
Usted me podria sugerir que podría yo hacer para corregir este error. Muchas gracias. Tengo Jupiter 6.5.4
Costa Rica en su primer Mundial, Italia 90, pasó a segunda ronda, venciendo a Escocia y Suecia.
mmm 🤔
I was ready to get a virus on my pc lol, but it actually worked!
una consulta a los que saben, porque primero empieza usando jupyter y luego cambia a visual studio? es necesario o cual es la ventaja
1:34:31 porque sacas el missing data hasta 2018 si la primera bases jalas info hasta 2022?
¡Hola! No es Visual Studio, es Pycharm. Me siento más cómodo haciendo web scraping con Pycharm (porque autocompleta codigo) pero no es necesario usar Pycharm. Puedes usar Jupyter
Ahora no recuerdo muy bien, pero creo que quise asegurarme que no hubiese data faltante en ningún año (quizás había data faltante en el 2018) por eso tome todos los años
@@thepycoachES porfavor te suplico pongas modo oscuro en tu navegador porfa, y una consulta porque en 2:53:40 df_fixture_final=df_fixture [62:] .copy()
no deberia ser "63:" ? porque la linea de arriba ya toma hasta 62
En Google Colab no puedo avanzar. Me quedo atorado en la parte donde hay que usar Selenium
Alguna sugerencia?
Prueba usando un editor de codigo local (VSCode, Jupyter Notebook, Pycharm, etc)
gracias por el video, la pagina de wiki va actualizando, como se puede hacer un metodo para inspeccionar el nombre de las tablas? gracias nuevamente
Simplemente usa el link de wikipedia que está en la descripción. Es el link “web archive” el cual muestra Wikipedia tal y como estaba cuando grabe el video.
@@thepycoachES lo hice pero no funcionó , de todos modos pude resolverlo, el bucle "for" debe hacerse desde 13 a 67, en pasos de 7 tal como lo hiciste en el video. Gracias!
Me encantó el proyecto, excelente video, quiero realizarlo pero no puedo extraer la base de datos con el nuevo link, me sale error. ¿Hay alguna otra manera de extraer lo datos?
utiliza el link que esta en la descripcion y cuando estes extrayendo las tablas empieza desde la 12 y asi como explica el video
Buenas, pregunta...de que depende que usemos pandas para leer el html a usar BeautifulSoup? Gracias!
Leer el html te sirve para cuando las páginas tienen la informacion condensada (como tablas en el archivo de Wikipedia)
@@vergnungungspark2386 genial amigo gracias por responder ahora otra duda jaja…si no es de forma condensada de que otra puede ser?
wow bro
hola estoy por iniciar este ejercicio, pero se me vino la interrogante si cabe la posibilidad de utilizar el visual code como interprete de python o es posible que existan algunos errores con las librerias o la sintaxis de VC
puedes usar jupyter en vcode
🐂 Buen video
🎉🎉🎉
Excelente explicacion, pero veo que tu curso en Udemy no esta actualizado deberias actualizarlo con cosas nuevas bueno es mi opinion
Este proyecto en cual de tus cursos lo encuentro
Hola, buen dia: La siguiente linea de codigo: df_data_historica['score'].str.split('-', expand=True)
me da como resultado:
0 [41]
1 [10]
2 [30]
3 [10]
4 [63]
...
896 [01]
897 [10]
898 [20]
899 [12]
900 [00]
No lo muestra como tendria que ser: [4, 1]
y deduzco que es el causante del siguirente error.
(codigo) df_data_historica[['HomeGoals', 'AwayGoals']] = df_data_historica['score'].str.split('-', expand=True)
(error) : 399 if columns.is_unique:
400 if len(value.columns) != len(key):
--> 401 raise ValueError("Columns must be same length as key")
402 else:
403 # Missing keys in columns are represented as -1
ValueError: Columns must be same length as key
Me puedes ayudar en la solucon ? por favor.
Llevo toda la tarde averiguando como pero tampoco encuentro respuesta, es como si en vez de recuperarlo como un string por partes, lo recuperara como un solo bloque y acceder a cada parte es lioso.
30:06
Lo interesante fue que predijo que Francia juege la final y la pierda, no por brasil, sino por argentina🏆
Hola, no se si la extracion de los datos se hizo hace algun tiempo o por que el link me trae otros datos, con tablas totalmente diferentes
Lo más probable es que la página de Wikipedia se haya actualizado. Por ello, puse en la descripción un segundo link que muestra la página de wikipedia tal y como estaba al momento de grabar este video.
Prueba el 2do link que se llama algo así como “web archive”
@@thepycoachES exactamente ese link estoy usando y no me regresa la misma informacion
@@thepycoachES exactamente con el link trae otros datos de las paguinas
empieza en 1970 y finnliza en 2010 pero solo trae el año
Disculpen mi ignorancia, pero porque dijo que ganaría Brasil?, si ganó Argentina, no se supone que debería de predecir a Argentina como ganador?
"Predecir" es distinto que "Acertar".
Cuando creas un modelo de prediccion nunca va ser 100% efectivo ya que siempre existira un porcentaje en el que puede fallar.
Por lo cual el objetivo de un modelo de prediccion no es acertar. Si no que en base a la informacion que te da el modelo tu puedas tomar mejores decisiones y arriesgarte menos en la toma de decisiones
pero el ganador fue argentina, en que fallo el modelo programado?
en que es una predicción bro, no es un programa que sea vidente del futuro
La teoría del caos, un evento por mínimo que sea altera todo un sistema.
Mejor era sólo escribir...
print("gana Argentina")
⭐⭐⭐
hola me sale una excepcion
50% de acierto no esta mal.
Los medios y terrores de la Europa decadente, distopica.
Vengo del futuro y el campeón es Argentina 🇦🇷
Gei
Campeoooooon
@@wilbmx01llore
0tcdwq xhi
Menos mal que no predecis temas de salud
Nug
No me gustó, muy básico el análisis.
Asi debio ser la final Francia vs Brazil, pero se la regalaron a Frionel Pessi
Jajajjajaja, la tenés adentro.
jaja
L,
pero.... sale muy mal el resultado, ni braSil llega a la final, ni France gana...
apenas puse
import pandas as pd
todas_tablas = pd.read_html('en.wikipedia.org/wiki/2014_FIFA_World_Cup')
print(todas_tablas)
Y no deja de salirme este error :c
return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode character '\u2009' in position 135: character maps to
Ayuda porfi, es en visual studio
que raro, ejecute tu codigo en mi visual studio y funciona perfect