Genial diego, esperamos que el contenido te sea útil. Estamos creando un curso que vamos a subir de Python totalmente gratis. Esperamos que te sea útil. Un saludo !!!!!
Hola Mauricio gracias por compartir tu experiencia, nos alegra mucho que el contenido te sea útil 😊 si nos ayudas a compartir los vídeos con las personas que conozcas te lo agradeceríamos mucho, un saludo 😊👍😉
Excelente gracias, una pregunta: si quiero sumar los valores de una columna?, por ejemplo tengo en la columna genero mujeres y necesito saber el total. gracias
¡Hola! Me alegra que te haya gustado el video. Para sumar los valores de una columna en un DataFrame de pandas, puedes usar el método sum(). Si en tu columna "genero" tienes el valor "mujeres" y quieres contar cuántas veces aparece, puedes hacer lo siguiente: total_mujeres = df[df['genero'] == 'mujeres'].shape[0]. Si lo que necesitas es sumar valores numéricos de una columna, solo necesitas usar el método sum() directamente: total_edades = df['edad'].sum(). Espero que esto te sea de ayuda. ¡Gracias por tu pregunta y por ver el video!
Si tengo un data frame de 30 rows y 25 columns, como hago para que en la función df.describe() me imprima las 30 rows completas y que no omita rows con ... . Agradecería mucho de su ayuda.
Hola Hugo, el método describe() te da estadísticas de tus datos, por lo que el número de filas está limitado, a los cuantiles, el máximo, el mínimo de cada columna. Me párese que te puedes tar refiriendo al.metodo .head() donde dentro de los paréntesis puedes colocar el número de filas a mostrar. En todo caso, puedes escribirnos a aquapyingenieria@gmail.com.
Muy buenas noches, muy util este manejo de fitros, una pregunta si yo quisiera para asignar un filtro de este tipo comparar un dato actual con el anterior de una misma columna, como podria hacerlo, existe alguna forma por este lado que depronto no requiera el uso de ciclos?. gracias
Hola Julian, muchas gracias por tu comentario, el método .iloc te vendría bien para desarrollar lo que dices, podrías colocar todo en un for e ir restando posiciones entre filas o entre columnas, en todo caso si necesitas algo más específico no dudes escribirnos a aquapyingenieria@gmail.com. Un Saludo!!
Hola Jairo, muchas veces no queremos trabajar con todos los datos de un DataFrame y por eso es necesario filtrar los datos, muchas gracias por comentar!!!
Muchas gracias gran vídeo, tengo una duda, si yo quiero filtrar un subconjunto de datos, por una fecha, ejemplo todos aquellos registros que fueron hechos desde 01/02/2024 en adelante? gracias
¡Hola! Muchas gracias por tu comentario y por ver el vídeo. Para filtrar un subconjunto de datos por una fecha específica, puedes usar las siguientes instrucciones dependiendo del lenguaje o herramienta que estés utilizando. Suponiendo que tienes un DataFrame llamado df y una columna de fecha llamada 'fecha', df['fecha'] = pd.to_datetime(df['fecha']) - Asegúrate de que la columna de fecha esté en formato datetime - filtered_df = df[df['fecha'] >= '2024-02-01']
Hola Jeffer, lo que puedes hacer es asignar ese dataframe filtrado en una nueva variable, para poder trabajar con esos datos previamente filtrados. Si sigues con dudas por favor escríbenos 😉 aquapyingenieria@gmail.com. Un saludo.
Hola amigo muchas gracias por tu video, te hago una pregunta... ¿Como podría extraer toda la columa index? ya que por ejemplo si quiero imprimir una columna en particular solo debo hacer df['nombre columna'] pero para la columna Index como debería hacerse? Saludos
Hola buenas tardes, ¿Como se puede verificar si una serie de datos a partir de un dataframe estan presenten en alguna fila de una columna especifica de otro dataframe?
Hola Lizbeth, desafortunadamente no tenemos un vídeo específico para eso, pero podemos verlo en una sesión. Si te interesa escríbenos a aquapyingenieria@gmail.com, estamos para ayudarte 😉 un saludo !!
una pregunta y cuando tiene dos nombres y los apellidos en el mismo campo y se quiere dividir nombres y apellidos por aparte, ha sido interesante el video !
Hola muchas gracias por tu comentario, si es una cadena de texto aplicas el método split. Puedes usar algo como: df["name"].str.split(expand=True). Sin embargo ten en cuenta que está función te puede separar todo en columnas a parte que posteriormente puedes concatenar. Es decir unir los nombres y los apellidos con algo como esto df["Full Name"] = df["First"] + " " + df["Last"]. Espero te sea útil la respuesta un saludo 😊!!!
hola, y como puedo citar solo 1 fila y modificarla? no hacer el conteo de 0 a 3 sino por ejemplo solo 1 unica fila y sobre escribir datos en ella... muy buen video, gracias
Hola Isaac con el método .iloc podrías. Por ejemplo df.iloc[0,0] = 1. Aqui a la fila cero columna cero le estamos asignando el valor de 1. Esperamos que el contenido te sea útil!! Un saludo!!
Gracias por tu comentario, me alegro mucho que te sea interesante el contenido!!! Bueno son pistas que trae por defecto el programa con el que grabó. Si quieres saber más nos puedes enviar un correo aquapyingenieria@gmail.com. Un saludo 😊
Hola excelente pregunta, en general en una columna de pandas solo puedes tener un tipo de datos, es decir, no puedes tener enteros y flotantes al mismo tiempo, por lo que filtrar por números enteros en este caso no es lo más factible, lo que si puedes es convertir de flotantes a enteros por ejemplo con 'astype'. Cualquier duda me puedes escribir al correo aquapyingenieria@gmail.com, un saludo!!!
Cuando ejecuto : df[df["Sexo"] == "Femenino"].max() me sale esto: C:\Users\alex\AppData\Local\Temp\ipykernel_18760\2510272187.py:2: FutureWarning: Dropping of nuisance columns in DataFrame reductions (with 'numeric_only=None') is deprecated; in a future version this will raise TypeError. Select only valid columns before calling the reduction. mujer_old = df[df["Sexo"] == "Femenino"].max() Igual me arroja el resultado, pero no se porque me tira ese error y a usted no
Hola Yoyix gracias por comentar,, lo que te sale no es un error, es una advertencia. La Liberia te está diciendo que en el futuro van a cambiar esa estructura y la van a actualizar, eso suele pasar bastante porque constantemente están desarrollando nuevos métodos y optimizaciones para mejorar el programa. Gracias por tu comentario 😁 un saludo!!
Hola Cristo, tendrías que con la función iloc identificar el índice de esa fila, si es numérico el índice y por ejemplo es la fila 10 tendrías: df.iloc[[10],:] y tu resultado lo guardas en un nuevo Dataframe de esa forma podrás exportarlo... Sin embargo, si te surgen más dudas puedes escribirme al correo electrónico: aquapyingenieria@gmail.com un saludo ☺️
Hola Cristo simplemente una vez tienes exportada tu tabla en un fichero (txt, csv, etc..) puedes cargar tu Dataframe en java con danfo (df = dfb.DataFrame(table) u otro paquete que sirva para cargar ficheros de datos en java, un saludo!!
Hola Diego, tendrías que cargar por aparte los dos dataframes y almacenarlos en dos variables diferentes, por ejemplo df1 y df2. Después colocas df1= df2 y te va a realizar una comparación por columnas boleana, si devuelve True si los elementos correspondientes de esa posición son iguales, en caso contrario devuelve False. Esta es una forma sencilla pero no muy útil si son muchos datos, si quieres puedes enviarnos un correo en caso de que sea algo más complicado. (aquapyingenieria@gmail.com) Un Saludo y gracias por dejarnos tus dudas!!!!!
Podrías filtrar por dos columnas, imagina que en la columna Age del Dataframe df tienes la edad y en la columna Gender el género (0 = mujeres, 1= hombres) para filtrar mujeres con más de 15 años podrías usar esto: df1 = df[(df.Age > 15) & (df.Gender == 0)] Esta es una de muchas formas en que lo puedes hacer. Un saludo 😊👍.
Hola Erics muchas gracias por escribirnos 😉!! Al final la ganancia está en automatizar y hacer todo lo que por ejemplo haces en Excel y mucho más pero de forma automática. Este es un vídeo de introducción muy básico, pero pandas y Python van a otro nivel, mucho más que Excel. Un saludo!!
La resolución de la celda 88, donde se indica "Pasajeros mujeres con mayor edad ...." es errada Se puede comprobar con > df[df.Nombre == "de Messemaeker, Mrs. Guillaume Joseph (Emma)"] Su edad es 36. El output de > df[df.Sexo == "Femenino"].max() Se interpreta como: 1.- Se genera un subset donde todas los rows son "Femenino" 2.- max() devuelve el máximo de cada uno de los rows, es decir, el máximo de la column "Survived" es 1, de "Clase" es 3, de "Nombre" es /de Messemaeker, Mrs. Guillaume Joseph (Emma)/ (por la cantidad de caracteres), etc Una de las soluciones debería ser: > df[df.Edad == max(df[df.Sexo == "Femenino"].Edad)] Se comprueba con: > df[df["Sexo"]=="Femenino"].sort_values(by="Edad", ascending=False) Saludos.
La función te da el máximo de cada columna ... Y efectivamente la mujer con más edad tiene 63 años que es lo que se pide ... Sin embargo, puede ser confuso al pensar que el nombre de la mujer es el que trae la función en este caso nos trae el nombre más largo o con mayor número de caracteres, por eso aclaro en el vídeo que son atributos separados diciendo mayor edad, mayor número de familiares... si sigues viendo el video en la explicación de la función .min() aclaro que son datos de columnas !! Aunque no es una errata puede ser confuso lo tendré en cuenta un saludo gracias por tu comentario !!! 😉
Gracias por compartir. Exelente tutorial.
es muy bueno cada uno de los videos, muchas gracias
A ti Lina gracias por tus comentarios 😃 un saludo!!!
Excelente video si que sabes enseñar para las personas que no sabemos programación
Genial diego, esperamos que el contenido te sea útil. Estamos creando un curso que vamos a subir de Python totalmente gratis. Esperamos que te sea útil. Un saludo !!!!!
Excelente video. Una clase muy buena para seleccionar filas y columanas en pandas
Muchas gracias por tu comentario Antonio, espero que todos los videos de este curso pandas te sean útiles!! Un saludo!!
Excelente exposición, clara, sencilla pero muy profesional. Muchas gracias Profesor.
Genial gracias 😊 espero que te sea útil, un saludo elio
Excelente video
Muy didactivo, muchas gracias por tus videos. Vamos como avión con tus videos :)
Genial Patricio nos alegramos que te sean útiles los vídeos, un saludo 😊👍
Muchas gracias por hacer estos videos. No dejes de hacerlo. Te recomendaré a mis contactos.
Muchas gracias Julio, un saludo!!
de verdad maravilloso el video, hacía falta . Muchas Gracias, te ganaste un megusta y un suscriptor
Genial Vicentino nos alegra que te sea útil la información y los vídeos un saludo !!!
Me salvo este video, gracias !!
Genial @Emi esperamos que el resto de contenido que tenemos sea útil para ti. Un saludo 😊
Muchas gracias por tu ayuda
excelente video, muy buena la explicación 10/10 . gracias
Muchas gracias Ariel por tu comentario... Muy contentos de recibir mensajes como el tuyo.. un saludo ☺️
Muchas gracias por el video! excelente!
Excelente video, me ayudó a resolver varios temas. Felicitaciones
Genial Valmore nos alegra mucho, un saludo !!
Súper útil a los que nos estamos iniciando en el mundo Python. Gracias
Un gusto conocerte Daniel, esperamos que sea muy útil el canal próximamente estaremos actualizando contenidos !!!
gracias me sirvió muchísimo!!
Hola Mauricio gracias por compartir tu experiencia, nos alegra mucho que el contenido te sea útil 😊 si nos ayudas a compartir los vídeos con las personas que conozcas te lo agradeceríamos mucho, un saludo 😊👍😉
Gracias
Excelente gracias, una pregunta: si quiero sumar los valores de una columna?, por ejemplo tengo en la columna genero mujeres y necesito saber el total.
gracias
¡Hola! Me alegra que te haya gustado el video. Para sumar los valores de una columna en un DataFrame de pandas, puedes usar el método sum(). Si en tu columna "genero" tienes el valor "mujeres" y quieres contar cuántas veces aparece, puedes hacer lo siguiente: total_mujeres = df[df['genero'] == 'mujeres'].shape[0]. Si lo que necesitas es sumar valores numéricos de una columna, solo necesitas usar el método sum() directamente: total_edades = df['edad'].sum(). Espero que esto te sea de ayuda. ¡Gracias por tu pregunta y por ver el video!
Gracias por el video muy bien explicado
Esperamos que el contenido te sea útil. Un saludo!!!
Si tengo un data frame de 30 rows y 25 columns, como hago para que en la función df.describe() me imprima las 30 rows completas y que no omita rows con ... . Agradecería mucho de su ayuda.
Hola Hugo, el método describe() te da estadísticas de tus datos, por lo que el número de filas está limitado, a los cuantiles, el máximo, el mínimo de cada columna. Me párese que te puedes tar refiriendo al.metodo .head() donde dentro de los paréntesis puedes colocar el número de filas a mostrar. En todo caso, puedes escribirnos a aquapyingenieria@gmail.com.
Muy buenas noches, muy util este manejo de fitros, una pregunta si yo quisiera para asignar un filtro de este tipo comparar un dato actual con el anterior de una misma columna, como podria hacerlo, existe alguna forma por este lado que depronto no requiera el uso de ciclos?. gracias
Hola Julian, muchas gracias por tu comentario, el método .iloc te vendría bien para desarrollar lo que dices, podrías colocar todo en un for e ir restando posiciones entre filas o entre columnas, en todo caso si necesitas algo más específico no dudes escribirnos a aquapyingenieria@gmail.com. Un Saludo!!
Esta muy bueno el video , pueden hacer operaciones matematicas con las columnas
Hola, lo tendremos en cuenta para futuros vídeos!!! Gracias por tu comentario ☺️
Me asalta una duda, ¿para que devolveria en un filtrado todas las filas y columnas?
Hola Jairo, muchas veces no queremos trabajar con todos los datos de un DataFrame y por eso es necesario filtrar los datos, muchas gracias por comentar!!!
Muchas gracias gran vídeo, tengo una duda, si yo quiero filtrar un subconjunto de datos, por una fecha, ejemplo todos aquellos registros que fueron hechos desde 01/02/2024 en adelante? gracias
¡Hola! Muchas gracias por tu comentario y por ver el vídeo. Para filtrar un subconjunto de datos por una fecha específica, puedes usar las siguientes instrucciones dependiendo del lenguaje o herramienta que estés utilizando. Suponiendo que tienes un DataFrame llamado df y una columna de fecha llamada 'fecha', df['fecha'] = pd.to_datetime(df['fecha']) - Asegúrate de que la columna de fecha esté en formato datetime - filtered_df = df[df['fecha'] >= '2024-02-01']
Massa! Obrigada.
Gracias por tu comentario, un saludo!!!
Aguante Milei
Una pregunta ya data science, ya filtrado con los valores de Masculino, como poder analisar eso datos ya filtrado
Hola Jeffer, lo que puedes hacer es asignar ese dataframe filtrado en una nueva variable, para poder trabajar con esos datos previamente filtrados. Si sigues con dudas por favor escríbenos 😉 aquapyingenieria@gmail.com. Un saludo.
👏🙏👍
Muchas gracias por tu comentario Antonio ☺️, un saludo !!!
Hola buen dia , me gustaria tener contacto con vos para una serie de asesorias . Si podrias te agradeceria
Hola Carlos nos puedes contactar en redes sociales o en el correo electrónico aquapyingenieria@gmail.com 😉 un saludo y gracias por comentarnos!!!
@@Aquapying Buen día por medio del email envie la consulta
Genial Carlos ya te hemos respondido un saludo 😊👍
te pasaste!
Muchas gracias por tu comentario 🙂
Hola amigo muchas gracias por tu video, te hago una pregunta... ¿Como podría extraer toda la columa index?
ya que por ejemplo si quiero imprimir una columna en particular solo debo hacer df['nombre columna'] pero para la columna Index como debería hacerse?
Saludos
Hola Gerardo gracias por escribirnos 😉 para extraer la columna Index puedes usar el comando df.index, un saludo 👍😊!!
@@Aquapying amigo muchas gracias por responder, excelente tu canal tienes un seguidor 😎
Muchas gracias Gerardo 😉👍
Hola buenas tardes, ¿Como se puede verificar si una serie de datos a partir de un dataframe estan presenten en alguna fila de una columna especifica de otro dataframe?
Hola Lizbeth, desafortunadamente no tenemos un vídeo específico para eso, pero podemos verlo en una sesión. Si te interesa escríbenos a aquapyingenieria@gmail.com, estamos para ayudarte 😉 un saludo !!
una pregunta y cuando tiene dos nombres y los apellidos en el mismo campo y se quiere dividir nombres y apellidos por aparte, ha sido interesante el video !
Hola muchas gracias por tu comentario, si es una cadena de texto aplicas el método split. Puedes usar algo como: df["name"].str.split(expand=True). Sin embargo ten en cuenta que está función te puede separar todo en columnas a parte que posteriormente puedes concatenar. Es decir unir los nombres y los apellidos con algo como esto df["Full Name"] = df["First"] + " " + df["Last"]. Espero te sea útil la respuesta un saludo 😊!!!
Gracias. Como podría comprobar si una cadena dada está presente en el dataframe ?
Hola Maria, podrías analizar el dataseries, por aparte y comparar. Gracias por tu comentario, un saludo!!
hola, y como puedo citar solo 1 fila y modificarla? no hacer el conteo de 0 a 3 sino por ejemplo solo 1 unica fila y sobre escribir datos en ella...
muy buen video, gracias
Hola Isaac con el método .iloc podrías. Por ejemplo df.iloc[0,0] = 1. Aqui a la fila cero columna cero le estamos asignando el valor de 1. Esperamos que el contenido te sea útil!! Un saludo!!
¿Puedes explicar como utilizar groupby en un dataframe y como hallar los promedios con esa función?
Hola claro que si. Lo apuntamos en nuestro plan de contenido. Cómo ya tenemos algo de cola en la lista esperamos publicarlo a final de este mes ☺️
@@Aquapying Muchas gracias estare atenta al video cuando lo lances
Hola ya está publicado 😃. Esperamos te sea útil, nos ayudarías mucho compartiendo y regalándonos un me gusta y un súper gracias 🤭 un saludo !!!!
@@Aquapying genial lo veré 😍😍 muchas gracias
Explicas muy bien 10/10
Qué musica usas para tus videos?, me ayudan a concetrarme y me agradan mucho
Gracias por tu comentario, me alegro mucho que te sea interesante el contenido!!! Bueno son pistas que trae por defecto el programa con el que grabó. Si quieres saber más nos puedes enviar un correo aquapyingenieria@gmail.com. Un saludo 😊
Muy buen video, como se podría hacer para filtrar los números enteros?, por ejemplo en las edades.
Hola excelente pregunta, en general en una columna de pandas solo puedes tener un tipo de datos, es decir, no puedes tener enteros y flotantes al mismo tiempo, por lo que filtrar por números enteros en este caso no es lo más factible, lo que si puedes es convertir de flotantes a enteros por ejemplo con 'astype'. Cualquier duda me puedes escribir al correo aquapyingenieria@gmail.com, un saludo!!!
Cuando ejecuto : df[df["Sexo"] == "Femenino"].max()
me sale esto:
C:\Users\alex\AppData\Local\Temp\ipykernel_18760\2510272187.py:2: FutureWarning: Dropping of nuisance columns in DataFrame reductions (with 'numeric_only=None') is deprecated; in a future version this will raise TypeError. Select only valid columns before calling the reduction.
mujer_old = df[df["Sexo"] == "Femenino"].max()
Igual me arroja el resultado, pero no se porque me tira ese error y a usted no
Hola Yoyix gracias por comentar,, lo que te sale no es un error, es una advertencia. La Liberia te está diciendo que en el futuro van a cambiar esa estructura y la van a actualizar, eso suele pasar bastante porque constantemente están desarrollando nuevos métodos y optimizaciones para mejorar el programa. Gracias por tu comentario 😁 un saludo!!
Quiero seleccionar un renglon específico de un csv (tiene muchos renglones) y guardar los datos de ese renglón en un arreglo. cómo le haría?
Hola Cristo, tendrías que con la función iloc identificar el índice de esa fila, si es numérico el índice y por ejemplo es la fila 10 tendrías: df.iloc[[10],:] y tu resultado lo guardas en un nuevo Dataframe de esa forma podrás exportarlo... Sin embargo, si te surgen más dudas puedes escribirme al correo electrónico: aquapyingenieria@gmail.com un saludo ☺️
@@Aquapying y para llevar ese arreglo a Javascript? (template HTML).
Hola Cristo simplemente una vez tienes exportada tu tabla en un fichero (txt, csv, etc..) puedes cargar tu Dataframe en java con danfo (df = dfb.DataFrame(table) u otro paquete que sirva para cargar ficheros de datos en java, un saludo!!
Te respondí en el otro comentario que hiciste Cristo un saludo !!
buenos días, me gustaría saber como comparar 2 archivos de excel para ver que hay en uno y
falta en el otro
Hola Diego, tendrías que cargar por aparte los dos dataframes y almacenarlos en dos variables diferentes, por ejemplo df1 y df2. Después colocas df1= df2 y te va a realizar una comparación por columnas boleana, si devuelve True si los elementos correspondientes de esa posición son iguales, en caso contrario devuelve False. Esta es una forma sencilla pero no muy útil si son muchos datos, si quieres puedes enviarnos un correo en caso de que sea algo más complicado. (aquapyingenieria@gmail.com)
Un Saludo y gracias por dejarnos tus dudas!!!!!
Cómo se puede filtrar bajo dos condiciones?
Podrías filtrar por dos columnas, imagina que en la columna Age del Dataframe df tienes la edad y en la columna Gender el género (0 = mujeres, 1= hombres) para filtrar mujeres con más de 15 años podrías usar esto:
df1 = df[(df.Age > 15) & (df.Gender == 0)]
Esta es una de muchas formas en que lo puedes hacer. Un saludo 😊👍.
Disculpa la ignorancia pero esto después se puede exportar como Excel? aún no le encuentro sentido a la utilización de Pandas
Hola Erics muchas gracias por escribirnos 😉!! Al final la ganancia está en automatizar y hacer todo lo que por ejemplo haces en Excel y mucho más pero de forma automática. Este es un vídeo de introducción muy básico, pero pandas y Python van a otro nivel, mucho más que Excel. Un saludo!!
La resolución de la celda 88, donde se indica "Pasajeros mujeres con mayor edad ...." es errada
Se puede comprobar con > df[df.Nombre == "de Messemaeker, Mrs. Guillaume Joseph (Emma)"]
Su edad es 36.
El output de > df[df.Sexo == "Femenino"].max()
Se interpreta como:
1.- Se genera un subset donde todas los rows son "Femenino"
2.- max() devuelve el máximo de cada uno de los rows, es decir, el máximo de la column "Survived" es 1, de "Clase" es 3, de "Nombre" es /de Messemaeker, Mrs. Guillaume Joseph (Emma)/ (por la cantidad de caracteres), etc
Una de las soluciones debería ser:
> df[df.Edad == max(df[df.Sexo == "Femenino"].Edad)]
Se comprueba con:
> df[df["Sexo"]=="Femenino"].sort_values(by="Edad", ascending=False)
Saludos.
La función te da el máximo de cada columna ... Y efectivamente la mujer con más edad tiene 63 años que es lo que se pide ... Sin embargo, puede ser confuso al pensar que el nombre de la mujer es el que trae la función en este caso nos trae el nombre más largo o con mayor número de caracteres, por eso aclaro en el vídeo que son atributos separados diciendo mayor edad, mayor número de familiares... si sigues viendo el video en la explicación de la función .min() aclaro que son datos de columnas !! Aunque no es una errata puede ser confuso lo tendré en cuenta un saludo gracias por tu comentario !!! 😉
@@Aquapying He vuelto a ver el video y es tal como dices.
Gracias por la aclaración.
Sigue así con tus videos, están buenos.
Saludos.
Genial 👍👍 igual no sobra tu comentario gracias a eso hago la aclaración y mejoro mi contenido, muchas gracias un saludo ...