3│Filtrar dataframe en pandas Python, selección de filas y columnas python - método .loc y .iloc.

Aquapy Ingeniería

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 2 лют 2025

КОМЕНТАРІ • 94

@mafrov2180 Рік тому ⁺²
Gracias por compartir. Exelente tutorial.
@linabuitragoarias8275 2 роки тому ⁺³
es muy bueno cada uno de los videos, muchas gracias
@Aquapying 2 роки тому
A ti Lina gracias por tus comentarios 😃 un saludo!!!
@diegoroldanroldan5393 9 місяців тому ⁺²
Excelente video si que sabes enseñar para las personas que no sabemos programación
@Aquapying 8 місяців тому ⁺¹
Genial diego, esperamos que el contenido te sea útil. Estamos creando un curso que vamos a subir de Python totalmente gratis. Esperamos que te sea útil. Un saludo !!!!!
@antonioredondo7134 2 роки тому ⁺²
Excelente video. Una clase muy buena para seleccionar filas y columanas en pandas
@Aquapying 2 роки тому
Muchas gracias por tu comentario Antonio, espero que todos los videos de este curso pandas te sean útiles!! Un saludo!!
@elioduran60 2 роки тому ⁺³
Excelente exposición, clara, sencilla pero muy profesional. Muchas gracias Profesor.
@Aquapying 2 роки тому
Genial gracias 😊 espero que te sea útil, un saludo elio
@zeusdeus3483 3 роки тому ⁺²
Excelente video
@patricioirribarra7494 2 роки тому ⁺²
Muy didactivo, muchas gracias por tus videos. Vamos como avión con tus videos :)
@Aquapying 2 роки тому
Genial Patricio nos alegramos que te sean útiles los vídeos, un saludo 😊👍
@jabpcomplex 3 роки тому ⁺²
Muchas gracias por hacer estos videos. No dejes de hacerlo. Te recomendaré a mis contactos.
@Aquapying 3 роки тому
Muchas gracias Julio, un saludo!!
@vicentinhogonzalez7451 3 роки тому ⁺²
de verdad maravilloso el video, hacía falta . Muchas Gracias, te ganaste un megusta y un suscriptor
@Aquapying 3 роки тому
Genial Vicentino nos alegra que te sea útil la información y los vídeos un saludo !!!
@emib1936 2 роки тому ⁺³
Me salvo este video, gracias !!
@Aquapying 2 роки тому
Genial @Emi esperamos que el resto de contenido que tenemos sea útil para ti. Un saludo 😊
@pautuber7180 19 днів тому
Muchas gracias por tu ayuda
@arielarias8971 Рік тому ⁺¹
excelente video, muy buena la explicación 10/10 . gracias
@Aquapying Рік тому
Muchas gracias Ariel por tu comentario... Muy contentos de recibir mensajes como el tuyo.. un saludo ☺️
@nucleoinfinito9542 Рік тому ⁺²
Muchas gracias por el video! excelente!
@valmorevasquez3829 3 роки тому ⁺²
Excelente video, me ayudó a resolver varios temas. Felicitaciones
@Aquapying 3 роки тому
Genial Valmore nos alegra mucho, un saludo !!
@danielsan6676 3 роки тому ⁺³
Súper útil a los que nos estamos iniciando en el mundo Python. Gracias
@Aquapying 3 роки тому
Un gusto conocerte Daniel, esperamos que sea muy útil el canal próximamente estaremos actualizando contenidos !!!
@mauriciodanieltelleznava2463 2 роки тому ⁺²
gracias me sirvió muchísimo!!
@Aquapying 2 роки тому
Hola Mauricio gracias por compartir tu experiencia, nos alegra mucho que el contenido te sea útil 😊 si nos ayudas a compartir los vídeos con las personas que conozcas te lo agradeceríamos mucho, un saludo 😊👍😉
@ihaliramirez3198 7 місяців тому ⁺²
Gracias
@leytonantonio 8 місяців тому ⁺¹
Excelente gracias, una pregunta: si quiero sumar los valores de una columna?, por ejemplo tengo en la columna genero mujeres y necesito saber el total.
gracias
@Aquapying 8 місяців тому ⁺¹
¡Hola! Me alegra que te haya gustado el video. Para sumar los valores de una columna en un DataFrame de pandas, puedes usar el método sum(). Si en tu columna "genero" tienes el valor "mujeres" y quieres contar cuántas veces aparece, puedes hacer lo siguiente: total_mujeres = df[df['genero'] == 'mujeres'].shape[0]. Si lo que necesitas es sumar valores numéricos de una columna, solo necesitas usar el método sum() directamente: total_edades = df['edad'].sum(). Espero que esto te sea de ayuda. ¡Gracias por tu pregunta y por ver el video!
@EnglishteacherJane 5 місяців тому
Gracias por el video muy bien explicado
@Aquapying 5 місяців тому
Esperamos que el contenido te sea útil. Un saludo!!!
@hugolibreros1282 11 місяців тому ⁺²
Si tengo un data frame de 30 rows y 25 columns, como hago para que en la función df.describe() me imprima las 30 rows completas y que no omita rows con ... . Agradecería mucho de su ayuda.
@Aquapying 11 місяців тому
Hola Hugo, el método describe() te da estadísticas de tus datos, por lo que el número de filas está limitado, a los cuantiles, el máximo, el mínimo de cada columna. Me párese que te puedes tar refiriendo al.metodo .head() donde dentro de los paréntesis puedes colocar el número de filas a mostrar. En todo caso, puedes escribirnos a aquapyingenieria@gmail.com.
@julianarturomejiaespitia4479 Рік тому ⁺²
Muy buenas noches, muy util este manejo de fitros, una pregunta si yo quisiera para asignar un filtro de este tipo comparar un dato actual con el anterior de una misma columna, como podria hacerlo, existe alguna forma por este lado que depronto no requiera el uso de ciclos?. gracias
@Aquapying Рік тому
Hola Julian, muchas gracias por tu comentario, el método .iloc te vendría bien para desarrollar lo que dices, podrías colocar todo en un for e ir restando posiciones entre filas o entre columnas, en todo caso si necesitas algo más específico no dudes escribirnos a aquapyingenieria@gmail.com. Un Saludo!!
@principe1029 5 місяців тому ⁺¹
Esta muy bueno el video , pueden hacer operaciones matematicas con las columnas
@Aquapying 3 місяці тому
Hola, lo tendremos en cuenta para futuros vídeos!!! Gracias por tu comentario ☺️
Рік тому ⁺²
Me asalta una duda, ¿para que devolveria en un filtrado todas las filas y columnas?
@Aquapying Рік тому
Hola Jairo, muchas veces no queremos trabajar con todos los datos de un DataFrame y por eso es necesario filtrar los datos, muchas gracias por comentar!!!
@salvadorrojas7969 10 місяців тому ⁺²
Muchas gracias gran vídeo, tengo una duda, si yo quiero filtrar un subconjunto de datos, por una fecha, ejemplo todos aquellos registros que fueron hechos desde 01/02/2024 en adelante? gracias
@Aquapying 8 місяців тому
¡Hola! Muchas gracias por tu comentario y por ver el vídeo. Para filtrar un subconjunto de datos por una fecha específica, puedes usar las siguientes instrucciones dependiendo del lenguaje o herramienta que estés utilizando. Suponiendo que tienes un DataFrame llamado df y una columna de fecha llamada 'fecha', df['fecha'] = pd.to_datetime(df['fecha']) - Asegúrate de que la columna de fecha esté en formato datetime - filtered_df = df[df['fecha'] >= '2024-02-01']
@rafaelarodrigues4911 2 роки тому ⁺³
Massa! Obrigada.
@Aquapying 2 роки тому ⁺¹
Gracias por tu comentario, un saludo!!!
@erics4818 Рік тому
Aguante Milei
@jeffermartinez2014 Рік тому ⁺¹
Una pregunta ya data science, ya filtrado con los valores de Masculino, como poder analisar eso datos ya filtrado
@Aquapying Рік тому ⁺¹
Hola Jeffer, lo que puedes hacer es asignar ese dataframe filtrado en una nueva variable, para poder trabajar con esos datos previamente filtrados. Si sigues con dudas por favor escríbenos 😉 aquapyingenieria@gmail.com. Un saludo.
@antoniovalderrama7080 3 роки тому ⁺²
👏🙏👍
@Aquapying 3 роки тому
Muchas gracias por tu comentario Antonio ☺️, un saludo !!!
@CarlosHernandez-rj3to 2 роки тому ⁺²
Hola buen dia , me gustaria tener contacto con vos para una serie de asesorias . Si podrias te agradeceria
@Aquapying 2 роки тому
Hola Carlos nos puedes contactar en redes sociales o en el correo electrónico aquapyingenieria@gmail.com 😉 un saludo y gracias por comentarnos!!!
@CarlosHernandez-rj3to 2 роки тому ⁺¹
@@Aquapying Buen día por medio del email envie la consulta
@Aquapying 2 роки тому
Genial Carlos ya te hemos respondido un saludo 😊👍
@rodrigowalter5647 11 місяців тому ⁺²
te pasaste!
@Aquapying 8 місяців тому
Muchas gracias por tu comentario 🙂
@gerardosotoguichapani3055 2 роки тому ⁺²
Hola amigo muchas gracias por tu video, te hago una pregunta... ¿Como podría extraer toda la columa index?
ya que por ejemplo si quiero imprimir una columna en particular solo debo hacer df['nombre columna'] pero para la columna Index como debería hacerse?
Saludos
@Aquapying 2 роки тому
Hola Gerardo gracias por escribirnos 😉 para extraer la columna Index puedes usar el comando df.index, un saludo 👍😊!!
@gerardosotoguichapani3055 2 роки тому ⁺¹
@@Aquapying amigo muchas gracias por responder, excelente tu canal tienes un seguidor 😎
@Aquapying 2 роки тому
Muchas gracias Gerardo 😉👍
@ms-112lizbethvelazquez4 Рік тому ⁺²
Hola buenas tardes, ¿Como se puede verificar si una serie de datos a partir de un dataframe estan presenten en alguna fila de una columna especifica de otro dataframe?
@Aquapying Рік тому
Hola Lizbeth, desafortunadamente no tenemos un vídeo específico para eso, pero podemos verlo en una sesión. Si te interesa escríbenos a aquapyingenieria@gmail.com, estamos para ayudarte 😉 un saludo !!
@andrescastaneda7108 2 роки тому ⁺²
una pregunta y cuando tiene dos nombres y los apellidos en el mismo campo y se quiere dividir nombres y apellidos por aparte, ha sido interesante el video !
@Aquapying 2 роки тому
Hola muchas gracias por tu comentario, si es una cadena de texto aplicas el método split. Puedes usar algo como: df["name"].str.split(expand=True). Sin embargo ten en cuenta que está función te puede separar todo en columnas a parte que posteriormente puedes concatenar. Es decir unir los nombres y los apellidos con algo como esto df["Full Name"] = df["First"] + " " + df["Last"]. Espero te sea útil la respuesta un saludo 😊!!!
@marias2636 2 роки тому ⁺³
Gracias. Como podría comprobar si una cadena dada está presente en el dataframe ?
@Aquapying 2 роки тому
Hola Maria, podrías analizar el dataseries, por aparte y comparar. Gracias por tu comentario, un saludo!!
@isaacfranco6540 2 роки тому ⁺²
hola, y como puedo citar solo 1 fila y modificarla? no hacer el conteo de 0 a 3 sino por ejemplo solo 1 unica fila y sobre escribir datos en ella...
muy buen video, gracias
@Aquapying 2 роки тому ⁺¹
Hola Isaac con el método .iloc podrías. Por ejemplo df.iloc[0,0] = 1. Aqui a la fila cero columna cero le estamos asignando el valor de 1. Esperamos que el contenido te sea útil!! Un saludo!!
@EnglishteacherJane 5 місяців тому ⁺¹
¿Puedes explicar como utilizar groupby en un dataframe y como hallar los promedios con esa función?
@Aquapying 5 місяців тому ⁺¹
Hola claro que si. Lo apuntamos en nuestro plan de contenido. Cómo ya tenemos algo de cola en la lista esperamos publicarlo a final de este mes ☺️
@EnglishteacherJane 5 місяців тому ⁺¹
@@Aquapying Muchas gracias estare atenta al video cuando lo lances
@Aquapying 5 місяців тому ⁺²
Hola ya está publicado 😃. Esperamos te sea útil, nos ayudarías mucho compartiendo y regalándonos un me gusta y un súper gracias 🤭 un saludo !!!!
@EnglishteacherJane 5 місяців тому
@@Aquapying genial lo veré 😍😍 muchas gracias
@ljfi3324 2 роки тому ⁺²
Explicas muy bien 10/10
Qué musica usas para tus videos?, me ayudan a concetrarme y me agradan mucho
@Aquapying 2 роки тому
Gracias por tu comentario, me alegro mucho que te sea interesante el contenido!!! Bueno son pistas que trae por defecto el programa con el que grabó. Si quieres saber más nos puedes enviar un correo aquapyingenieria@gmail.com. Un saludo 😊
@onigumo96 3 роки тому ⁺²
Muy buen video, como se podría hacer para filtrar los números enteros?, por ejemplo en las edades.
@Aquapying 3 роки тому ⁺¹
Hola excelente pregunta, en general en una columna de pandas solo puedes tener un tipo de datos, es decir, no puedes tener enteros y flotantes al mismo tiempo, por lo que filtrar por números enteros en este caso no es lo más factible, lo que si puedes es convertir de flotantes a enteros por ejemplo con 'astype'. Cualquier duda me puedes escribir al correo aquapyingenieria@gmail.com, un saludo!!!
@yoyix93 2 роки тому ⁺³
Cuando ejecuto : df[df["Sexo"] == "Femenino"].max()
me sale esto:
C:\Users\alex\AppData\Local\Temp\ipykernel_18760\2510272187.py:2: FutureWarning: Dropping of nuisance columns in DataFrame reductions (with 'numeric_only=None') is deprecated; in a future version this will raise TypeError. Select only valid columns before calling the reduction.
mujer_old = df[df["Sexo"] == "Femenino"].max()
Igual me arroja el resultado, pero no se porque me tira ese error y a usted no
@Aquapying 2 роки тому ⁺¹
Hola Yoyix gracias por comentar,, lo que te sale no es un error, es una advertencia. La Liberia te está diciendo que en el futuro van a cambiar esa estructura y la van a actualizar, eso suele pasar bastante porque constantemente están desarrollando nuevos métodos y optimizaciones para mejorar el programa. Gracias por tu comentario 😁 un saludo!!
@cristovazz6738 3 роки тому ⁺²
Quiero seleccionar un renglon específico de un csv (tiene muchos renglones) y guardar los datos de ese renglón en un arreglo. cómo le haría?
@Aquapying 3 роки тому ⁺¹
Hola Cristo, tendrías que con la función iloc identificar el índice de esa fila, si es numérico el índice y por ejemplo es la fila 10 tendrías: df.iloc[[10],:] y tu resultado lo guardas en un nuevo Dataframe de esa forma podrás exportarlo... Sin embargo, si te surgen más dudas puedes escribirme al correo electrónico: aquapyingenieria@gmail.com un saludo ☺️
@cristovazz6738 3 роки тому ⁺¹
@@Aquapying y para llevar ese arreglo a Javascript? (template HTML).
@Aquapying 3 роки тому
Hola Cristo simplemente una vez tienes exportada tu tabla en un fichero (txt, csv, etc..) puedes cargar tu Dataframe en java con danfo (df = dfb.DataFrame(table) u otro paquete que sirva para cargar ficheros de datos en java, un saludo!!
@Aquapying 3 роки тому
Te respondí en el otro comentario que hiciste Cristo un saludo !!
@diegoalejandromesavasquez5646 2 роки тому ⁺²
buenos días, me gustaría saber como comparar 2 archivos de excel para ver que hay en uno y
falta en el otro
@Aquapying 2 роки тому ⁺²
Hola Diego, tendrías que cargar por aparte los dos dataframes y almacenarlos en dos variables diferentes, por ejemplo df1 y df2. Después colocas df1= df2 y te va a realizar una comparación por columnas boleana, si devuelve True si los elementos correspondientes de esa posición son iguales, en caso contrario devuelve False. Esta es una forma sencilla pero no muy útil si son muchos datos, si quieres puedes enviarnos un correo en caso de que sea algo más complicado. (aquapyingenieria@gmail.com)
Un Saludo y gracias por dejarnos tus dudas!!!!!
@marceloandreparionaromero6288 2 роки тому ⁺²
Cómo se puede filtrar bajo dos condiciones?
@Aquapying 2 роки тому ⁺²
Podrías filtrar por dos columnas, imagina que en la columna Age del Dataframe df tienes la edad y en la columna Gender el género (0 = mujeres, 1= hombres) para filtrar mujeres con más de 15 años podrías usar esto:
df1 = df[(df.Age > 15) & (df.Gender == 0)]
Esta es una de muchas formas en que lo puedes hacer. Un saludo 😊👍.
@erics4818 Рік тому ⁺³
Disculpa la ignorancia pero esto después se puede exportar como Excel? aún no le encuentro sentido a la utilización de Pandas
@Aquapying Рік тому ⁺¹
Hola Erics muchas gracias por escribirnos 😉!! Al final la ganancia está en automatizar y hacer todo lo que por ejemplo haces en Excel y mucho más pero de forma automática. Este es un vídeo de introducción muy básico, pero pandas y Python van a otro nivel, mucho más que Excel. Un saludo!!
@deibbymogollonburneo8189 3 роки тому ⁺¹
La resolución de la celda 88, donde se indica "Pasajeros mujeres con mayor edad ...." es errada
Se puede comprobar con > df[df.Nombre == "de Messemaeker, Mrs. Guillaume Joseph (Emma)"]
Su edad es 36.
El output de > df[df.Sexo == "Femenino"].max()
Se interpreta como:
1.- Se genera un subset donde todas los rows son "Femenino"
2.- max() devuelve el máximo de cada uno de los rows, es decir, el máximo de la column "Survived" es 1, de "Clase" es 3, de "Nombre" es /de Messemaeker, Mrs. Guillaume Joseph (Emma)/ (por la cantidad de caracteres), etc
Una de las soluciones debería ser:
> df[df.Edad == max(df[df.Sexo == "Femenino"].Edad)]
Se comprueba con:
> df[df["Sexo"]=="Femenino"].sort_values(by="Edad", ascending=False)
Saludos.
@Aquapying 3 роки тому
La función te da el máximo de cada columna ... Y efectivamente la mujer con más edad tiene 63 años que es lo que se pide ... Sin embargo, puede ser confuso al pensar que el nombre de la mujer es el que trae la función en este caso nos trae el nombre más largo o con mayor número de caracteres, por eso aclaro en el vídeo que son atributos separados diciendo mayor edad, mayor número de familiares... si sigues viendo el video en la explicación de la función .min() aclaro que son datos de columnas !! Aunque no es una errata puede ser confuso lo tendré en cuenta un saludo gracias por tu comentario !!! 😉
@deibbymogollonburneo8189 3 роки тому ⁺¹
@@Aquapying He vuelto a ver el video y es tal como dices.
Gracias por la aclaración.
Sigue así con tus videos, están buenos.
Saludos.
@Aquapying 3 роки тому ⁺¹
Genial 👍👍 igual no sobra tu comentario gracias a eso hago la aclaración y mejoro mi contenido, muchas gracias un saludo ...

Наступне

Автоматичне відтворення

4| Time series and plots in Python Pandas Matplotlib and Seaborn