Qué son los Datos Desbalanceados y Cómo balancearlos usando Submuestreo y Sobremuestreo con Python

Diagramas de Caja (BoxPlots) y Datos Anómalos (outliers) con la Prueba de Tukey en Python

Outlier & Anomaly Detection using Isolation Forest | What are Anomalies? | What is Isolation Forest?

ДНРівці та ЛНРівці найбільше знущалися над полоненими азовцями

Остановили аттракцион из-за дочки!

Дізнався стать майбутньої дитини на фронті

Detección de Datos Anómalos (outliers) con Bosques de Aislamiento (iForests) y Python

Codigo Maquina

Переглядів 6 187

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 16 вер 2024

КОМЕНТАРІ • 31

@CodigoMaquina 2 роки тому
⭐ De la co-fundadora de Código Máquina, productos de cosmética natural SINHAKI:
www.amazon.com.mx/stores/sinHaki/page/1BD34FBC-C0F9-44F5-AC69-520634334C61?ref_=ast_bln
@ricardollanos2472 2 роки тому ⁺⁷
Sin dudar, tu contenido es invaluable. Muchas gracias por compartirlo
@CodigoMaquina 2 роки тому
Gracias por darle valor al canal. Es una gran motivación :)
@fabiomorales5754 2 роки тому ⁺⁴
Octavio, muchas gracias. He aprendido mucho y afianzado conocimientos. Tus videos son excelentes!
@CodigoMaquina 2 роки тому
Te agradezco mucho tus comentarios. Este proyecto personal ha sido muy gratificante gracias a personas como tú :)
@oliverrojasconde9144 2 роки тому ⁺²
Excelentes videos, muy bien explicado todo, muchas gracias!!!!!!
@CodigoMaquina 2 роки тому
Muchas gracias por tus comentarios y por ver el canal :)
@mejia414 2 роки тому ⁺²
Gracias señor sus explicaciones y dedicación me han ayudado mucho
@CodigoMaquina 2 роки тому
Estoy muy contento de leer que han sido de utilidad los videos. Muchas gracias por seguir el canal e interactuar :)
@cesaraugustoperez1814 2 роки тому ⁺²
Excelente explicación!
@CodigoMaquina 2 роки тому
Muchas gracias por comentar en el canal :)
@rockophill3934 Рік тому ⁺¹
En efecto Maestro Octavio, Gran tema complementario de outliers, bien detallado. se le agradece la enseñanza que con maestría compartes. Thanks!👌
@CodigoMaquina Рік тому
Gracias Rocko!!!
@Gustavo-rb6df Рік тому ⁺¹
Gran vídeo, amigo. Eres un crack!!!
@CodigoMaquina Рік тому ⁺¹
Muchas gracias por todo el apoyo. Saludos!! 😊
@msaretto 2 роки тому ⁺²
👍
@miguelsantiago5209 6 місяців тому
Excelente video. Una pregunta ¿Cómo puedo calcular el porcentaje de contaminación en un dataset con muchas filas?
@jrobledo25 2 роки тому ⁺²
Por favor un vídeo para utilizar técnicas de muestreo aleatorio para tratar con clases desbalanceadas 🙇🏻‍♂️
@CodigoMaquina 2 роки тому ⁺¹
Gracias por la sugerencia. Ya tengo en la mira un video justo con ese tema. De hecho, ya tenemos un video sobre clases desbalanceadas, pero asignando pesos a los errores de clasificación. Aquí va el link en caso de que desees verlo ua-cam.com/video/2FbugqoBz94/v-deo.html
@jrobledo25 2 роки тому ⁺¹
@@CodigoMaquina Sí fue muy bueno, aunque estoy en búsqueda de uno donde se usen técnicas de remuestreo aleatorio durante el momento de preprocesamiento, sin embargo ¡Muchas gracias por tu contenido!
@omarlora3591 5 місяців тому
buenos días y gracias por el ejemplo, me esta dando un error: The 'contamination' parameter of IsolationForest must be a str among {'auto'} or a float in the range (0, 0.5]. Got 0.0 instead. el error es en la línea 12
@HPenarandaBello Рік тому ⁺¹
Hola. Buen vídeo. ¿Cómo eliminar los registros que tienen datos atípicos? ¿Existe alguna librería?
@CodigoMaquina Рік тому ⁺¹
Hola @HPenarandaBello gracias por la pregunta. Todo depende del contexto, pero aquí va un par de formas: 1) Usando un escalador robusto (favor de ver el siguiente video ua-cam.com/video/-VuR14Qyl7E/v-deo.html) 2) o aplicando filtros (favor de ver el siguiente video ua-cam.com/video/U-7Q-koi-Cc/v-deo.html). De hecho, con filtros se podría definir un valor por defecto que reemplace a los datos atípicos de la siguiente manera:
import numpy as np
datos = np.array([10, 11, 12, 1000])
datos[datos>999] = 13
@HPenarandaBello Рік тому ⁺¹
@@CodigoMaquina Muchas gracias.
@AlexRodriguez-go5pf 2 роки тому ⁺¹
Buen video! Una consulta, si tengo una columna con valores de 0% a 100%, pero hay outliers que exceden este rango, crees que deba reemplazarlos por NaN y luego imputarlos para no perder información?
@CodigoMaquina 2 роки тому
Gracias por tu comentario y por la pregunta. Desde mi punto de vista, en ese contexto, valores superiores al 100% no serían outliers sino datos inconsistentes. Si tienes muchos datos, podrías simplemente eliminar esos registros debido a las inconsistencias o ciertamente tratarlos como valores faltantes. La forma de saber que procedimiento podría ser mejor es a través de la experimentación. Espero mis comentarios sean de utilidad :)
@JulioTechIA Рік тому ⁺¹
Excelente explicación Octavio!! Solo te consulto: En mi Python me dio error cuando intenta usar 0.00 de contaminación, no me permitió, tuve que cambiar la línea a esto: c = [0.01, 0.05, 0.1]. A qué podría deberse?
@CodigoMaquina Рік тому ⁺¹
Muchas gracias por tus comentarios y por la pregunta. El error que comentas podría deberse a cuestiones de versiones de la librería. Tal vez en una nueva versión están validando que incluyas valores de contaminación mayores a cero. De hecho, los niveles de contaminación solo tienen sentido si son mayores a cero. En mi caso utilice un valor de contaminación de cero para generar código compacto que me permitiera explicar los conceptos y visualizar los datos utilizando la menor cantidad de líneas de código. No obstante, en un análisis de datos anómalos sólo se utilizarían valores mayores a cero.
@JulioTechIA Рік тому ⁺¹
@@CodigoMaquina Muchísimas gracias por responder!!
@midnightshadow987 2 роки тому ⁺³
Vine buscando cobre y encontré oro
@CodigoMaquina 2 роки тому
Muchas gracias por comentar y por seguir el contenido del canal :)

Наступне

Автоматичне відтворення

Qué son los Datos Desbalanceados y Cómo balancearlos usando Submuestreo y Sobremuestreo con Python

Qué son los Datos Desbalanceados y Cómo balancearlos usando Submuestreo y Sobremuestreo con Python

Diagramas de Caja (BoxPlots) y Datos Anómalos (outliers) con la Prueba de Tukey en Python

Diagramas de Caja (BoxPlots) y Datos Anómalos (outliers) con la Prueba de Tukey en Python

Outlier & Anomaly Detection using Isolation Forest | What are Anomalies? | What is Isolation Forest?

Outlier & Anomaly Detection using Isolation Forest | What are Anomalies? | What is Isolation Forest?

ДНРівці та ЛНРівці найбільше знущалися над полоненими азовцями

ДНРівці та ЛНРівці найбільше знущалися над полоненими азовцями

Остановили аттракцион из-за дочки!

Остановили аттракцион из-за дочки!

Дізнався стать майбутньої дитини на фронті

Дізнався стать майбутньої дитини на фронті

Сестра не поделила надувной матрас с братом..🤦‍♂️🪡⚓️

Сестра не поделила надувной матрас с братом..🤦‍♂️🪡⚓️

Shapiro-Wilk vs Kolmogorov-Smirnov en Python: ¿Qué prueba de Normalidad utilizar?

Shapiro-Wilk vs Kolmogorov-Smirnov en Python: ¿Qué prueba de Normalidad utilizar?

Las Matemáticas detrás de la IA

Las Matemáticas detrás de la IA

Jan van der Vegt: A walk through the isolation forest | PyData Amsterdam 2019

Jan van der Vegt: A walk through the isolation forest | PyData Amsterdam 2019

Complete Anomaly Detection Tutorials Machine Learning And Its Types With Implementation | Krish Naik

Complete Anomaly Detection Tutorials Machine Learning And Its Types With Implementation | Krish Naik

Detección de Anomalías con Python Pandas

Detección de Anomalías con Python Pandas

Imputación (o Manejo de Datos Faltantes) con Python

Imputación (o Manejo de Datos Faltantes) con Python

Isolation Forest for Outlier Detection within Python

Isolation Forest for Outlier Detection within Python

Análisis de Componentes Principales (PCA) para Reducir la Dimensionalidad de Datos usando Python

Análisis de Componentes Principales (PCA) para Reducir la Dimensionalidad de Datos usando Python

Cómo crear Clasificadores de Machine Learning ante Clases Desbalanceadas asignando Pesos con Python

Cómo crear Clasificadores de Machine Learning ante Clases Desbalanceadas asignando Pesos con Python

🥹Із російського полону повернули лучанина Дмитра Селютіна #конкурентtv #новини

🥹Із російського полону повернули лучанина Дмитра Селютіна #конкурентtv #новини

В ДЕТСТВЕ ДЕЛАЕМ ПАРАШЮТ ИЗ ПАКЕТОВ

В ДЕТСТВЕ ДЕЛАЕМ ПАРАШЮТ ИЗ ПАКЕТОВ

when you have plan B 😂

when you have plan B 😂

Вот в чём отличие ТЯЖЁЛОЙ весовой #shorts

Вот в чём отличие ТЯЖЁЛОЙ весовой #shorts

ПОЛ ЭТО ЛАВА В РЕАЛЬНОЙ ЖИЗНИ **Масленников, Даник, Сударь, Монтажник, Яна, Супер Стас**

ПОЛ ЭТО ЛАВА В РЕАЛЬНОЙ ЖИЗНИ **Масленников, Даник, Сударь, Монтажник, Яна, Супер Стас**

ДИЗЕЛЬ ШОУ 2024 💙 149 ВИПУСК 💛💐 ВЕЛИКА ПРЕМ'ЄРА 🌷 від 13.09.2024

ДИЗЕЛЬ ШОУ 2024 💙 149 ВИПУСК 💛💐 ВЕЛИКА ПРЕМ'ЄРА 🌷 від 13.09.2024

Самое неинтересное видео

Самое неинтересное видео

МастерШеф 14 сезон. Випуск 1 від 24.08.2024 | ПРЕМ’ЄРА

МастерШеф 14 сезон. Випуск 1 від 24.08.2024 | ПРЕМ’ЄРА