REGRESIÓN LINEAL SIMPLE - PRÁCTICA | #15 Curso Machine Learning con Python
Вставка
- Опубліковано 4 жов 2024
- En este video veremos la parte práctica del algoritmo de Regresión Lineal Simple, en donde desarrollaremos un modelo para predecir el precio de las casas en Boston de acuerdo al número de habitaciones que cuenta la vivienda.
Para conocer más sobre este tema puedes ingresar a este link:
🔗 Link del video Regresión Lineal - Teoría: bit.ly/2RH3M2u
🔗 Link del video Regresión Lineal - Scikit Learn: bit.ly/32Jfal2
🔗 Link de la entrada al blog: bit.ly/3msIKTs
🔗 Link de datasets de Scikit Learn: bit.ly/2UIknmO
#AprendizajeSupervisado #MachineLearningconPython #aprendeIA
_ . _ . _ . _
🤖 Si quieres aprender INTELIGENCIA ARTIFICIAL DESDE CERO de manera fácil y sencilla puedes ingresar a nuestra web en donde encontrarás más información: aprendeia.com/
_ . _ . _ . _
📚 Enlaces para obtener los EBOOKS: aprendeia.com/...
💻 Enlaces para obtener los CURSOS: aprendeia.com/...
📌 Enlaces para obtener los RECURSOS: aprendeia.com/...
_ . _ . _ . _
Continua tu aprendizaje en Inteligencia Artificial viendo las siguientes listas de reproducción:
🤖 Como empezar a aprender Inteligencia Artificial: bit.ly/3kKUNfO
🤖 Inteligencia Artificial 101: bit.ly/3wWdeD4
🖥 Curso: Introducción a Machine Learning: bit.ly/3dwWRTA
_ . _ . _ . _
SUSCRÍBETE AL CANAL: aprendeia.com/...
_ . _ . _ . _
ACERCA DEL CANAL
¿Quieres aprender sobre Inteligencia Artificial desde cero de una manera fácil y sencilla? ¡Este es el canal ideal para ti!
_ . _ . _ . _
CONTACTO / NEGOCIOS
ligdi@aprendeia.com
¿Quieres empezar a estudiar Inteligencia Artificial y no sabes por donde empezar? Te dejo el enlace de mi ebook gratis “Ruta de aprendizaje de Inteligencia Artificial para profesionales" en donde puedes encontrar mi ruta recomendada: bit.ly/31rCe9D.
Una clase de 3 horas en una universidad la comprimiste en 10 minutos, eres una Crack!.
Hola Hector, muchas gracias por tu comentario y espero que te este ayudando en tu aprendizaje, si lo pudieras compartir con tus compañeros te lo agradecería. Saludos
Ligdi muchas gracias por tu excelente traba. Un favor, podrias sugerirme otro dataset para hacer esta practica, ya que Boston no esta disponible.
Muchas gracias Ligdi, hace algún tiempo lo había visto pero no lo había entendido tan bien, hoy que tengo mejores argumentos me queda muy claro. Gracias
Hola David, muchas gracias por tus palabras y espero que la información que publico te este ayudando en tu aprendizaje, si lo pudieras compartir con tus compañeros te lo agradecería. Saludos
Hola, muy buenos vídeos, estoy iniciando con Machine Learning para aplicaciones en Monitoreo Estructural (Ing Civil). Eres la mejor. Muchas Gracias !!!
Muchas gracias, si lo pudieses compartir te lo agradecería. Saludos.
Wow, qué útil es la librería Scikit-Learn, yo usaba únicamente pytorch y se me complicaba un poco implementar proyectos. Muchas gracias, buen video
Me alegra que la información que publico te este ayudando para tu aprendizaje. Saludos.
Hola, soy del Brazil, yo voy estudiar Machine Learning con sus videos, son muy claros y directos. Felicitacios por hacer buenos videos y dedicar tiempo a ellos. Saludos
Hola Leandro, me alegra que esta información te ayude en tu aprendizaje. Saludos.
eres un angel... gracias por compartir tan bellos videos :'') sigue con estos hermosos videos con mas proyectos de machine learning, mucahs gracias por todo..... :D
Muchas gracias por el interés Alejandro, si lo pudieras compartir te lo agradecería. Saludos.
Hola Ligdi! Realmente un fenómeno cómo pudiste explicar completo y en tiempo récord todo este proceso básico pero clave para entender un ejercicio real de regresión lineal! Denota un conocimiento profundo y una capacidad didáctica muy entrenada. Muchas gracias por tu trabajo y esfuerzo para beneficio de tantos!
Una pregunta concreta: en el paso donde supuestamente "entrenamos el modelo", me gustaría saber si el programa realiza una o varias pruebas de ajuste. Se puede de alguna manera ordenar al programa que realice un número de iteraciones determinado?
Se corre riesgo de que sobreajuste?
Muchas gracias.
Hola Miguel, lo que quieres hacer si se puede hacer, pero deberás desarrollar un código en Python utilizando funciones para que haga todo ese procedimiento y a su vez evaluando la salida. Por cierto pudiste comprar el libro ¿? no he revisado los estados de compra. Saludos.
Excelente explicación y muy agradecido por todo tu trabajo de hacerlo comprensible y didáctico, saludos desde Perú.
Muchas gracias por el interés Jorge, si lo pudieras compartir te lo agradecería. Saludos
Eres la mejor del mundo mundial
Muchas gracias por el interés Fabio, si lo pudieses compartir te lo agradecería. Saludos.
Profe, muy buenos videos me han servido mucho. En la parte 8:37 de la precisión del modelo usé la función score y también la función r2_score. Deduzco que me debería dar el mismo resultado con ambas funciones, y la única forma en que eso sucede es haciendo:
print('Precisión del modelo usando r2_score: ')
print(r2_score(y_test,y_pred))
print('Precisión del modelo usando score: ')
print(lr.score(X_test,y_test))
Hola, tendrías probar para ver si ambas instrucciones te den el mismo resultado. Saludos.
Excelente tu explicacion
Uso python 3.7.9 Para que me funcionara tuve que modificar
# Entrena el modelo
lr.fit(X_train.reshape(-1,1), y_train)
#Realizo una prediccion
Y_predict = lr.predict(X_test.reshape(-1,1))
print(lr.score(X_train.reshape(-1,1), y_train))
Hola Gonzalo, este fue el error que me pasaste por correo, recuerda que acá te olvidaste de la línea de fit( ), es decir no estas entrenando el modelo. Saludos.
Excelente explicación en tan poco tiempo. Gracias
Hola Sergio, me alegra que te haya gustado la información y espero que te haya ayudado en tu aprendizaje. Saludos.
Muy buenos videos, me clave 15 de una, excelente explicación
Felicitaciones, continua de esa forma tu aprendizaje. Saludos.
Hola, estoy empezando a ver tus videos, me parecen muy buenos apesar de todo los temas que contiene el ML, igualmente estoy haciendo un paralelo con R y SAS he econtrado algunas diferencias, tales como las semillas de elección de la muestra que usan cada uno de los programas, y a veces el R cuadrado no es el mejor indicador para evaluar un modelo y es necesario ver varios estadísticos de ajuste al mismo tiempo. Voy a segui viendo tus videos y a seguir aprendiendo al respecto.
Hola, eso es correcto por eso existen varios métodos para evaluar un modelo, acá hablo al respecto: bit.ly/2TzzKNY.
Tus videos me ayudan muchísimo... Muchas gracias!!!!!
Muchas gracias por el interés Juan, si lo pudieses compartir te lo agradecería. Saludos.
Excelente, explicado con un codigo facil para hacer entender el fundamento detras.
Muchas gracias.
gracias amiga Lidgi
Hola Ramon, espero que te haya ayudado esta información. Saludos.
Hey! Te agradezco mucho tus videos, me ayudaron un montón!! Saludos!!!
Muchas gracias por el interés Fran, si lo pudieras compartir te lo agradecería. Saludos
Si quieren experimentar con datos propios, es decir, predecir valor que ustedes usen, usen este código
y_pred = lr.predict([[7]])
print(y_pred)
El numero 7 es un ejemplo, pongan los datos como un arreglo de numpy, de lo contrario les sale un error.
Muchas gracias.
FAUSTO ! ya estaba en modo " no sirvo para esto" , (usted me entiende, verdad? ) hasta que lei tu comentario sin buscarlo siquiera. GRACIAS !
Muchas gracias por tu aporte!
Muchas gracias por el interés Julián, si lo pudieras compartir te lo agradecería. Saludos.
Excelentes vídeos Ligdi, ¿Por casualidad no sabrías si es posible visualizar estos datasets de scikit-learn como tablas?, con pandas y un archivo .csv me es fácil, pero nose si aquí no aplica por como están presentados los datos o si hay una forma.
Buenas, recibo el siguiente error: ValueError: x and y must be the same size cuando intento hacer la grafica de dispersion. plt.scatter(Xtest, ytest), debido a que se genera ytest con un size (102,) y no encaja con el size de Xtest (102,13), como puedo resolverlo?
porqué lr.score se hace sobre los (x,y) train? y no con y_pred?
Hola Ligdi, planeas hacer un curso en algun momento utilizando TensorFlow? Saludos
Hola Luis, si lo tengo planeado pero no será en un futuro cercano. Saludos.
Hola ligdi como andas?, tengo un inconveniente, parece que actualizaron los datasets y no figura el de boston. Tendras el archivo para mandarmelo? asi compio bien el trabajo del video y corroboro que todo salga bien con ese dataset
Hola Ligdi, primero gracias por tu tiempo! son excelentes tus videos. Segundo, te consulto, siguiendo tus pasos, el R al cuadrado a mi me da otro valor distinto (0.53), eso es porque la separación de los datos entre train y test es aleatorio y tus datos analizados no fueron exactamente los mismos que los mios? Gracias!
Hola Carla, es correcto. La razón de la diferencia es que se están tomando datos aleatorios por lo que no será igual mi resultado con los tuyos. Saludos.
Hola, muy buen video y súper detallado, me gustó.
Solo me quedó una duda, para sacar la precisión del modelo usaste x_train y y_train como parámetros de la función score.
Sin embargo, en el video anterior dices que se usan los parámetros x_prueba y_prueba que vendrían siendo los de test.
Así que me quedó la duda de cuál de los dos conjuntos de datos es el que se utiliza para obtener el score?
Hola, por lo general se utilizan los datos de X_prueba, y_prueba para poder visualizar el error real del modelo.
Hola Ligdi, felicitaciones por el curso, va fantástico. Tengo una consulta:
al momento de veirifcar la información contenida en el dataset, aparece "target"
dict_keys(['data', 'target', 'feature_names', 'DESCR', 'filename'])
Luego indicas que esa información lo pondrás como tu variables dependiente ("Y"). me gustaría saber porque se eligió esos datos.
Saludos y muchísimas gracias por entregar conocimiento! :D
Porque target en este datasets, es el valor aproximado de la casa en cuestión según todos los datos que se tienen del mismo
Muchas gracias por apoyarse mutuamente. Lo que comenta Carlos es correcto, dicha columna corresponde a los datos que queremos predecir (variable independiente). Recuerda que este es un algoritmo de aprendizaje supervisado que siempre debe contar con datos objetivos (target). Saludos.
@@aprendeIA gracias por responder mi consulta, eres muy amable, me queda claro. Con respecto a lo de variable, tengo entendido que sería igual a Y dentro de la ecuación lineal, por lo tanto sería una variable dependiente. El valor de la cada depende de sus características.
Nuevamente muchas gracias por tu ayuda. El curso es muy bueno! 😊
Hola, a mi me parece una pregunta vital, ya que no se explica o no queda claro en el vídeo. Esta es la variable dependiente con la que se comparar al momento de realizar la comparación con base de prueba. Excelente observación. Una pregunta más, sabes como se puede visualizar esta variable "Target" como verla en el contexto de la base de datos, para saber originalmente como estaba construida, del modo de compararla con la base como una visualización de Excel. Un abrazo para todos
excelentes videos, me gusta el curso.
Tengo una duda, como salieron los cuadros del minuto 6:10?
Arriba del panel de la consola hay cuatro pestañas: Variable explorer, File explorer, Help, Profiler. Haces click sobre la que dice Variable explorer (o Explorador de variables si lo tienes en español) y se te muestra una lista de variables. Al hacer doble click sobre la variable que quieras, se te abre un cuadro como el del vídeo.
Hola, utilizando la opción de explorador de variables del IDE Spyder. Saludos.
@@miguelzabala Muchas gracias. Invaluable ayuda. Hasta pronto.
@@hectorwilches453 De nada. Saludos
ya no existe el dataset de Boston Houses, que se puede hacer en ese caso ?
Excelentes videos
Muchas gracias por el interés Brayan, si lo pudieses compartir te lo agradecería. Saludos.
Estimada Lidgi esta instrucción me da lo siguiente
x=Boston.data[:,np.newaxis,5]
File "", line 3
de 0
^
SyntaxError: invalid syntax
descubrí mi error, había puesto una linea de mas en el codigo sin #, pfff
Hola Ignacio, me alegra que hayas encontrado el error. Saludos.
Buenas noches Lidgi, primero felicitaciones por tus videos muy buenos te agradezco te tomes tu tiempo para enseñar este tema. Una consulta porque al medir la precision del modelo tomas los X_train, y_train, no deberia analizarse respecto a los X_test, y_test. Gracias de antemano por tu respuesta.
Hola Francisco, muchas gracias por tus palabras. Puedes tomar ambos sin ningún problema, recuerdo que acá les doy las bases queda de su parte mejorar lo que les muestro. Saludos.
Hola Ligdi, súper claro pero tengo una duda, después de ejecutar predict, como obtienes los cuadros de las variables a comparar. Yo ejecuto y no aparecen. Quedo atento mil gracias!
No te preocupes seguí intentando y ya supe. Saludos.
Me alegro que hayas podido resolver. Saludos.
Saludos a todos. ¿Cómo obtuvieron los gráficos?
Excelente video , muchas gracias . Yo estoy trabajando en el jupiter Notebook, y al momento de predecir no me mostro nada, mas sin embargo en los siguientes pasos me mostró los mismos resultados que a ti, no sé si tengo que activar algo para poder ver los resultados de la predicción . Tea gradecería si me puedes ayudar
Hola William, es extraño que en Jupyter Notebook no te haya mostrado nada, de repente fue algo línea de código que no tenía ninguna salida. Saludos.
@@aprendeIA Entonces deberia volver a instalar anaconda, o que podría hacer?
Genial !!!
Hola Eduardo, muchas gracias por tu comentario y espero que te este ayudando en tu aprendizaje, si lo pudieras compartir con tus compañeros te lo agradecería. Saludos.
Hola. Muy bueno el curso. Felicidades. Tengo una consulta. Cuando calcula la precisión del modelo con lr.score arroja 0.48... Cuando se que es preciso o no? Usted dice que el modelo no es preciso según ese valor. En que casos (valor) me arroja buena precisión? Y en que casos me arroja que es casi totalmente impreciso? En otras palabras, los valores extremos de la precisión cuales serian?
Hola Nacho, la precisión de un modelo es algo subjetivo va a depender del proyecto y de cada quien. Mi recomendación es probar con varios algoritmos, no enfocarse en uno solo, cambiar los parámetros y al final ver cual fue el que mejor dio resultado y evaluar si es algo bueno o malo los resultados obtenidos.
tengo una duda si por ejemplo quisiera correr un modelo de vectores autorregresivos o un modelo arima, o por ejemplo hacer ajustes con variables dummy o escalones en una regresión se puede el machine learning, de antemano gracias por los videos son muy buenos sin mencionar que es el mejor curso que hay en español.
Hola Eduardo, disculpa pero no entiendo tu duda. Si me la puedes explicar mejor veo si te puedo ayudar. Saludos.
hola muy buenos tus cursos, como logras los recuadros de y_test y y_pred? gracias . Saludos.... oooo ya lo descrubri .... perdon mala mia
ya lo descrubri
Buen día! Ligdi. Excelente aporte. Estoy iniciendome en machine learning tratando de modelar la relación presión y temperatura del fluido de producción (oil and gas). Utilizo como primeros pasos el algoritmo de regresión lineal y utilizo una data especifica. Cuando defino la x, y y completo el algoritmo me aparece un error: IndexError: too many indices for array . Me podrías orientar referente a la causa de este error. Mucha gracias.
Hola Luis, parece que tienes algún problema en la selección de los datos que estás utilizando. Saludos.
gracias encerio ,
print("love")!!!!
Hola Kevin, muchas gracias por tus palabras y espero que la información que publico te este ayudando en tu aprendizaje, si lo pudieras compartir con tus compañeros te lo agradecería. Saludos
Muchas gracias Ligdi por tus excelentes videos. Aquí tengo dudass. Se aplican siempre estos mismos pasos para cualquier problema de lineal regresión?. Qué pasos pudieran cambiar? Y lo otro es que seleccionastes el 20% de prueba en el train y test para comprobar el algoritmo, de qué depende la selección?
Hola Mayra, los pasos generales si se aplican, por ejemplo, guardar los datos, inspeccionarlos, limpiarlos y así sucesivamente. El porcentaje lo decide el desarrollador en ocasiones también depende de la cantidad de datos que tienes disponible. Saludos.
Hola Ligdi, una pregunta. Porque el score lo calculas con los datos de entrenamiento? No debería calcular con los datos de prueba
Hola, lo puedes calcular con los datos de entrenamiento y prueba, por ejemplo a mi me gusta calcularlo con ambos pero acá solamente muestro una sola forma. Recuerda que yo les doy las herramientas ya que da su parte mejorar lo que presento acá. Saludos.
Hola Ligdi, quisiera preguntarte a partir de que porcentaje de precisión se da por bueno un modelo. Gracias por lo que enseñas, me es de mucha ayuda.
Hola Mike, eso lo defines tu como desarrollador junto a la empresa, en caso de que estes desarrollando un modelo para implantarlo en un una empresa. Esto es algo muy subjetivo y va a depender del proyecto y los objetivos que se quieren cumplir. Saludos.
@@aprendeIA muchas gracias :)
Hola buen video, pero te comento que ya no existe la data de Boston dentro de Scikitlearn
tengo el mismo problema
@@slacex No hay forma amigo, ya esta eliminada
Ahora se recomienda usar otra que se llama como California House Fetching pero no es tan buena
Sobre el ejemplo de boston, ¿hay más vídeos usando otros modelos para predecir el precio?
Hola Jairo, todos los videos de práctica, publicados en el canal, correspondiente a los algoritmos de regresión se desarrolla este proyecto. Saludos.
Hola Ligdi, Te felicito por tu trabajo, me ha servido mucho, para mi labor de docente. Lo difícil lo haces ver y explicas muy fácil.
Te quería consultar con que comando puedo ver despues de correr el algoritmo las columnas tal cual como las muestras en el video donde se aprecia el resultado de los precios predichos.
De antemano Gracias.
Hola Luis, ese es el visor de variables que tiene Spyder, acá lo explico: bit.ly/2MxKDvb
@@aprendeIA Genial tus videos, pero este link ya no está disponible
te amooooooo...!!!! LoL.... perdón.. graciasssss...!!!!!!! excelentes vídeos....!!!!!!
jajajajaja Gracias.
Hola! Cuando corro todo en Spyder los plots (el que graficamos para ver como estaban distribuidos los datos al principio, y el que hicimos despues para ver la diferencia entre los datos de test y los que predijo el modelo) me salen juntos. O sea, me hace un solo grafico con toda la informacion en lugar de dos graficos separados. Como podria solucionarse y por que pasa esto? Gracias!
Hola Malena, seguramente estas corriendo todo el programa junto, puedes agregar líneas que mostrar (show) plot para que te muestre las gráficas separadas. Saludos.
Lidgi, en resumen el modelo tiene una efectividad del 0.418, esto es el r2? esto lo consideraremos como malo, medio o bueno?
Seria medio un poco malo, ya que dio una precisión de 0.418, multiplicado por 100 seria 41.8% de precisión y siempre se debe entender que sea lo mas cercano al 100%. Lo cual determina que la regresión es buena pero no sirve para ese grupo de datos
Buenos videos y bien explicados.
Pregunto: al seleccionar la columna 5 de DAta que es el nuemero de habitaciones
X = boston.data[:, np.newaxis, 5]
utiliza la X mayuscula. Pero en ### Graficamos la distribucion de los datos X en la orden
plt.xlabel("numero de habitaciones") se usa x minuscula en plt.xlabel
Esto no se presta a confuciones? y porque python admite esto ?
Gracias
Hola Jaime, la instrucción "plt.xlabel" es una instrucción propia de Python y no hace referencia a la X de variable que utilizamos sino como vamos a llamar el eje x en el gráfico. Saludos.
Hola Ligdi, una consulta: minuto 5:05 que es eso del TARGET? Saludos
Listo! ahi lo vi. Lo habia pasado por alto. Saludos
Lo que no entiendo es porque utilizas Target para definir Y. Trate de entenderlo pero me quede ahi.
Target significa objetivo, y "y" es el objetivo que queremos predecir. Saludos.
Hola Ligdi muchas gracias por los tutoriales!! En este caso habría que usar el algoritmo de las bandas paralelas a la función lineal? (no se el nombre del algoritmo)
Support Vector Regression?
Hola, el algoritmo de bandas paralelas, si es Vectores de Soporte, pero no se a qué caso te refieres. Saludos.
que modelo de regresión lineal recomiendan? en donde la relacion entre la variable independiente y dependiente es lineal.
Hola, se debe tomar en cuenta otras consideraciones pero así como lo planteas puedes utilizar la regresión lineal simple. Saludos.
Hola Ligdi, muy buenos videos, muchas gracias por subir este contenido.
Te hago una consulta, como haces para que te aparezcan las dos ventanas donde comparas el y_test con el y_pred, eh copiado el código, yo utilizo el editor sublime text3 pero no me aparecen esas ventanas.
Muchas gracias y saludos!!
Hola Adrian, lo que sucede que esa es una propiedad de Spyder, por esa razón la uso para mis videos. Saludos.
Hola @@aprendeIA yo tambien uso spyder (basico), pero en donde puedo pulsar para que aparezcan las ventanas?
Juan Soto Castañeda Arriba de la consola hay una parte donde dice “variable explorer” ahí das clic en las columnas “y_test” y “y_predict” para compararlas .
@@andresgarcia3946 gracias compañero justo era lo que necesitaba
Felicitaciones por hacer videos de Machine Learning. Pero tengo una duda sobre por qué empleas los datos de entrenamiento para hacer la validación de tu modelo. Pienso que serìa mejor utilizar la metrica para comparar el Y predecido con el Y de Testeo.
Hola, muchas gracias por tu comentario, en cuanto a tu duda, yo en los videos solamente les hago una explicación general del problema ya queda de tu parte mejorarlo para obtener mejores resultado, es cierto que puedes realizar la comparación con los datos de pruebas, por lo general yo lo hago con los dos entrenamiento y prueba, acá solamente mostré el de entrenamiento. Saludos.
@@aprendeIA excelente justificación.
un error (min 8:30 ), al construir la ecuación de función, para mi seria asi (a lo mejor estoy en error, corregidme):
y= ax +b [Donde "a": es la pendiente "b": es la intersección cuando x =0]
entonces (nota: solo coloco 2 decimales):
y = 8.66x - 31.99 ---> [ Donde "a"= 8.66 "b"= -31.99 ]
Gracias de antemano y buen curso, espero pasarme todo el curso. salu2
Hola, si la ecuación que escribes es la formula del modelo que se obtuvo en el video. Saludos.
Oh! Yeah, great work.
Me alegra que te haya ayudado. Saludos.
Me dice "ModuleNotFoundError: No module named 'sklearn.utils'
", ¿qué hago?
Hola José, en el código del video no se está utilizando ningún modulo "sklearn.utils" por lo tanto no se porque lo tienes en tu código. Saludos.
Importé lo descrito en el video y apareció ese error.
Cual algoritmo se adapta mejor para trabajar con esos datos?
Hola, puedes ver el resto de videos de practica de los otros algoritmos en donde sigo utilizando el mismo conjunto de datos y probándolos con los respectivos algoritmos. Saludos.
Hola. Estoy tratando de accede a otras funciones de scikit learn para practicar los otros algoritmos de aprendizaje pero no me muestra la informacion. Sigo los mismos pasos de importar las liberias
import numpy as np
from sklearn import datasets, linear_model
import matplotlib.pyplot as plt
iris=datasets.load_iris
print(iris)
print()
y solo me muestra lo siguiente en la consola
Hola Jahaziel, trata con este código a ver si continuas con el problema:
from sklearn.datasets import load_iris
data = load_iris()
Saludos.
Hola, la verdad que tus videos están muy buenos y ayudan pila! Se agradece de corazón!!!!
Una consulta: si ya descargue la librería sklearn, matplotlib viene junto con esta o la tengo que descargar a parte?
Gracias Saludos!
Hola, la librería SKLearn es una librería y matplotlib es otra por lo tanto se deben descargar ambas. Saludos.
Muchas gracias!!! ^_^
Puedo definir varios algoritmos a la vez ? o solo puedo definir uno solo ?
Hola Armando, en Machine Learning existe algo llamado "métodos de ensamble" en donde puedes utilizar varios algoritmos para obtener un resultado, acá lo explico mejor: bit.ly/35Q1tTi. Saludos.
Existe una manera de probar varios algoritmos simultáneamente?
Como puedo yo mirar la variable mas apropiada, es decir que no diga que voy a elegir cantidad de habitaciones porque si sino porque tengo un argumento, es posible? soy nuevo en esto
Hola Cesar, si lo puedes hacer desarrollando una función en Python que al momento de correr te desarrolle el modelo y te lo evalue y la salida de la función los resultados obtenidos. Saludos.
Todo esto se puede hacer en el IDE PyCharm?
Eduardo P claro! solo necesitas instalar las librerías mencionadas
Lo que te indica Jhon es correcto, puedes usar PyCharm sin ningún problema solamente debes tener instaladas las librerías que vayas a utilizar. Saludos.
una pregunta Ligdi, pero por qué solo ocupamos el 20% de los datos para entrenar el modelo? se debe al sobreajuste?
Hola José, porque necesitamos la mayor cantidad de datos para entrenar el modelo (80%) y solo un poco para probar el modelo (20%). Saludos.
Lo que hicimos fue lo que manualmente es la correlación de spearman y el calculo de R Cuadrado verdad? No entiendo muy bien la diferencia en los resultados que votaria un software estadistico con el que voto este proceso de programación uwu
Hola Fernando, los principios de ML y sobretodo este algoritmo es estadístico, por esa razón insisto tanto que se debe estudiar esa área para empezar ML. Para entender las diferencias te dejo este video: bit.ly/2sXpgM3. Saludos.
genia
Hola Martin, muchas gracias por tus palabras y espero que la información que publico te este ayudando en tu aprendizaje, si lo pudieras compartir con tus compañeros te lo agradecería. Saludos
Muy buen video :)
Muchas gracias
Hola Ligdi, primero que todo, muchas gracias por tomarte tu tiempo para realizar estos videos que son una gran guía para comenzar en el mundo del ML, segundo, te queria preguntar, porqué a la hora de evaluar el algoritmo implementado con el metodo score, lo haces con las variables X_train y y_train?, no deberían de ser las variables y_train y Y_predict?
Un saludo y feliz navidad !
Lo que se hace es darle los datos "reales" de X y Y para que los evalue con la con respecto a la regresión lineal que se calculó. Así sabemos si la regresión predice bien los valores. Saludos.
Hola, me encanta que entre todos nos ayudemos, es correcto. Tu también puedes evaluar con los datos predichos. Recuerda que yo te doy las bases, ya que de tu parte seguir evaluando los modelos y ver en que se puede mejorar. Saludos.
Tengo una duda: ¿Stata es utilizado en el ámbito laboral? ¿Por qué utilizar Python y no Stata? Gracias por tus videos.
Hola Miguel, para ser sincera no conocía sobre Stata, y por lo que pude ver es bastante completo.
En cuanto a tu pregunta de por qué utilizar Python y no Stata, sucede lo mismo que con Matlab, Stata es pago a diferencia de Python que es totalmente gratis y tiene una comunidad muy grande.
Si lo utiliza alguna empresa, lo desconozco pero creo que por ser pago serán muy pocas las empresas que lo usen.
Saludos.
Y si como datos tengo un archivos csv? utilizará pandas para hacer la carga no?
Hola, para importar datos csv, solamente tienes que utilizar el comando read_csv(). Saludos.
Hola Ligdi, estas tablas comparativas como hiciste para verlas, no consigo sacarlas minuto 6:28
Hola Clemente, es el visor de variables que trae Spyder, en este video explico sobre ello: bit.ly/2MxKDvb. Saludos.
Hola soy Alejandro , ojala me pudiese orientar necesito una vez obtenida la regresión quiero predecir la Y pero con valores X y no resescribiendo la regresion. favor su ayuda.
Hola Alejandro, disculpa pero no entiendo la pregunta. Para obtener una predección, debes tener datos independientes (X) y datos dependientes (y), con estos datos puedes obtener un modelo de Machine Learning y de con el mismo le puedes ingresar nuevos valores independientes (X) y obtener una predicción (nuevos valores de y). Saludos.
Hola, me da error al poner el código de los gráficos y no se gráfica nada. ¿Alguna ayuda por favor?
Hola Carlos, si estas siguiendo el código exactamente como se indica no te debería dar error. Revisa el código directamente en la publicación del blog. Saludos.
Holaa, mis dudas:
por qué cuando seleccionamos a X al momento de indexar todas las filas y la columna 5 se agg np.newaxis? esa parte no la entendí
te amooooooooooo, estaba esperando la práctica con todo mi ser.
Hola Maria, porque quiero crear una nueva columna solamente con los datos correspondientes a la 5. Saludos.
@@aprendeIA Para mí aún no es claro porqué se le agrega np.newaxis acá, mientras en la regresión lineal múltiple no se tuvo eso en cuenta. Al intentar no usarlo es este o usarlo en la múltiple no me corrió así que debe ser necesario, pero no comprendo el porqué.
Es por las operaciones matriciales que se hacen internamente para calcular los parámetros. Una parte de la fórmula que se usa para calcular los parámetros ( que en regresión lineal simple es el de intersección y la pendiente) es "X transpuesta" por "y", si lo dejará al X como vector fila no se podría realizar la operación , por eso se tiene que poner como vector columna, para que así si pueda multiplicarse con "y" que en el python esta como un vector de (506x1)
buenas tardes, primero gracias por tus vides son de gran ayuda.Disculpa tengo una duda como hago para visualizar el comportamiento de el modelo, lo compilo y no se me abre una ventana adicional para poder visualizarlo
Hola Jorge, para visualizar una gráfica en una ventana a parte va a depender más que todo del IDE que estes usando, si es así tienes que decirlo en el código que te haga esto. Saludos.
@@aprendeIA no puedo visualizar lo que sale en el video en el minuto 6:00-6:40
estoy utilizando spyder en windows
Me gusto bastante, un poco lento para mi gusto. Pero perfecto para iniciantes¡¡¡¡
Muchas gracias, si lo pudieses compartir te lo agradecería. Saludos.
Una pregunta: los datos de y_test los de Y_pred no me sales iguales a los resultados del ejercicio en el minuto 6:10. Es normal la diferencia? Un saludo y gracias
Hola, si es normal estamos seleccionando datos al azar y muy seguramente no son los mismos a los míos. Saludos.
@@aprendeIA Gracias, eres la mejor. Oye una pregunta adicional, creo que hay una manera de asegurar que al hacer una replica del modelo siempre salgan los mismos resultados para no tener cambios cada vez que corramos los modelos, sabes cuál es la opción. Un saludo y gracias
Hi Sabes como se puede hacer esto con spyder?
Hola, de la misma forma como se muestra allí, solamente tienes que copiar el código, lo único adicional es que seguramente tendrás que agregar algunos print( ) para ver como van las variables. Saludos.
Seguí todos los pasos, y tengo ligeros cambios en los resultados, no se por que será...
y= [8.53893652] x -31.146751839994412
para detectar captchas cual recomendas?
Hola Matias, a que te refieres exactamente?
@@aprendeIA perdon,pero necesito un programa que ejecute un proceso a una determinada hora,me podrias ayudar a hacerlo o que programa me podria ayudar?
oye amiga como se llama el programa que usas como editor en donde escribes todo el codigo y el enlace de Scikit Learn esta caido lo puedes subir otra vez
Hola Nicole, el programa que utilizo es Spyder, acá hablo sobre el: bit.ly/2MxKDvb. Qué enlace esta caído ¿?, yo pude abrir todos. Saludos.
Hola, una pregunta, yo estoy haciendo una prueba con un csv de salarios, pero me sale el siguiente error "could not convert string to float: '56,957.00'", me imagino que es hacer un parseo, pero no se sobre que tengo que realizar la transformación, ese error me sale al usa, regressor.fit(x_train,y_train) , el ejemplo lo saque de www.jacobsoft.com.mx/es_mx/regresion-lineal-simple-con-python/ estoy viendo su video para hacer comparativas, por lo que veo que es muy parecido, solo la fuente del csv cambia, el csv lo copie y pegue y posterior le quite espacios hasta que quedara limpio.
Según lo que comentas el problema es el formato en que tienes los datos, te recomendaría verificar el tipo de datos que tienes en el conjunto y a partir de eso realizar un preprocesamiento de los datos antes de aplicar el algoritmo. Saludos.
Tengo una pregunta un poco boba, porque se usa X mayúscula en los modelos y ya las otras si son minúsculas jeje
Hola Cesar, esa es la nomeclatura que se usa dentro de esta área y es universal, pero tenerte una explicación científica o algo parecido no la tengo, lo siento. Saludos.
Por favor ayuda. Como puedo cambiar el feature de un data set? Por favor ayuda :(((
Hola Ari, eso va a depender en donde tienes guardado tu dataset. Si es en NumPy, en este video creo que lo explico: bit.ly/2MSJkqu, si es en Panda, en este otro video también creo que lo explico: bit.ly/2yibciB. Saludos.
que hace la línea "x=boston.data[:, np.newaxis, 5]"
Hola, lo que hace es tomar los datos solamente de la columna 5 y colocarlos como columna. Saludos.
@@aprendeIA aaa ok, muchas gracias
Como puedo inportar un archivo txt yo no pude solucionar eso, gracias
Puedes probar con el siguiente código a ver si te funciona:
data = pd.read_csv('nombre_archivo.txt', sep=" ", header=None)
data.columns = ["a", "b", "c", "etc."]
Saludos.
frenado en el minuto 6:07, no se de donde sacas esas ventanas
Hola, esos son los ventanas de exploradores de variables con las que viene Spyder. Saludos.
mira haciendolo igual, en que falle?
# -*- coding: utf-8 -*-
"""
Created on Fri Oct 18 20:32:00 2019
@author: carlo
"""
import numpy as np
from sklearn import datasets, linear_model
import matplotlib.pyplot as plt
boston = datasets.load_boston()
print(boston)
print
print("informacion en el dataset:")
print(boston.keys())
print()
#Verifico las caracteristicas del dataset
print("caracteristicas del dataset:")
print(boston.DESCR)
print()
##VERIFICO LA CANTIDAD DE DATOS QUE HAY EN EL DATASET
print("cantidad de datos :")
print(boston.data.shape)
print()
#verifico la informacion en de las columnas
print("nombres columnas:")
print(boston.feature_names)
#seleccionamos solamente la columna 5 del dataset
x = boston.data[:, np.newaxis, 5]
#defino los datos correspondientes a las etiquetas
y = boston.target
#graficamos los datos correspondientes
plt.scatter(x, y)
plt.xlabel("numero de habitaciones")
plt.ylabel("valor medio")
plt.show()
from sklearn.model_selection import train_test_split
#separo los datos de "train" en entrenamiento y prueba para provar los algoritmos
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)
lr = linear_model.LinearRegression()
lr.fit(x_train, y_train)
#Realizo una predicciom
y_pred= lr.predict(x_test)
#graficare la data junto con el modelo
plt.scatter(x_test, y_test)
plt.plot(x_test, y_pred, color= "red", linewidth=3)
plt.title("Regresion lineal simple")
plt.x_label("numero de habitaciones")
plt.y_label("valor medio")
plt.show()
print()
print("datos del modelo regresion lineal simple")
print('valor de la pendiente o coeficiente "a":')
print(lr.coef_)
print(lr.intersept_)
Hola, verlo de esta forma se me hace difícil, te recomiendo que ejecutes el programa línea por línea, de esta forma podrás obtener la línea exacta en donde tienes el error. Por lo general el IDE te dice cuál es el error, por allí es más fácil poder depurar el código. Saludos.
Y la otra es que no me muestra las dos figuras :/
Hola, puedes revisar el código en este link para ver que tiene de diferente: bit.ly/2ElT8Je. Saludos.
mucho racismo huelo en esa dataset
Hola Guido, la respuesta 3 tampoco es correcta porque si el auto autónomo circula por una calle sencilla, recta y tranquila, está utilizando constantemente sus sensores para captar el mundo que le rodea constantemente. Saludos.
sacaron el dataset de boston de sklearn por racismo jaj