Unidad: Regresíon - Sesión 2

Regresión (desde el Aprendizaje de Máquinas)

Sobre el ejemplo

En esta sesión trabajaremos una base de datos sobre los precios de las viviendas en Boston, utilizada en el paper Harrison Jr, D., & Rubinfeld, D. L. (1978). Hedonic housing prices and the demand for clean air. Journal of environmental economics and management, 5(1), 81-102.
Nuestro objetivo es desarrollar un modelo predictivo para el valor mediano de las casas mediante el entrenamiento de un modelo de regresión lineal.

crim: Tasa de criminalidad por sector de Boston zn proporción de terreno residencial asignado para terrenos baldíos. indus proporción de negocios no asociados al comercio por sector. chas Dummy. 1 si el sector colinda con el río Charles, 0 de lo contrario. nox Concentración de dióxido de carbono rm cantidad promedio de habitaciones por casa. age proporción de casas construídas antes de 1940 dis distancia promedio a cinco centros de empleos. rad índice de accesibilidad a autopistas. tax nivel de impuestos asociados a viviendas. ptratio razón alumno:profesor por sector de Boston. black proporción de afroamericanos por sector de Boston. lstat porcentaje de población de estratos bajos. medv valor mediano de las casas

Ejercicio 1: Prepare el ambiente de trabajo

Importe las librerías básicas para el análisis de datos.
Importe el módulo linear_model, y las funciones mean_squared_error, r2_score y train_test_split.
Importe la base de datos boston.csv y elimine la columna Unnamed: 0.
Obtenga las medidas descriptivas de la base de datos con .describe().

Ejercicio 2: División de la muestra

Genere conjuntos de entrenamiento y validación con train_test_split.
Genere segmentaciones del 33% para las muestras de validación.
Incluya una semilla pseudoaleatoria

Ejercicio 3: Generación de modelos

Ahora implementaremos dos versiones del modelo lineal:
1. Con intercepto y atributos normalizados.
- Sin intercepto y atributos no normalizados.
Cada versión debe generarse en un nuevo objeto inicializado.
Posteriormente se deben entrenar los modelos especificando la matriz y vector de entrenamiento.
Con los modelos entrenados, genere una predicción de matriz de validación.

Ejercicio 4: Obtención de métricas

Ahora generemos una función llamada report_scores que ingrese como argumentos el vector de datos predichos y el vector de datos por validar.
La función debe imprimir las métricas del Error Cuadrático Promedio y R2.
Reporte las métricas para ambos modelos. En base a ello, seleccione el mejor modelo.

Ejercicio 5: Refactorización del modelo

Genere una función llamada fetch_features que ingrese como argumentos la base de datos y el nombre del vector objetivo. El nombre del vector debe ser medv por defecto
La función debe retornar una lista con las correlaciones entre cada atributo y el vector objetivo y su nombre.
Reporte brevemente cuales los 6 atributos con una mayor correlación con medv

Ejercicio 6: Refactorización del modelo predictivo

Genere otros conjuntos de entrenamiento y validación en base a una matriz con los 6 atributos identificados y el vector objetivo.
Entrene un modelo en base al mejor desempeño.
Reporte las métricas para el nuevo modelo.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
boston.csv		boston.csv
logo.png		logo.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Unidad: Regresíon - Sesión 2

Regresión (desde el Aprendizaje de Máquinas)

Sobre el ejemplo

Ejercicio 1: Prepare el ambiente de trabajo

Ejercicio 2: División de la muestra

Ejercicio 3: Generación de modelos

Ejercicio 4: Obtención de métricas

Ejercicio 5: Refactorización del modelo

Ejercicio 6: Refactorización del modelo predictivo

About

Releases

Packages

DesafioLatam/act10-fds

Folders and files

Latest commit

History

Repository files navigation

Unidad: Regresíon - Sesión 2

Regresión (desde el Aprendizaje de Máquinas)

Sobre el ejemplo

Ejercicio 1: Prepare el ambiente de trabajo

Ejercicio 2: División de la muestra

Ejercicio 3: Generación de modelos

Ejercicio 4: Obtención de métricas

Ejercicio 5: Refactorización del modelo

Ejercicio 6: Refactorización del modelo predictivo

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages