We're drowning in information and starving for knowledge. - John Naisbitt
Estamos en un momento donde todo el mundo está generando información de manera constante. Desde transacciones bancarias a encuestas de satisfacción, la omnipresencia de los datos en industrias, gobiernos y disciplinas nos obliga a aprender a manipular datos para entender el mundo. La comprensión y análisis de éstos resulta fundamental para el éxito de proyectos y nos entrega herramientas valiosas que pueden abrir oprtunidades.
Como un campo híbrido entre Ciencias de la Computación, Matemática y Estadística, y Negocios, Data Science se sirve de estos elementos para desarrollar explicaciones, identificar patrones y predecir resultados que nos ayuden a comprender el mundo y tomar mejores decisiones.
Para este taller utilizaremos Python como nuestro motor de análisis. Desde su irrupción en los 90's, Python se ha establecido como uno de los principales lenguajes de programación utilizado en la industria y la academia para el análisis de datos, dado su simplicidad y amplia gama de utilidades que ofrece al usuario.
El objetivo de este taller es realizar un ejercicio práctico donde trabajaremos con una tabla de datos estructurados en un archivo .csv
. Para ello, nos valeremos de numpy
, pandas
y matplotlib
, las tres librerías escenciales para el análisis, más otras librerías para modelar datos.
Mediante este ejercicio aprenderás a manipular, graficar y analizar datos, sin la necesidad de tener conocimientos previos de Data Science.
Jupyter Notebook (antes denominado iPython Notebook) es un ambiente de trabajo que busca unificar las herramientas de documentación y ejecución de código en un mismo archivo. Los notebooks permite la lectura fácil para los humanos, así como la compartimentalización del código para la máquina.
Para este taller necesitamos instalar Python 3.6 o superior y Jupyter. Para eso utilizaremos Anaconda, un instalador que se preocupará de generar todo lo necesario para nuestra estación de trabajo. Pueden descargar anaconda en el siguiente link https://www.anaconda.com/download/.
- Descargar Anaconda con la versión 3.6 o superior en https://www.anaconda.com/download/
- Instalar Anaconda en tu equipo. Los pasos se encuentran detallados en el siguiente gif
- Para generar nuestro primer notebook, abrimos el Terminal y ejecutamos
jupyter notebook
. Aquí el paso a paso:
Importante: Si presentan dificultades en esta etapa o no logran entenderlo, lleguen un poco antes al workshop y los profesores los guiarán. No es difícil, solamente algo nuevo para algunos.
-
Para los usuarios de Windows, como Terminal usaremos Anaconda Prompt. Éste se puede encontrar mediante el Menú Inicio, posteriormente escribiendo su nombre.
- Abrir el programa.
- Primero escribimos y ejecutamos dentro del terminal el texto
cd Desktop
, como muestra la imagen. Con esto nos estamos moviendo al Escritorio de nuestro equipo. - Luego ejecutamos
md ds-demo
, con esto estamos creando una carpeta nueva llamada ds-demo. - Desde el mismo programa ahora usamos
cd ds-demo
, esto para cambiarnos a la carpeta recién creada. - Finalmente, abrimos Jupyter ejecutando
jupyter notebook
.
-
Para los usuarios de Mac / Linux, se puede ingresar escribiendo
Terminal
dentro de Spotlight (o Búsqueda en Linux). Para ingresar a Spotlight, presionecmd + <Espacio>
.- Abrir el programa.
- Primero escribimos y ejecutamos dentro del terminal el texto
cd Desktop
, como muestra la imagen. Con esto nos estamos moviendo al Escritorio de nuestro equipo. - Luego ejecutamos
mkdir ds-demo
, con esto estamos creando una carpeta nueva llamada ds-demo. - Desde el mismo programa ahora usamos
cd ds-demo
, esto para cambiarnos a la carpeta recién creada. - Finalmente, abrimos Jupyter ejecutando
jupyter notebook
.
-
Si lograron abrir el notebook sin problemas, pueden cerrarlo desde la vista de terminal presionando ctrl+c en dos ocasiones. Luego cierran Terminal y la ventana del navegador que se abrió.
-
Ya tienen todo lo necesario para comenzar el taller.
- Es necesario que lean la guía de trabajo para entender algunos conceptos previos al curso. Descargue acá la guía de trabajo(Versión PDF).
- Toolkit Jupyter: Instructivos de instalación y flujo de trabajo con Jupyter. La versión
.pdf
puede ser descargada acá - tips.csv: Base de datos a utilizar en los ejercicios.
- toolkit_img: Imágenes insertadas en
markdown_jupyter.md
. pres
: Presentación del workshop. Abrir ./pres/index.html en un navegador para visualizar.