Skip to content

DesafioLatam/dslatam-pres

Repository files navigation

Data Analysis desde Cero con Python

We're drowning in information and starving for knowledge. - John Naisbitt

Estamos en un momento donde todo el mundo está generando información de manera constante. Desde transacciones bancarias a encuestas de satisfacción, la omnipresencia de los datos en industrias, gobiernos y disciplinas nos obliga a aprender a manipular datos para entender el mundo. La comprensión y análisis de éstos resulta fundamental para el éxito de proyectos y nos entrega herramientas valiosas que pueden abrir oprtunidades.

Como un campo híbrido entre Ciencias de la Computación, Matemática y Estadística, y Negocios, Data Science se sirve de estos elementos para desarrollar explicaciones, identificar patrones y predecir resultados que nos ayuden a comprender el mundo y tomar mejores decisiones.

Para este taller utilizaremos Python como nuestro motor de análisis. Desde su irrupción en los 90's, Python se ha establecido como uno de los principales lenguajes de programación utilizado en la industria y la academia para el análisis de datos, dado su simplicidad y amplia gama de utilidades que ofrece al usuario.

Logo Python

El objetivo de este taller es realizar un ejercicio práctico donde trabajaremos con una tabla de datos estructurados en un archivo .csv. Para ello, nos valeremos de numpy, pandas y matplotlib, las tres librerías escenciales para el análisis, más otras librerías para modelar datos.

Mediante este ejercicio aprenderás a manipular, graficar y analizar datos, sin la necesidad de tener conocimientos previos de Data Science.

Jupyter Notebook: Python + Texto

Jupyter Notebook (antes denominado iPython Notebook) es un ambiente de trabajo que busca unificar las herramientas de documentación y ejecución de código en un mismo archivo. Los notebooks permite la lectura fácil para los humanos, así como la compartimentalización del código para la máquina.

Instalación de Herramientas

Para este taller necesitamos instalar Python 3.6 o superior y Jupyter. Para eso utilizaremos Anaconda, un instalador que se preocupará de generar todo lo necesario para nuestra estación de trabajo. Pueden descargar anaconda en el siguiente link https://www.anaconda.com/download/.

Pasos a seguir

  1. Descargar Anaconda con la versión 3.6 o superior en https://www.anaconda.com/download/
  2. Instalar Anaconda en tu equipo. Los pasos se encuentran detallados en el siguiente gif Instalando Anaconda
  3. Para generar nuestro primer notebook, abrimos el Terminal y ejecutamos jupyter notebook. Aquí el paso a paso:

Importante: Si presentan dificultades en esta etapa o no logran entenderlo, lleguen un poco antes al workshop y los profesores los guiarán. No es difícil, solamente algo nuevo para algunos.

  • Para los usuarios de Windows, como Terminal usaremos Anaconda Prompt. Éste se puede encontrar mediante el Menú Inicio, posteriormente escribiendo su nombre.

    • Abrir el programa.
    • Primero escribimos y ejecutamos dentro del terminal el texto cd Desktop, como muestra la imagen. Con esto nos estamos moviendo al Escritorio de nuestro equipo. Shell Windows
    • Luego ejecutamos md ds-demo, con esto estamos creando una carpeta nueva llamada ds-demo.
    • Desde el mismo programa ahora usamos cd ds-demo, esto para cambiarnos a la carpeta recién creada.
    • Finalmente, abrimos Jupyter ejecutando jupyter notebook.
  • Para los usuarios de Mac / Linux, se puede ingresar escribiendo Terminal dentro de Spotlight (o Búsqueda en Linux). Para ingresar a Spotlight, presione cmd + <Espacio>.

    • Abrir el programa.
    • Primero escribimos y ejecutamos dentro del terminal el texto cd Desktop, como muestra la imagen. Con esto nos estamos moviendo al Escritorio de nuestro equipo. Shell Windows
    • Luego ejecutamos mkdir ds-demo, con esto estamos creando una carpeta nueva llamada ds-demo.
    • Desde el mismo programa ahora usamoscd ds-demo, esto para cambiarnos a la carpeta recién creada.
    • Finalmente, abrimos Jupyter ejecutando jupyter notebook.
  • Los pasos se encuentran detallados en el siguiente gif. Ocupando Jupyter desde el Terminal

  • Si lograron abrir el notebook sin problemas, pueden cerrarlo desde la vista de terminal presionando ctrl+c en dos ocasiones. Luego cierran Terminal y la ventana del navegador que se abrió.

  • Ya tienen todo lo necesario para comenzar el taller.

  1. Es necesario que lean la guía de trabajo para entender algunos conceptos previos al curso. Descargue acá la guía de trabajo(Versión PDF).

¿Qué contiene este repositorio?

  • Toolkit Jupyter: Instructivos de instalación y flujo de trabajo con Jupyter. La versión .pdf puede ser descargada acá
  • tips.csv: Base de datos a utilizar en los ejercicios.
  • toolkit_img: Imágenes insertadas en markdown_jupyter.md.
  • pres: Presentación del workshop. Abrir ./pres/index.html en un navegador para visualizar.

Releases

No releases published

Packages

No packages published