Skip to content

Latest commit

 

History

History
184 lines (145 loc) · 9.79 KB

Readme.org

File metadata and controls

184 lines (145 loc) · 9.79 KB

Estadística Computacional

Introducción

Este es el repositorio con el contenido del curso Estadística Computacional de la Maestría en Ciencia de Datos del ITAM impartido por el Prof. Miguel Escalante.

El Curso

Objetivos:

  • El alumno se sentirá cómodo interactuando con línea de comandos.
  • El alumno podrá mantener un repositorio de código versionado de sus archivos y programas.
  • El alumno se sentirá cómodo con herramientas del cli.
  • El alumno se sentirá familiarizado con los lenguajes de programación: R y Python
  • El alumno se familiarizará con los conceptos base de la nube.
  • El alumno se familiarizará con Docker y herramientas de contenedores.
  • El alumno estará cómodo generando consultas complejas de SQL.

¿Meaning?

El objetivo en pocas palabras es que construyan capacidades técnicas de programación básicas para afrontar problemas asociados a la ciencia de datos, este es un curso introductorio pero me gusta profundizar en los temas que vemos, por lo que …

img/welcome.png

¿Cómo será el curso?

  • Pasaremos el tiempo de la clase aprendiendo a codificar para resolver problemas de ciencia de datos.
  • Algunas actividades requerirán que se haga Programación en pares
  • Las tareas estarán basadas en las habilidades que desarrolles en clase ¡Trata de no faltar!
  • Practicar es la única manera de volverse bueno en esto. Lo más probable es que pases de 8 a 12 horas por semana (además del tiempo de la clase) escribiendo y debugeando código.
  • Si tienes problemas con la tarea, pregúntame, o busca ayuda de tus compañeros. NO esperes a que sea demasiado tarde para tomar tu destino en tus manos.

Comunicación

Correo

Escribe a miguel.escalante@itam.mx y por favor que el subject del correo diga [Estadística Computacional 2021].

Discord

Piquele aquí

Temario

  • Git + Github + Git flow
  • R
    • Basics
    • Rproj
    • Dplyr
    • Rmarkdown
    • Shiny
    • Visualización
  • Python
    • Pandas
    • Flask
    • Dash
  • Cli
    • pipe
    • SED
    • Awk
    • cat
    • grep
  • SQL
    • Basics
    • Joins
    • Inserts
  • Docker
    • basics
    • docker-compose
  • Aws
    • EC2
    • S3
    • RDS

Evaluación

La calificación final está compuesta de la manera siguiente:

EntregablePorcentaje
Primer Parcial30%
Examen Final30%
Proyecto Final (equipos)30%
Presentación10%

Primer Parcial

A la mitad del semestre haremos una evaluación con los temas vistos hasta el momento, todo lo visto o mencionado en clase es sujeto a ser evaluado en este examen. Tendrá un componente teórico y un componente práctico, más o menos al 50%.

Examen Final

Al final del semestre tendremos una evaluación global de temas del curso, abarca todo el contenido que hayamos visto hasta ese momento. Habrá componentes teóricos y prácticos alrededor del 50% cada uno.

Proyecto Final

Al final del semestre también espero que entreguen un proyecto englobando todos los conceptos que veamos. Será entregar un dashboard de analítica avanzada con interactividad. El equipo puede ser de a lo más 3 personas y será asignado aleatoreamente.

Presentación

Una parte fundamental de la ciencia de datos es el presentar resultados a los interesados en el problema, por lo que para ejercitarlo se harán presentaciones de 5 minutos, (si 10% de su calificación en 5 minutos). Los 5 minutos son para establecer un hallazgo que hayan tenido en algún dataset que les interese. Tendremos presentaciones como esta durante el curso y cuando sea momento abriré los lugares para que se puedan organizar.

Calificación

Para la evaluación del código que lleguen a escribir se contemplará la siguiente escala a manera de referencia.

PuntosDescripción
5Excelente. Código limpio, conciso, documentado y exploró los conceptos en profundidad.
4Completo y correcto. Incluye el análisis, el programa, el caso de pruebas y responde a las preguntas planteadas.
3Contiene unos cuentos errores menores.
2Entrega parcial o tiene errores mayores.
1Le faltó mucho.
0Ni lo intentó :(

Calificación de los proyectos

El proyecto se evaluará promediando las siguientes categorías. Se usará la escala recién mostrada en cada una de ellas.

CategoríaDescripción
DiseñoEl proyecto está bien organizado, fácil de seguir y se especifica claramente el problema a resolver.
DocumentaciónInstrucciones de como ejecutar el código. Nombres de las variables y funciones son descriptivas. Incluye comentarios para que el lector pueda seguir el algoritmo. Se incluyen casos de prueba.
CompletezTodos los elementos del proyecto están incluidos.
CorrectoLa lógica del código es correcta y produce resultados con sentido.
AnálisisTodas las preguntas de análisis en la descripción del proyecto fueron resueltas. La interpretación del resultado está incluida.

Demostración del proyecto

Al final del curso, tendrás que mostrar tu proyecto en 15 minutos a la clase. Se calificará por mí y por tus compañeros.

Aclaraciones

  • El código NO es la respuesta.
  • La gráfica NO es la respuesta.
  • Debes de mostrar que entendiste la solución y el problema.

Código de conducta académica

Adaptado del departamento de ciencias de la computación de Grand Valley State University y de George Washington University)

  • Se espera que tú…
    • Crees / desarrolles tus tareas (incluyendo el código fuente).
    • Entiendas tus soluciones
    • Reconozcas la ayuda de otros en la escritura.
    • Cites la fuente en la tarea.
    • Te protejas de sospecha al no permitir que otros vean tu tarea antes de que sea enviada.
    • Contactes al profesor para aclarar los requerimientos de las tareas.
    • Uses extensivamente Github para socializar el conocimiento, soluciones, dudas, etc.
  • Se prefiere que tú…
    • Discutas diversos caminos para alcanzar la solución.
    • Compartas tu conociemiento con otros estudiantes acerca de errores de sintáxis, trucos de código, etc.
    • Proveas y recibas ayuda respecto a errores de ejecución.
    • Proveas y recibas ayuda usando el ambiente de computación.
    • Participes, junto con otros estudiantes, en discuiones hacer de las tareas, requerimientos, estrategais de solución, etc.
  • Eres culpable de romper el código de conducta si …
    • Le das tu código fuente a cualquiera en formato electrónico o analógico.
    • Recibes de otro estudiante la solución en formato electrónico o analógico.
    • Subes al repositorio como tuyos otros archivos, soluciones o documentos.
    • Subes tareas sin indicar que colaboraste con alguien.
    • Realizas modificaciones al código en un esfuerzo de ocultar un engaño.
    • Usas material no permitido en examen o te comunicas con alguien de manera no autorizada durante el examen.

Ligas de interes

Finalmente…

Primer tarea!!

  1. Instalar git
    1. Si estás en una distro de GNU/Linux tipo Debian: sudo apt-get install git.
    2. Si estás en una MacOS sigue las instrucciones de aquí y sigue las instrucciones.
  2. Crea una cuenta en github
  3. Crear una llave ssh y conectarla a Github.
  4. Forkear este repositorio
  5. Instalar docker
  6. Instalar un editor de textos
    1. GNU/Emacs
    2. VsCode

Emacs

Después de tener converso al director de la Maestría, estoy convencido del valor que provee tener una herramienta como Emacs disponible, tanto para temas de escritura científica, como para programación, durante el curso verán que uso esta herramienta. Denle una oportunidad aunque su curva de aprendizaje sea un poco inclinada. :)

Usuarios github.

Por favor entren aquí y agreguen su información, para tener los usuarios de github y la lista de las CU’s.