Punto de partida para el TP 1 de Arquitectura del Software (75.73) del 2do cuatrimestre de 2022

La fecha de entrega para el informe y el código es el jueves 13/10 ‼️

La forma de entrega será crear un canal privado en Slack (llamado como el grupo) con todos los miembros del grupo y todos los docentes, y poner ahí un link al repositorio con el código (en caso de ser privado, invitar también a todos los docentes) y el informe (o avisar si está en el repositorio).

El informe puede ser un PDF, Google Doc o Markdown/Wiki en el mismo repositorio del código. Debe incluir screenshots del dashboard de métricas para cada caso analizado que permitan observar los resultados obtenidos.

Objetivos

El objetivo principal es comparar algunas tecnologías, ver cómo diversos aspectos impactan en los atributos de calidad y probar, o al menos sugerir, qué cambios se podrían hacer para mejorarlos. El objetivo menor es que aprendan a usar una variedad de tecnologías útiles y muy usadas hoy en día, incluyendo:

Node.js (+ Express)
Docker
Docker Compose
Nginx
Algún generador de carga (la propuesta es usar Artillery, pero pueden cambiarlo)
Alguna forma de tomar mediciones varias y visualizarlas, preferentemente en tiempo real, con persistencia, y en un dashboard unificado (la propuesta es usar el plugin de Artillery + cAdvisor + StatsD + Graphite + Grafana, pero pueden cambiarlo).

Consigna

Sección 1

Implementar un servicio HTTP en Node.js-Express. Someter distintos tipos de endpoints a diversas intensidades/escenarios de carga en algunas configuraciones de deployment, tomar mediciones y analizar resultados.

A partir de este repositorio como punto inicial, van a tener que implementar el webserver y dockerizarlo (completar la carpeta app/), agregar los servicios con el webserver y una imagen provista por la cátedra al docker-compose.yml, y configurar las locations y upstreams de nginx en nginx_reverse_proxy.conf.

La imagen provista por la cátedra es arqsoft/bbox:202202.1. Se trata de una aplicación ("bbox") que provee 2 servicios, uno con comportamiento sincrónico y otro con comportamiento asincrónico. Se configura a través del archivo /opt/bbox/config.properties, que ustedes deberán mapear vía un volumen a un archivo en el equipo host (caso similar a la configuración de nginx que les da la cátedra).

Este archivo tiene 2 parámetros:

server.basePort=9090
group.key=

server.basePort: Puerto base para que escuchen los servicios en el container. En el ejemplo, el 1er servicio escuchará en 9090 y el 2do en 9091.
group.key: Cadena alfanumérica que identifica al grupo. Se recomienda que utilicen el nombre del grupo, aunque pueden usar cualquier cadena.

El archivo que utilicen debe ser subido al repositorio.

Para probar manualmente la interacción con los servicios, tienen 2 opciones:

Mapear los puertos al host: Deben asignar un puerto del host a cada puerto del container
Pasar a través de nginx: Deben agregar los upstreams en la configuración de nginx

Luego, pueden enviar un GET a cualquier endpoint de cada servicio. Por ejemplo, si mapearon los puertos al host con la misma numeración que el archivo de configuración:

curl http://localhost:9090/ accederá al 1er servicio
curl http://localhost:9091/ accederá al 2do servicio

Si, en cambio, eligieron pasar a través de nginx, entonces deberán enviar un GET a las locations que hayan configurado.

Ambos servicios devuelven la cadena "Hello, world!".

Para generar carga y ver las mediciones obtenidas, en la carpeta perf/ tienen un dashboard de Grafana ya armado (dashboard.json) y un ejemplo de un escenario básico de artillery (deben crear sus propios escenarios de manera apropiada para lo que estén probando). También hay un script y una configuración en el package.json para que puedan ejecutar los escenarios que hagan corriendo:

npm run scenario <filename> <env>

donde <filename> es el nombre del archivo con el escenario (sin la extensión .yaml) y <env> es el entorno en el cual correrá la prueba (vean la sección environments dentro del yaml del escenario).

Tipos de endpoints para comparar los servidores

Caso	Implementado como	Representa
Ping	Respuesta de un valor constante (rápido y de procesamiento mínimo)	Healthcheck básico
Proxy sincrónico	Invocación a servicio sincrónico provisto por la cátedra.	Aproximación a consumo de servicio real sincrónico.
Proxy asincrónico	Invocación a servicio asincrónico provisto por la cátedra.	Aproximación a consumo de servicio real asincrónico.
Intensivo	Loop de cierto tiempo (lento y de alto procesamiento)	Cálculos pesados sobre los datos (ej: algoritmos pesados, o simplemente muchos cálculos).

Configuraciones de deployment

El tráfico entre cliente y servidor debe pasar por el nginx, para que tenga la latencia del salto "extra". No es necesario (aunque es posible) que bbox esté detrás del nginx cuando es accedido por la app Node.js

Obligatorias

Caso	Explicación
Un nodo	Un solo proceso, un solo container.
Replicado	Replicado en múltiples containers, con load balancing a nivel de nginx

Opcionales

Caso	Explicación
Multi-worker	Para una o varias de las configuraciones obligatorias, pueden probar manejar más de un worker en cada container (usar siempre la misma cantidad). Vean el módulo `cluster` (v14.x o v16.x)
Servidor remoto	Todos los casos anteriores suponen que el servidor corre en la misma computadora física que el cliente (generador de carga). Pueden probar montar uno o varios de ellos en otra computadora (otra en la misma casa, o un servidor en algún proveedor cloud) y comparar las métricas al "alejar" cliente de servidor. Consideren en el análisis también que las características de la computadora corriendo el servidor o el cliente pueden cambiar en esos casos.
...	... pueden agregar otros casos que se les ocurran

Queda a cargo de cada grupo elegir qué configuraciones de deployment prueba bajo qué escenarios de carga. Es preferible armar pocos casos y analizarlos lo más posible que juntar muchísima información y estudiar poco los resultados. ⚠️

Generación de carga para las pruebas

Hay muchos tipos de escenarios de carga y pruebas de performance en general. Pueden leer por ejemplo acá (o en cualquiera de los miles de links al googlear sobre el tema) sobre algunos tipos de escenarios que pueden implementar. Queda a decisión de cada grupo elegir cuáles implementar, considerando siempre cuál es el que más útil les resulta para analizar lo que quieran estudiar.

Adicionales obligatorios

Deberán incorporar al informe una vista Components & Connectors para los distintos casos estudiados.
Deberán generar sus propias métricas desde la app Node para ser enviadas al daemon de statsd. Como mínimo, deberán generar una métrica con la demora en responder de cada endpoint (vista desde Node). Este métrica deberá ser visualizada en un gráfico adicional, que estará correlacionado con los demás gráficos en el tiempo.

Sección 2

Aplicación

La aplicación utilizada en la sección 1, "bbox", posee ciertas características que deberán determinar. El trabajo realizado en la sección 1 debe despejar algunas de ellas, que podrán ser verificadas aquí, y se deberán determinar otras.

Análisis y caracterización

Deberán caracterizar cada servicio mirando tres propiedades:

Sincrónico / Asincrónico: Uno de los servicios se comportará de manera sincrónica, y el otro de manera asincrónica. Deberán detectar de qué tipo es cada uno.
Cantidad de workers (en el caso sincrónico): El servicio sincrónico está implementado con una cantidad de workers. Deberán buscar algún indicio sobre cuál es esta cantidad.
Demora en responder: Cada servicio demora un tiempo en responder, que puede ser igual o distinto entre ellos. Deberán obtener este valor para cada uno.

Las herramientas para este análisis son las mismas que usaron en la Sección 1. Deben generar carga que ponga en relieve las características de cada servicio, haciendo uso de gráficos para mostrar puntos interesantes de la prueba. Incluyan en el informe una descripción de la/s estrategia/s utilizada/s. Recomendamos, por claridad, agregar una tabla al final de la sección con los resultados para cada uno.

Sección 3

Caso de estudio - Sistema de Inscripciones

Utilizando las herramientas y procedimientos de las secciones anteriores, deberán simular el comportamiento bajo carga de un sistema de inscripciones a materias (similar al SIU Guaraní).

Nos concentraremos en simular la inscripción a una o más materias. Desde el punto de vista del usuario, implica:

Iniciar sesión
Seleccionar una carrera
Inscribirse (n veces)
1. Ver la lista de materias en las que está inscripto
2. Ver la lista de materias disponibles
3. Inscribirse en una materia
Cerrar sesión

Para implementar este flujo, herramientas como Artillery (usando scenarios) o JMeter nos permiten simularlo.

Deberán establecer ciertas hipótesis respecto de las dimensiones del problema. Por ejemplo, cantidad de alumnos, cantidad de prioridades y su segmentación en franjas horarias, etc. También deberán modelar el tipo de comportamiento de cada endpoint, y jugar con los tiempos de demora que cada uno debería (razonablemente) tener.

Con el escenario planteado, generar la carga, graficar puntos interesantes y luego analizar el comportamiento que el sistema debería exhibir.

Aclaraciones sobre la entrega

El trabajo debe entregarse completo. No se aceptan entregas parciales.
Asumimos que todo el grupo participa en la resolución del trabajo. De ocurrir problemas o surgir contratiempos, es el grupo quien debe responder y solucionarlos. Pueden consultar a los docentes pero deben demostrar primero que intentaron solucionarlos internamente.
De haber defectos graves en el desarrollo o en el informe del TP, se solicitará una re-entrega. Esto tiene un impacto considerable en la nota final, por lo que les recomendamos que controlen entre todo el grupo las conclusiones y justificaciones antes de entregar el trabajo.

Links útiles

Node.js:
Express:
- https://expressjs.com/en/starter/hello-world.html
Nginx:
- https://nginx.org/
Docker:
- https://docker-k8s-lab.readthedocs.io/en/latest/docker/docker-engine.html
- https://www.docker.com/
Docker-compose:
- https://docs.docker.com/compose/
StatsD:
- https://github.com/etsy/statsd
- https://github.com/etsy/statsd/blob/master/docs/graphite.md
Graphite:
- https://graphiteapp.org/
- https://graphite.readthedocs.io/en/latest/
Grafana:
- https://grafana.com/
- https://docs.grafana.org/guides/getting_started/
Imagen usada (statsd + graphite):
- https://hub.docker.com/r/graphiteapp/graphite-statsd/
- https://github.com/graphite-project/docker-graphite-statsd
Gotchas:
- http://dieter.plaetinck.be/post/25-graphite-grafana-statsd-gotchas/
Artillery:
JMeter:
- https://jmeter.apache.org/

Pequeño cheatsheet de docker

Es posible que necesiten ejecutar los comandos con sudo, según el sistema que usen y cómo lo hayan instalado.

# Ver qué containers existen
docker ps [-a]

# Ver qué imagenes hay en mi máquina
docker images

# Ver uso de recursos de containers (como "top" en linux)
# Ejemplo con formato específico: docker stats --format '{{.Name}}\t{{.ID}}\t{{.CPUPerc}}\t{{.MemUsage}}'
docker stats [--format <format_string>]

# Descargar una imagen
docker pull <image>[:<tag>]

# Eliminar un container
docker rm <container_id> [-f]

# Eliminar una imagen
docker rmi <image_id> [-f]

# Eliminar imágenes "colgadas" (dangling)
docker rmi $(docker images -q -f dangling=true)

# Versión instalada
docker version

Pequeño cheatsheet de docker-compose

Todos los siguientes comandos deben ejecutarse desde la carpeta en donde está el archivo docker-compose.yml del proyecto.

Es posible que necesiten ejecutar los comandos con sudo, según el sistema que usen y cómo lo hayan instalado.

# ALIAS para escribir menos
alias docc='docker-compose'

# Ayuda general
docc --help

# Ayuda genral para cualquier comando
docc [COMMAND] --help

# Levantar servicios.
# Sugerencia: Usar la opción -d para levantar en background, y poder seguir usando la terminal
# También sirve para escalar horizontalmente un servicio que ya se esté ejecutando [buscar opción --scale].
# Si no se especifica al menos un servicio, se levantan todos
docc up [options] [SERVICE...]

# Ver logs de un servicio ejecutándose en background
docc logs [options] [SERVICE]

# Listar containers y sus estados
docc ps

# Restartear servicios
# Si no se indica al menos un servicio, se restartean todos
docc restart [SERVICE...]

# Frenar servicios corriendo en background (con la opción --detach del `up`)
# Si no se lista ningún servicio, se frenan todos.
# Esto solo frena servicio, no borra el container ni los datos que hayan en el mismo
docc stop [SERVICE...]

# Frenar containers y borrar tanto los containers como las imágenes y los volúmenes de almacenamiento
# (se pierden todos los datos que hubiera en el container).
# Esto aplica a TODOS los levantados con `up`, no filtra por servicio
docc down

# Levantar un nuevo container de un servicio y ejecutar un comando adentro
# (util para tener por ejemplo una terminal dentro de un container e inspeccionarlo o hacer pruebas manuales).
# Como es siempre sobre un container nuevo, lo que ven es el resultado de su docker-compose.yml y sus dockerfiles
# Ejemplo: docc run graphite bash
docc run SERVICE COMMAND

# Correr un comando en un container que ya existe y ya está corriendo.
# Parecido a `run` pero sobre un container en ejecución.
# Útil para alterar o inspeccionar algo que se está ejecutando.
#Lo que ven adentro puede no ser el resultado directo del docker-compose.yml + dockerfiles, así que mucho cuidado
# si van a modificar sus containers así, porque puede ser difícil de reproducir luego.
# Ejemplo: docc exec graphite bash
docc exec SERVICE COMMAND

# Versión instalada
docc version

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
app		app
perf		perf
.gitignore		.gitignore
.jshintrc		.jshintrc
README.md		README.md
docker-compose.yml		docker-compose.yml
graphite.storage-schemas.conf		graphite.storage-schemas.conf
nginx_reverse_proxy.conf		nginx_reverse_proxy.conf
statsd.config.js		statsd.config.js

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Punto de partida para el TP 1 de Arquitectura del Software (75.73) del 2do cuatrimestre de 2022

Objetivos

Consigna

Sección 1

Tipos de endpoints para comparar los servidores

Configuraciones de deployment

Obligatorias

Opcionales

Generación de carga para las pruebas

Adicionales obligatorios

Sección 2

Aplicación

Análisis y caracterización

Sección 3

Caso de estudio - Sistema de Inscripciones

Aclaraciones sobre la entrega

Links útiles

Pequeño cheatsheet de docker

Pequeño cheatsheet de docker-compose

About

Releases

Packages

Languages

LordOfThePing/2c22-tp-1-aquitectura

Folders and files

Latest commit

History

Repository files navigation

Punto de partida para el TP 1 de Arquitectura del Software (75.73) del 2do cuatrimestre de 2022

Objetivos

Consigna

Sección 1

Tipos de endpoints para comparar los servidores

Configuraciones de deployment

Obligatorias

Opcionales

Generación de carga para las pruebas

Adicionales obligatorios

Sección 2

Aplicación

Análisis y caracterización

Sección 3

Caso de estudio - Sistema de Inscripciones

Aclaraciones sobre la entrega

Links útiles

Pequeño cheatsheet de docker

Pequeño cheatsheet de docker-compose

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages