CodeLab GenAI Zenika

Bienvenue dans ce CodeLab autour de la GenAI.

L'objectif

Developper une application permettant d'appeler des LLM (Large Language Model) customizer.

Pour ce CodeLab, nous allons principalement utiliser deux librairies / programmes:

Ollama : Permet de faire des inférences sur un modèle en local
LangChain : Framework permettant de construire des applications basé sur des LLM

Côté modèle, nous allons utiliser Mistral 7B un modèle générique de génération de texte.

Le CodeLab peut être réalisé dans différents langages:

Afin de simplifier le déploiement pour les participants, il est possible de déployer Ollama et ChromaDB sur le cloud. Tout est décrit ici

En fonction de la taille du modèle choisi, une certaine configuration mémoire est requise:

Afin de pouvoir faire des inférences en local, il est nécéssaire :

Pour télécharger un modèle, cela peut être fait de deux façons:

En ligne de commande: ollama pull openhermes
Via l'API: curl -XPOST http://localhost:11434/api/pull -d '{"name": "openhermes"}'