MISE EN PLACE D’UN OUTIL RAG LOCAL
Objectif du stage :
Développer, tester et intégrer un système RAG (Retrieval-Augmented Generation) robuste et adapté aux besoins spécifiques des projets CLEARSY.
Contexte :
CLEARSY, spécialiste des systèmes critiques et de sûreté, a initié une démarche proactive d’exploration et d’intégration des technologies d’IA générative via son infrastructure interne.
Des expérimentations ont été menées autour des grands modèles de langage (LLM) pour automatiser certaines tâches techniques et pour proposer un chatbot local et sécurisé à usage interne.
Dans la continuité de cette dynamique, CLEARSY s’intéresse à la technologie RAG qui est particulièrement pertinente dans un contexte industriel avec une forte exigence de traçabilité, de vérifiabilité et de confidentialité.
Le stage est structuré comme suit :
- Analyse et cadrage du besoin
- Veille et benchmark technique :
- Évaluation comparative de plusieurs frameworks RAG open source (RAGFlow, LlamaIndex, Haystack, LangChain…).
- Tests de performance avec différents moteurs vectoriels (FAISS, Qdrant…), encodeurs (Ollama, HuggingFace…), et modèles LLM.
- Développement de la solution retenue :
- Mise en place de la chaîne RAG choisie sur le CLEARSY AI Server.
- Intégration à un projet pilote CLEARSY (ex. base documentaire technique d’un projet existant).
- Validation et documentation :
- Évaluation des performances (temps de réponse, pertinence, robustesse).
- Rédaction d’un guide d’utilisation et d’un retour d’expérience.
Livrables attendus :
- Prototype fonctionnel de chaîne RAG intégrée sur serveur CLEARSY
- Scripts, librairies et infrastructure logicielle associée
- Benchmark comparatif des solutions testées
- Rapport technique complet et documentation d’intégration
Compétences recherchées :
- IA, NLP, Machine Learning (bases en LLM, embeddings, RAG)
- Programmation Python avancée
- Librairies Python : HuggingFace, Transformers, LangChain, FAISS/Qdrant…
- Connaissances en architecture logicielle, API, développement orienté ob.