Anas Rabhi
Ingénieur IA et data scientist, fondateur de Tensoria
Depuis plus de 6 ans, j'accompagne les entreprises dans l'exploitation concrète de l'IA pour leur métier. Assistants internes basés sur RAG, agents IA en production, automatisations sur mesure, traitement intelligent de documents : je conçois des solutions qui s'intègrent dans vos processus existants et produisent des résultats mesurables.
À propos
Je suis ingénieur IA et data scientist, formé sur des projets variés depuis 2019 : NLP, machine learning, recherche sémantique, déploiement de modèles en production. J'ai fondé Tensoria pour me concentrer sur ce qui produit vraiment de la valeur en entreprise : transformer des problèmes métier concrets en solutions IA fiables, mesurables, maintenables.
Mon angle d'attaque est toujours le même. Partir du métier, identifier les frictions réelles (saisie manuelle, recherche d'information, génération de documents, qualification), puis choisir l'outil le plus pragmatique. Souvent ce sera du RAG sur des données internes, parfois un agent IA qui orchestre plusieurs outils, parfois simplement une chaîne d'automatisation bien pensée.
Je travaille beaucoup avec des PME et ETI françaises (cabinets d'avocats, bureaux d'études, artisans BTP, courtiers en assurance, experts comptables) qui veulent intégrer l'IA sans dépendre des géants américains. Quand la confidentialité l'exige, je déploie sur des stacks souveraines (Mistral, Azure EU, infrastructures self-hosted).
Je publie régulièrement sur le blog Tensoria et sur ianas.fr les retours d'expérience de mes missions : architectures techniques, choix de stack, métriques d'évaluation, coûts réels, limites observées.
Mes domaines d'expertise
Ce sur quoi je travaille au quotidien, sur quoi je peux argumenter techniquement, et où j'ai déjà produit des résultats en production.
RAG et moteurs de recherche
Retrieval hybride (vectoriel + BM25), reranking, chunking adapté au métier, évaluation rigoureuse (recall@k, hit rate). Mistral, OpenAI, Claude, modèles self-hosted.
Agents IA
Orchestration multi-étapes, tool calling, workflows robustes pour la production. n8n, LangGraph, frameworks custom. Gestion d'erreurs et observabilité.
NLP appliqué
Classification, extraction d'entités, résumé automatique, recherche sémantique. Fine-tuning quand pertinent (CamemBERT, modèles spécialisés métier).
LLMOps
Monitoring qualité, suivi des coûts, sécurité des prompts, déploiement progressif. Eval sets construits avec les métiers, A/B testing de modèles.
Automatisations métier
Extraction emails, traitement de pièces jointes, intégrations CRM, ERP, outils SaaS. Approche pragmatique : IA quand elle apporte vraiment, code classique sinon.
IA souveraine et on-premise
Déploiement Mistral, Llama, Qwen sur infrastructure cliente ou cloud privé européen. Conformité RGPD, secret professionnel, données sensibles.
Ma façon de travailler
Quatre étapes claires, pas de promesses irréalistes, du livrable à chaque jalon.
Cadrage
1 à 2 semaines
Immersion dans le métier, identification des cas d'usage à fort impact, faisabilité technique, estimation ROI. Livrable : roadmap chiffrée.
POC fonctionnel
2 à 4 semaines
Prototype testable sur vos données réelles. Eval set construit avec vous, métriques objectives, décision Go / No Go avant d'engager la production.
Mise en production
2 à 3 mois
Intégration aux outils existants (CRM, ERP, intranet), tests, formation des utilisateurs, monitoring, déploiement progressif sur les équipes.
Maintenance et amélioration
En continu
Suivi qualité, mise à jour des modèles, ajustements selon retours utilisateurs, optimisation des coûts d'inférence.
Quelques résultats concrets
Trois exemples de gains mesurés sur des projets livrés en production.
Temps économisé
Agent IA de réponse aux appels d'offres pour un bureau d'études. ROI mesuré supérieur à 300 % sur la première année.
Temps économisé
Assistant IA déployé en usine pour la recherche dans la documentation technique. Adoption immédiate par les équipes terrain.
Plus rapide
Extraction documentaire automatisée pour un cabinet d'avocats. Réduction drastique du temps de traitement des dossiers.
Articles récents
Retours d'expérience, architectures, comparatifs et chiffres terrain.
Claude Sonnet 5 : l'agentique enfin abordable en PME
Claude Sonnet 5 (30 juin 2026) : performances proches d'Opus 4.8, prix 2 à 3 fois inférieur. Ce que ça change vraiment pour l'automatisation en PME.
Structured output JSON et constrained decoding (LLM)
Structured output JSON avec un LLM : JSON mode, function calling, constrained decoding, Outlines, XGrammar, Pydantic. Obtenez un JSON valide à 100% en production.
SLM embarqué : interroger la doc technique aéro sans cloud
SLM embarqué offline pour la doc technique aéronautique (AMM, IPC, ATA) : architecture RAG local, choix du modèle, matériel atelier et contraintes ITAR/EAR. Guide pratique.
RUL : prédire la durée de vie résiduelle (maintenance)
RUL (remaining useful life) : modèles LSTM/CNN, CMAPSS, quantification de l'incertitude et décision maintenance prédictive. Guide technique.
Variables exogènes en prévision de séries temporelles
Comment intégrer météo, promotions et jours fériés dans une prévision de séries temporelles : feature engineering, SARIMAX, Prophet, TFT, leakage. Guide concret PME.
Prévision pièces détachées aéronautique et IA
Prévision de la demande en pièces détachées aéronautique : pourquoi la demande intermittente échoue aux outils classiques, méthodes Croston/SBA/TSB, ML et foundation models.
Latence LLM : speculative decoding et vLLM
Réduire la latence et augmenter le débit d'un LLM auto-hébergé : TTFT, continuous batching, PagedAttention, speculative decoding, quantization et choix GPU expliqués.
MLOps maintenance prédictive : drift et réentraînement
Du PoC à la production en maintenance prédictive : data drift, concept drift, monitoring, réentraînement, boucle feedback opérateur et intégration GMAO. Guide complet.
Foundation models pour séries temporelles en 2026
TimesFM, Chronos, Moirai, TimeGPT, Toto : prévision zero-shot, architectures, benchmarks vs ARIMA/Prophet et déploiement en PME. Guide complet.
Vous avez un projet IA ?
30 minutes de cadrage gratuit pour comprendre votre besoin et vous dire honnêtement si l'IA est le bon levier. Si oui, on discute du comment. Sinon, je vous le dis aussi.