Tensoria
Parlez-nous de votre projet : 07 82 80 51 40
Anas Rabhi, ingénieur IA et data scientist, fondateur de Tensoria
Auteur Toulouse, Occitanie

Anas Rabhi

Ingénieur IA et data scientist, fondateur de Tensoria

Depuis plus de 6 ans, j'accompagne les entreprises dans l'exploitation concrète de l'IA pour leur métier. Assistants internes basés sur RAG, agents IA en production, automatisations sur mesure, traitement intelligent de documents : je conçois des solutions qui s'intègrent dans vos processus existants et produisent des résultats mesurables.

À propos

Je suis ingénieur IA et data scientist, formé sur des projets variés depuis 2019 : NLP, machine learning, recherche sémantique, déploiement de modèles en production. J'ai fondé Tensoria pour me concentrer sur ce qui produit vraiment de la valeur en entreprise : transformer des problèmes métier concrets en solutions IA fiables, mesurables, maintenables.

Mon angle d'attaque est toujours le même. Partir du métier, identifier les frictions réelles (saisie manuelle, recherche d'information, génération de documents, qualification), puis choisir l'outil le plus pragmatique. Souvent ce sera du RAG sur des données internes, parfois un agent IA qui orchestre plusieurs outils, parfois simplement une chaîne d'automatisation bien pensée.

Je travaille beaucoup avec des PME et ETI françaises (cabinets d'avocats, bureaux d'études, artisans BTP, courtiers en assurance, experts comptables) qui veulent intégrer l'IA sans dépendre des géants américains. Quand la confidentialité l'exige, je déploie sur des stacks souveraines (Mistral, Azure EU, infrastructures self-hosted).

Je publie régulièrement sur le blog Tensoria et sur ianas.fr les retours d'expérience de mes missions : architectures techniques, choix de stack, métriques d'évaluation, coûts réels, limites observées.

Mes domaines d'expertise

Ce sur quoi je travaille au quotidien, sur quoi je peux argumenter techniquement, et où j'ai déjà produit des résultats en production.

RAG et moteurs de recherche

Retrieval hybride (vectoriel + BM25), reranking, chunking adapté au métier, évaluation rigoureuse (recall@k, hit rate). Mistral, OpenAI, Claude, modèles self-hosted.

Agents IA

Orchestration multi-étapes, tool calling, workflows robustes pour la production. n8n, LangGraph, frameworks custom. Gestion d'erreurs et observabilité.

NLP appliqué

Classification, extraction d'entités, résumé automatique, recherche sémantique. Fine-tuning quand pertinent (CamemBERT, modèles spécialisés métier).

LLMOps

Monitoring qualité, suivi des coûts, sécurité des prompts, déploiement progressif. Eval sets construits avec les métiers, A/B testing de modèles.

Automatisations métier

Extraction emails, traitement de pièces jointes, intégrations CRM, ERP, outils SaaS. Approche pragmatique : IA quand elle apporte vraiment, code classique sinon.

IA souveraine et on-premise

Déploiement Mistral, Llama, Qwen sur infrastructure cliente ou cloud privé européen. Conformité RGPD, secret professionnel, données sensibles.

Ma façon de travailler

Quatre étapes claires, pas de promesses irréalistes, du livrable à chaque jalon.

01

Cadrage

1 à 2 semaines

Immersion dans le métier, identification des cas d'usage à fort impact, faisabilité technique, estimation ROI. Livrable : roadmap chiffrée.

02

POC fonctionnel

2 à 4 semaines

Prototype testable sur vos données réelles. Eval set construit avec vous, métriques objectives, décision Go / No Go avant d'engager la production.

03

Mise en production

2 à 3 mois

Intégration aux outils existants (CRM, ERP, intranet), tests, formation des utilisateurs, monitoring, déploiement progressif sur les équipes.

04

Maintenance et amélioration

En continu

Suivi qualité, mise à jour des modèles, ajustements selon retours utilisateurs, optimisation des coûts d'inférence.

Quelques résultats concrets

Trois exemples de gains mesurés sur des projets livrés en production.

75 %

Temps économisé

Agent IA de réponse aux appels d'offres pour un bureau d'études. ROI mesuré supérieur à 300 % sur la première année.

60 %

Temps économisé

Assistant IA déployé en usine pour la recherche dans la documentation technique. Adoption immédiate par les équipes terrain.

2 x

Plus rapide

Extraction documentaire automatisée pour un cabinet d'avocats. Réduction drastique du temps de traitement des dossiers.

Articles récents

Retours d'expérience, architectures, comparatifs et chiffres terrain.

Voir tous les articles
Outils & Modèles

Claude Sonnet 5 : l'agentique enfin abordable en PME

Claude Sonnet 5 (30 juin 2026) : performances proches d'Opus 4.8, prix 2 à 3 fois inférieur. Ce que ça change vraiment pour l'automatisation en PME.

Lire
Outils & Modèles

Structured output JSON et constrained decoding (LLM)

Structured output JSON avec un LLM : JSON mode, function calling, constrained decoding, Outlines, XGrammar, Pydantic. Obtenez un JSON valide à 100% en production.

Lire
Outils & Modèles

SLM embarqué : interroger la doc technique aéro sans cloud

SLM embarqué offline pour la doc technique aéronautique (AMM, IPC, ATA) : architecture RAG local, choix du modèle, matériel atelier et contraintes ITAR/EAR. Guide pratique.

Lire
Machine Learning

RUL : prédire la durée de vie résiduelle (maintenance)

RUL (remaining useful life) : modèles LSTM/CNN, CMAPSS, quantification de l'incertitude et décision maintenance prédictive. Guide technique.

Lire
Machine Learning

Variables exogènes en prévision de séries temporelles

Comment intégrer météo, promotions et jours fériés dans une prévision de séries temporelles : feature engineering, SARIMAX, Prophet, TFT, leakage. Guide concret PME.

Lire
Machine Learning

Prévision pièces détachées aéronautique et IA

Prévision de la demande en pièces détachées aéronautique : pourquoi la demande intermittente échoue aux outils classiques, méthodes Croston/SBA/TSB, ML et foundation models.

Lire
Outils & Modèles

Latence LLM : speculative decoding et vLLM

Réduire la latence et augmenter le débit d'un LLM auto-hébergé : TTFT, continuous batching, PagedAttention, speculative decoding, quantization et choix GPU expliqués.

Lire
Machine Learning

MLOps maintenance prédictive : drift et réentraînement

Du PoC à la production en maintenance prédictive : data drift, concept drift, monitoring, réentraînement, boucle feedback opérateur et intégration GMAO. Guide complet.

Lire
Machine Learning

Foundation models pour séries temporelles en 2026

TimesFM, Chronos, Moirai, TimeGPT, Toto : prévision zero-shot, architectures, benchmarks vs ARIMA/Prophet et déploiement en PME. Guide complet.

Lire

Vous avez un projet IA ?

30 minutes de cadrage gratuit pour comprendre votre besoin et vous dire honnêtement si l'IA est le bon levier. Si oui, on discute du comment. Sinon, je vous le dis aussi.