Tensoria
Parlez-nous de votre projet : 07 82 80 51 40
Machine Learning Par

Capteurs et données pour la maintenance prédictive : par où commencer

capteurs et données pour la maintenance prédictive - vibration, température, courant moteur en industrie PME

Les capteurs et les données sont le premier blocage concret d'un projet de maintenance prédictive : sans les bons signaux, les meilleurs algorithmes ne servent à rien. La bonne nouvelle, c'est que la plupart des modes de défaillance industriels courants se lisent avec trois grandeurs physiques de base : vibration, température, courant moteur. Le prix des noeuds de mesure IoT industriels a chuté de plus de 85 % depuis 2019 - un point de mesure vibratoire qui coûtait 600 dollars en 2019 se négocie sous 50 dollars en 2026 selon Tractian. L'obstacle n'est plus le hardware, c'est de savoir quoi mesurer, à quelle fréquence, et avec quel historique minimum pour démarrer.

Ce guide couvre les grandeurs à mesurer par mode de défaillance, les fréquences d'échantillonnage réalistes pour une PME industrielle, le volume d'historique et le nombre de pannes run-to-failure nécessaires, la méthode de labellisation, la qualité des données et l'intégration capteurs / automates / GMAO. En fin d'article, un plan de PoC concret pour démarrer sans se perdre dans la complexité.

Quelles grandeurs mesurer selon le mode de défaillance

Avant d'acheter un capteur, il faut identifier le mode de défaillance dominant sur chaque équipement. Un roulement qui lâche ne se signale pas de la même façon qu'un balourd ou qu'une surchauffe de bobinage. Voici les cinq familles de mesure et les défauts qu'elles couvrent.

Vibration (accélérométrie)

C'est la mesure la plus riche pour les machines tournantes - moteurs électriques, pompes, compresseurs, ventilateurs, réducteurs. Un accéléromètre triaxial collé sur le palier de roulement capte les signaux caractéristiques de quatre types de défauts : défaut de bague intérieure, défaut de bague extérieure, défaut de bille, et balourd/désalignement.

Ces défauts génèrent des fréquences spécifiques calculables à partir des dimensions du roulement et de la vitesse de rotation (fréquences BPFI, BPFO, BSF, FTF). L'analyse spectrale (FFT) et l'enveloppe du signal (demodulation) permettent de les isoler. Des signatures de défaillance roulement apparaissent typiquement 10 à 30 jours avant la défaillance, avec des modèles IA qui les détectent avec 80 à 90 % de précision selon plusieurs études terrain 2025-2026.

Température

La surveillance thermique couvre deux familles de défauts : les défauts de lubrification (montée en température du roulement) et les défauts électriques (surchauffe des enroulements, points chauds sur les armoires électriques). Un simple thermocouple de contact sur la cage de roulement ou un capteur RTD sur la carcasse moteur suffit pour la première famille. Pour les armoires et les connexions électriques, une caméra thermique périodique reste plus pratique qu'un capteur fixe.

La température seule est un signal tardif - la montée thermique survient souvent peu de temps avant la défaillance. C'est pourquoi on couple systématiquement la vibration (signal précoce) et la température (confirmation) pour avoir à la fois une alerte avancée et un signal de criticité.

Courant et puissance moteur

La mesure du courant statorique (Motor Current Signature Analysis, MCSA) est puissante car elle ne nécessite aucun capteur sur la machine : une pince ampèremétrique sur l'alimentation électrique du moteur suffit. Elle détecte les défauts de roulements, les barres de rotor cassées, les déséquilibres de phase, et les variations de charge anormales (cavitation dans une pompe, blocage mécanique partiel).

La mesure de puissance active et réactive ajoute la détection de sous-charge (marche à vide non prévue) et sur-charge prolongée. C'est souvent le point d'entrée le moins intrusif pour une PME qui n'a pas encore de capteurs IoT déployés.

Acoustique et ultrasons

Les capteurs d'émission acoustique ultrasonique (40 kHz) détectent les frottements secs liés à un manque de lubrification sur roulements et engrenages, les fuites de gaz ou vapeur sous pression, et les arcs électriques dans les tableaux haute tension. Leur avantage : mesure sans contact, applicable sur des équipements difficiles d'accès ou tournant à faible vitesse (convoyeurs, paliers lents) où l'accélérométrie classique est peu sensible.

Analyse d'huile

Pour les réducteurs, boites de vitesse et turbines hydrauliques, l'analyse d'huile (ferrographie, spectrométrie) quantifie les particules métalliques en suspension - indicateur direct d'usure des surfaces en contact. C'est une mesure périodique (mensuelle à trimestrielle) plutôt que continue, souvent externalisée en laboratoire. Elle est complémentaire à la vibration sur les équipements lents où la FFT est moins discriminante.

Mode de défaillance Mesure principale Mesure complémentaire Signal précoce (avant panne)
Défaut roulement (rapide) Vibration (FFT + enveloppe) Température palier 10 à 30 jours
Balourd / désalignement Vibration (RMS, 1x / 2x) Courant moteur Semaines à mois
Défaut bobinage moteur Courant (MCSA) Température carcasse Semaines
Manque de lubrification Ultrasons (40 kHz) Température + vibration HF Jours à semaines
Cavitation pompe Vibration + courant Pression diff. (amont/aval) Heures à jours
Usure engrenage lent Analyse d'huile Vibration (bandes latérales) Mois

Fréquence d'échantillonnage : le bon compromis selon le cas d'usage

C'est un point souvent mal calibré en pratique. Echantillonner trop bas, on rate les fréquences de défaut. Trop haut, on génère des volumes de données ingérables sur des mois ou des années.

Pour la vibration sur machines tournantes

Le théorème de Shannon impose d'échantillonner à au moins deux fois la fréquence maximale que l'on veut analyser. Pour détecter les harmoniques de défaut roulement sur un moteur tournant à 1 500 tr/min, les fréquences d'intérêt montent jusqu'à 5 à 10 kHz. En pratique, les recommandations de terrain convergent vers :

  • 1,6 à 6,4 kHz : noeud IoT autonome sur batterie, collecte par rafales périodiques. Bon compromis pour les défauts de roulements standards.
  • 25 kHz et plus : nécessaire pour les machines rapides (brochages, turbines) ou les défauts hautes fréquences (engrenages à 10 000+ dents/minute).
  • 800 Hz : minimum absolu pour une analyse RMS globale - suffisant pour détecter un balourd ou un désalignement grossier, pas pour les défauts de roulement avancés.

Repere pratique

En collecte continue à 6,4 kHz sur un accéléromètre triaxial (16 bits), un seul capteur génère environ 230 Mo de données brutes par heure. A l'échelle de 20 capteurs et d'un an, c'est plus de 40 To. En pratique, on collecte des rafales de quelques secondes toutes les 5 à 30 minutes, ce qui ramène le volume à quelques dizaines de Go par an - gérable dans un data lake standard.

Pour la température et le courant

Ces grandeurs varient lentement (thermique) ou à la fréquence industrielle (50 Hz pour le courant). Une fréquence d'acquisition de 1 à 10 Hz suffit pour la température. Pour le MCSA, un échantillonnage à 10 kHz pendant quelques secondes (rafale) est nécessaire pour résoudre les harmoniques du courant statorique - mais on ne l'acquiert pas en continu.

Combien d'historique et de pannes run-to-failure faut-il

C'est la question que tout chef de projet se pose au démarrage, et la réponse honnête est : ça dépend du modèle cible. Voici la grille de lecture selon l'approche choisie.

Approche supervisée (classification / régression RUL)

Un modèle supervisé apprend à distinguer "état normal" de "défaillance imminente" sur la base d'exemples étiquetés. Pour que le modèle généralise, il faut observer suffisamment de pannes du même type sur des conditions comparables :

  • Minimum absolu : 5 à 10 événements de panne par mode de défaillance cible. En dessous, le modèle sur-apprend les exemples disponibles sans généraliser.
  • Niveau confortable : 20 à 30 pannes permettent de croiser validation et test sans vider le dataset d'entraînement.
  • Historique temporel : 6 à 18 mois de données capteurs incluant ces pannes est le minimum courant. Plus l'historique est long (2 à 3 ans), plus le modèle est robuste aux variations saisonnières de charge ou de température ambiante.

Approche non supervisée (détection d'anomalies)

Quand l'historique de pannes est inexistant ou trop limité, la détection d'anomalies est la porte d'entrée réaliste. On entraîne le modèle uniquement sur des périodes de fonctionnement normal (pas besoin d'exemples de pannes) et on alerte sur tout écart statistiquement significatif par rapport à cette baseline.

Quelques semaines à quelques mois de données normales suffisent. Les algorithmes courants en 2026 : Isolation Forest, LSTM Autoencoder, One-Class SVM. Cette approche ne prédit pas un type de panne précis, mais elle détecte les dérives et aide à déclencher des inspections ciblées. C'est souvent le point de départ avant d'accumuler assez de pannes pour passer au supervisé.

Pour aller plus loin sur la prédiction de durée de vie résiduelle, notre article durée de vie résiduelle (RUL) en maintenance prédictive couvre les architectures modèles et les approches probabilistes.

Labelliser les défaillances : méthode concrète

C'est l'étape qui prend le plus de temps et qui conditionne la qualité du modèle. Un bon dataset de maintenance prédictive repose sur la synchronisation de deux sources : les données capteurs (continues) et les ordres de travail de la GMAO (ponctuels).

Construire le dataset run-to-failure

Pour chaque intervention corrective dans la GMAO, l'opération consiste à :

  1. Identifier l'horodatage de la panne (arrêt machine ou déclenchement d'alarme).
  2. Remonter dans les données capteurs sur la fenêtre précédant la panne (typiquement 24 à 72 heures).
  3. Labelliser cette fenêtre selon la criticité : "dégradation précoce", "dégradation avancée", "proche panne" - plutôt qu'un simple binaire qui efface l'information de progression.
  4. Qualifier la cause racine depuis le rapport du technicien : défaut roulement, balourd, problème électrique, manque de lubrification...

Le tout est condensé dans un fichier structuré (timestamp, valeurs capteurs, label, cause) qui forme le dataset d'entraînement. Cette synchronisation GMAO / capteurs est souvent manuelle les premiers mois, puis automatisable une fois les connexions API en place.

Pièges courants dans la labellisation

Plusieurs erreurs reviennent systématiquement sur le terrain :

  • Labelliser uniquement l'heure exacte de la panne, au lieu de la fenêtre de dégradation. On obtient un dataset déséquilibré (1 occurrence de panne pour 10 000 d'état normal) qui rend l'entraînement difficile.
  • Confondre maintenance préventive et corrective dans les ordres de travail GMAO. Seules les interventions correctives (panne réelle ou défaut confirmé) fournissent un signal de dégradation. Les remplacements préventifs planifiés brouillent le signal.
  • Ignorer les faux positifs de l'historique. Si une alarme vibratoire a été déclenchée mais qu'il n'y avait pas de défaut (vibrations transitoires lors d'un démarrage, par exemple), ce label erroné dégrade le modèle.

Qualite des donnees

Selon plusieurs retours terrain, la qualité des données GMAO est souvent le vrai goulot d'étranglement : causes de panne absentes ou notées "divers", dates d'intervention imprécises, identifiants équipement inconsistants entre le logiciel de maintenance et l'historien. Avant d'installer un seul capteur supplémentaire, auditer la complétude des ordres de travail des 2 dernières années est l'investissement le plus rentable.

Intégration capteurs, automates et GMAO

Le pipeline de données d'un projet de maintenance prédictive comporte trois couches qu'il faut relier sans créer de silos.

Collecte : OPC-UA, MQTT et capteurs IoT

Deux sources d'alimentation coexistent sur un site industriel. Les automates (PLC) et systèmes SCADA exposent déjà des données process (pression, débit, température, état marche/arrêt) via le protocole OPC-UA (standard industriel ISO/IEC 62541) ou Modbus. Ces données sont souvent disponibles sans nouveau capteur - elles sont juste mal exploitées.

Les noeuds IoT industriels (capteurs sans fil WiFi ou LoRaWAN) s'ajoutent là où l'automate ne remonte rien : vibration de roulement, température de surface, émission acoustique. Les protocoles MQTT et AMQP sont les standards côté IoT, avec une passerelle (edge gateway) qui agrège les flux avant envoi vers le serveur.

Stockage : bases de données séries temporelles

Les données capteurs sont des séries temporelles - un timestamp plus une ou plusieurs valeurs numériques, à haute fréquence. Les bases relationnelles classiques (PostgreSQL, MySQL) ne sont pas optimisées pour ce cas d'usage. Les solutions courantes en 2026 :

  • InfluxDB : open-source, très répandu pour les flux IoT, compression native des séries temporelles.
  • TimescaleDB : extension PostgreSQL, intéressant si l'équipe maîtrise déjà SQL.
  • PI System (OSIsoft/AVEVA) : standard dans les grandes industries (chimie, énergie), coûteux mais avec un historien robuste.

Interface GMAO : créer les ordres de travail automatiquement

L'objectif final est qu'une anomalie détectée par le modèle crée automatiquement un ordre de travail dans la GMAO (SAP PM, Infor EAM, Divalto, CARL...) avec le bon équipement, la priorité suggérée et les données d'alerte en pièce jointe. La plupart des GMAO modernes exposent une API REST pour ça. Le flux typique : alerte modele -> webhook -> API GMAO -> OT préventif avec fenetre d'intervention suggérée.

Pour le pilotage et le suivi des rapports de maintenance, notre article rapports de maintenance industrielle avec l'IA couvre la génération automatisée des comptes-rendus d'intervention.

Par où commencer concrètement : le PoC en 4 etapes

Un projet de maintenance prédictive qui démarre trop large finit en pilote éternel. La clé est de cadrer un PoC sur un périmètre restreint mais à fort impact visible.

Etape 1 - Identifier l'équipement critique et le mode de défaillance cible

Partir de la liste des pannes les plus coûteuses des 2 dernières années (arrêts de production, coûts de réparation, délais de réapprovisionnement). Sélectionner un ou deux équipements dont la défaillance a un impact mesurable et un mode de défaillance dominant connu - idéalement un défaut de roulement sur une machine tournante, car c'est le cas d'usage le plus documenté et le plus facile à instrumenter.

Etape 2 - Instrumenter et collecter 3 à 6 mois

Installer les capteurs (vibration triaxial + température) sur les paliers de roulement des équipements retenus. Connecter à un edge gateway. Stocker dans une base séries temporelles. Pendant cette phase, aucun modèle n'est nécessaire : on constitue l'historique. Si une panne survient pendant cette période, c'est une opportunité de labellisation à ne pas manquer - documenter précisément dans la GMAO.

Etape 3 - Croiser GMAO et capteurs pour constituer le dataset

Extraire les ordres de travail correctifs des 2 à 3 dernières années depuis la GMAO. Synchroniser avec les données capteurs (si elles existent pour les équipements ciblés). Labelliser les fenêtres de dégradation. Si l'historique de pannes est insuffisant, démarrer directement par un modèle de détection d'anomalies non supervisé sur les 3 à 6 mois collectés à l'étape 2.

Etape 4 - Entraîner, evaluer et connecter à la GMAO

Entraîner un premier modèle (Isolation Forest pour le non supervisé, ou XGBoost / Random Forest sur des features vibratoires extraites par FFT pour le supervisé). Evaluer sur une fenêtre de test hors entraînement. Brancher les alertes sur un canal de notification (email, SMS, OT GMAO). Suivre les vrais positifs / faux positifs pendant 4 à 8 semaines avant de décider d'élargir le périmètre.

Pour les aspects analyse vibratoire en détail (FFT, enveloppe, indicateurs RMS/kurtosis), notre article analyse vibratoire et IA pour la maintenance prédictive couvre les algorithmes et les outils.

Pour un panorama complet sur la maintenance prédictive IA en industrie PME/ETI, l'article maintenance prédictive IA en industrie pour les PME pose le cadre business et technique de référence.

Cadrage maintenance predictive

Quels capteurs sur quels equipements, quel modele pour votre historique disponible - on cadre votre PoC en 30 minutes.

Réserver un échange

En résumé : les données avant les algorithmes

Un projet de maintenance prédictive bien instrumenté avec des données médiocrement labellisées donnera de mauvais résultats. Un projet avec des données propres et un modèle simple donnera de bons résultats. L'investissement dans la qualité des données - calibration des capteurs, rigueur des comptes-rendus GMAO, synchronisation des sources - est toujours plus rentable que la recherche du meilleur algorithme.

Le trio vibration + température + courant couvre 70 à 80 % des modes de défaillance courants sur des machines tournantes. La détection d'anomalies non supervisée permet de démarrer sans historique de pannes. Et un PoC sur 2 équipements critiques avec un ROI mesurable en 6 mois est un point de départ bien plus solide qu'une plateforme déployée sur 50 machines sans cas d'usage validé.

Pour aller plus loin

Passer à l'action

Vous voulez appliquer ça dans votre entreprise ?

En quelques minutes, identifiez les cas d'usage IA les plus rentables pour votre métier. Sans engagement, et sans jargon.

Demander un devis

Articles liés

Machine Learning

RUL : prédire la durée de vie résiduelle en maintenance prédictive

Durée de vie résiduelle (RUL) : familles de modèles, deep learning LSTM/CNN, dataset CMAPSS, quantification de l'incertitude et passage à la décision maintenance. Guide technique.

Lire l'article
Machine Learning

Variables exogènes en prévision : météo, promos, jours fériés

Comment intégrer météo, promotions et jours fériés dans une prévision de séries temporelles : feature engineering, SARIMAX, Prophet, TFT, leakage. Guide concret PME.

Lire l'article
Machine Learning

Prévision demande pièces détachées aéronautique : gérer l'intermittent avec l'IA

Prévision demande pièces détachées aéronautique : pourquoi la demande intermittente échoue les outils classiques, méthodes Croston/SBA/TSB, ML et foundation models. Guide MRO Toulouse.

Lire l'article
Machine Learning

MLOps maintenance prédictive : gérer le drift et réentraîner son modèle

Du PoC à la production en maintenance prédictive : data drift, concept drift, monitoring, réentraînement, boucle feedback opérateur et intégration GMAO. Guide complet.

Lire l'article
Machine Learning

Foundation models séries temporelles : prévision zero-shot en 2026

Foundation models séries temporelles : TimesFM, Chronos, Moirai, TimeGPT, Toto. Prévision zero-shot, architecture, benchmarks vs ARIMA/Prophet, déploiement PME. Guide complet.

Lire l'article
Machine Learning

Evaluer une prévision : MAPE, MASE, backtesting

MAPE, sMAPE, MASE, backtesting temporel : comment évaluer une prévision de séries temporelles sans se tromper. Métriques, pièges et checklist finale.

Lire l'article
Anas Rabhi, ingénieur IA et data scientist, fondateur de Tensoria
Anas Rabhi Ingénieur IA, fondateur de Tensoria ianas.fr

Je suis ingénieur IA et data scientist, fondateur de Tensoria. Depuis plus de 6 ans, j'accompagne les entreprises dans l'exploitation concrète de l'IA pour leur métier : assistants internes basés sur RAG, agents IA en production, automatisations sur mesure, traitement intelligent de documents. J'interviens du cadrage initial à la mise en production, sur stacks LLM modernes (Mistral, Claude, GPT) et infrastructures souveraines quand la confidentialité l'exige.