Les capteurs et les données sont le premier blocage concret d'un projet de maintenance prédictive : sans les bons signaux, les meilleurs algorithmes ne servent à rien. La bonne nouvelle, c'est que la plupart des modes de défaillance industriels courants se lisent avec trois grandeurs physiques de base : vibration, température, courant moteur. Le prix des noeuds de mesure IoT industriels a chuté de plus de 85 % depuis 2019 - un point de mesure vibratoire qui coûtait 600 dollars en 2019 se négocie sous 50 dollars en 2026 selon Tractian. L'obstacle n'est plus le hardware, c'est de savoir quoi mesurer, à quelle fréquence, et avec quel historique minimum pour démarrer.
Ce guide couvre les grandeurs à mesurer par mode de défaillance, les fréquences d'échantillonnage réalistes pour une PME industrielle, le volume d'historique et le nombre de pannes run-to-failure nécessaires, la méthode de labellisation, la qualité des données et l'intégration capteurs / automates / GMAO. En fin d'article, un plan de PoC concret pour démarrer sans se perdre dans la complexité.
Quelles grandeurs mesurer selon le mode de défaillance
Avant d'acheter un capteur, il faut identifier le mode de défaillance dominant sur chaque équipement. Un roulement qui lâche ne se signale pas de la même façon qu'un balourd ou qu'une surchauffe de bobinage. Voici les cinq familles de mesure et les défauts qu'elles couvrent.
Vibration (accélérométrie)
C'est la mesure la plus riche pour les machines tournantes - moteurs électriques, pompes, compresseurs, ventilateurs, réducteurs. Un accéléromètre triaxial collé sur le palier de roulement capte les signaux caractéristiques de quatre types de défauts : défaut de bague intérieure, défaut de bague extérieure, défaut de bille, et balourd/désalignement.
Ces défauts génèrent des fréquences spécifiques calculables à partir des dimensions du roulement et de la vitesse de rotation (fréquences BPFI, BPFO, BSF, FTF). L'analyse spectrale (FFT) et l'enveloppe du signal (demodulation) permettent de les isoler. Des signatures de défaillance roulement apparaissent typiquement 10 à 30 jours avant la défaillance, avec des modèles IA qui les détectent avec 80 à 90 % de précision selon plusieurs études terrain 2025-2026.
Température
La surveillance thermique couvre deux familles de défauts : les défauts de lubrification (montée en température du roulement) et les défauts électriques (surchauffe des enroulements, points chauds sur les armoires électriques). Un simple thermocouple de contact sur la cage de roulement ou un capteur RTD sur la carcasse moteur suffit pour la première famille. Pour les armoires et les connexions électriques, une caméra thermique périodique reste plus pratique qu'un capteur fixe.
La température seule est un signal tardif - la montée thermique survient souvent peu de temps avant la défaillance. C'est pourquoi on couple systématiquement la vibration (signal précoce) et la température (confirmation) pour avoir à la fois une alerte avancée et un signal de criticité.
Courant et puissance moteur
La mesure du courant statorique (Motor Current Signature Analysis, MCSA) est puissante car elle ne nécessite aucun capteur sur la machine : une pince ampèremétrique sur l'alimentation électrique du moteur suffit. Elle détecte les défauts de roulements, les barres de rotor cassées, les déséquilibres de phase, et les variations de charge anormales (cavitation dans une pompe, blocage mécanique partiel).
La mesure de puissance active et réactive ajoute la détection de sous-charge (marche à vide non prévue) et sur-charge prolongée. C'est souvent le point d'entrée le moins intrusif pour une PME qui n'a pas encore de capteurs IoT déployés.
Acoustique et ultrasons
Les capteurs d'émission acoustique ultrasonique (40 kHz) détectent les frottements secs liés à un manque de lubrification sur roulements et engrenages, les fuites de gaz ou vapeur sous pression, et les arcs électriques dans les tableaux haute tension. Leur avantage : mesure sans contact, applicable sur des équipements difficiles d'accès ou tournant à faible vitesse (convoyeurs, paliers lents) où l'accélérométrie classique est peu sensible.
Analyse d'huile
Pour les réducteurs, boites de vitesse et turbines hydrauliques, l'analyse d'huile (ferrographie, spectrométrie) quantifie les particules métalliques en suspension - indicateur direct d'usure des surfaces en contact. C'est une mesure périodique (mensuelle à trimestrielle) plutôt que continue, souvent externalisée en laboratoire. Elle est complémentaire à la vibration sur les équipements lents où la FFT est moins discriminante.
| Mode de défaillance | Mesure principale | Mesure complémentaire | Signal précoce (avant panne) |
|---|---|---|---|
| Défaut roulement (rapide) | Vibration (FFT + enveloppe) | Température palier | 10 à 30 jours |
| Balourd / désalignement | Vibration (RMS, 1x / 2x) | Courant moteur | Semaines à mois |
| Défaut bobinage moteur | Courant (MCSA) | Température carcasse | Semaines |
| Manque de lubrification | Ultrasons (40 kHz) | Température + vibration HF | Jours à semaines |
| Cavitation pompe | Vibration + courant | Pression diff. (amont/aval) | Heures à jours |
| Usure engrenage lent | Analyse d'huile | Vibration (bandes latérales) | Mois |
Fréquence d'échantillonnage : le bon compromis selon le cas d'usage
C'est un point souvent mal calibré en pratique. Echantillonner trop bas, on rate les fréquences de défaut. Trop haut, on génère des volumes de données ingérables sur des mois ou des années.
Pour la vibration sur machines tournantes
Le théorème de Shannon impose d'échantillonner à au moins deux fois la fréquence maximale que l'on veut analyser. Pour détecter les harmoniques de défaut roulement sur un moteur tournant à 1 500 tr/min, les fréquences d'intérêt montent jusqu'à 5 à 10 kHz. En pratique, les recommandations de terrain convergent vers :
- 1,6 à 6,4 kHz : noeud IoT autonome sur batterie, collecte par rafales périodiques. Bon compromis pour les défauts de roulements standards.
- 25 kHz et plus : nécessaire pour les machines rapides (brochages, turbines) ou les défauts hautes fréquences (engrenages à 10 000+ dents/minute).
- 800 Hz : minimum absolu pour une analyse RMS globale - suffisant pour détecter un balourd ou un désalignement grossier, pas pour les défauts de roulement avancés.
Repere pratique
En collecte continue à 6,4 kHz sur un accéléromètre triaxial (16 bits), un seul capteur génère environ 230 Mo de données brutes par heure. A l'échelle de 20 capteurs et d'un an, c'est plus de 40 To. En pratique, on collecte des rafales de quelques secondes toutes les 5 à 30 minutes, ce qui ramène le volume à quelques dizaines de Go par an - gérable dans un data lake standard.
Pour la température et le courant
Ces grandeurs varient lentement (thermique) ou à la fréquence industrielle (50 Hz pour le courant). Une fréquence d'acquisition de 1 à 10 Hz suffit pour la température. Pour le MCSA, un échantillonnage à 10 kHz pendant quelques secondes (rafale) est nécessaire pour résoudre les harmoniques du courant statorique - mais on ne l'acquiert pas en continu.
Combien d'historique et de pannes run-to-failure faut-il
C'est la question que tout chef de projet se pose au démarrage, et la réponse honnête est : ça dépend du modèle cible. Voici la grille de lecture selon l'approche choisie.
Approche supervisée (classification / régression RUL)
Un modèle supervisé apprend à distinguer "état normal" de "défaillance imminente" sur la base d'exemples étiquetés. Pour que le modèle généralise, il faut observer suffisamment de pannes du même type sur des conditions comparables :
- Minimum absolu : 5 à 10 événements de panne par mode de défaillance cible. En dessous, le modèle sur-apprend les exemples disponibles sans généraliser.
- Niveau confortable : 20 à 30 pannes permettent de croiser validation et test sans vider le dataset d'entraînement.
- Historique temporel : 6 à 18 mois de données capteurs incluant ces pannes est le minimum courant. Plus l'historique est long (2 à 3 ans), plus le modèle est robuste aux variations saisonnières de charge ou de température ambiante.
Approche non supervisée (détection d'anomalies)
Quand l'historique de pannes est inexistant ou trop limité, la détection d'anomalies est la porte d'entrée réaliste. On entraîne le modèle uniquement sur des périodes de fonctionnement normal (pas besoin d'exemples de pannes) et on alerte sur tout écart statistiquement significatif par rapport à cette baseline.
Quelques semaines à quelques mois de données normales suffisent. Les algorithmes courants en 2026 : Isolation Forest, LSTM Autoencoder, One-Class SVM. Cette approche ne prédit pas un type de panne précis, mais elle détecte les dérives et aide à déclencher des inspections ciblées. C'est souvent le point de départ avant d'accumuler assez de pannes pour passer au supervisé.
Pour aller plus loin sur la prédiction de durée de vie résiduelle, notre article durée de vie résiduelle (RUL) en maintenance prédictive couvre les architectures modèles et les approches probabilistes.
Labelliser les défaillances : méthode concrète
C'est l'étape qui prend le plus de temps et qui conditionne la qualité du modèle. Un bon dataset de maintenance prédictive repose sur la synchronisation de deux sources : les données capteurs (continues) et les ordres de travail de la GMAO (ponctuels).
Construire le dataset run-to-failure
Pour chaque intervention corrective dans la GMAO, l'opération consiste à :
- Identifier l'horodatage de la panne (arrêt machine ou déclenchement d'alarme).
- Remonter dans les données capteurs sur la fenêtre précédant la panne (typiquement 24 à 72 heures).
- Labelliser cette fenêtre selon la criticité : "dégradation précoce", "dégradation avancée", "proche panne" - plutôt qu'un simple binaire qui efface l'information de progression.
- Qualifier la cause racine depuis le rapport du technicien : défaut roulement, balourd, problème électrique, manque de lubrification...
Le tout est condensé dans un fichier structuré (timestamp, valeurs capteurs, label, cause) qui forme le dataset d'entraînement. Cette synchronisation GMAO / capteurs est souvent manuelle les premiers mois, puis automatisable une fois les connexions API en place.
Pièges courants dans la labellisation
Plusieurs erreurs reviennent systématiquement sur le terrain :
- Labelliser uniquement l'heure exacte de la panne, au lieu de la fenêtre de dégradation. On obtient un dataset déséquilibré (1 occurrence de panne pour 10 000 d'état normal) qui rend l'entraînement difficile.
- Confondre maintenance préventive et corrective dans les ordres de travail GMAO. Seules les interventions correctives (panne réelle ou défaut confirmé) fournissent un signal de dégradation. Les remplacements préventifs planifiés brouillent le signal.
- Ignorer les faux positifs de l'historique. Si une alarme vibratoire a été déclenchée mais qu'il n'y avait pas de défaut (vibrations transitoires lors d'un démarrage, par exemple), ce label erroné dégrade le modèle.
Qualite des donnees
Selon plusieurs retours terrain, la qualité des données GMAO est souvent le vrai goulot d'étranglement : causes de panne absentes ou notées "divers", dates d'intervention imprécises, identifiants équipement inconsistants entre le logiciel de maintenance et l'historien. Avant d'installer un seul capteur supplémentaire, auditer la complétude des ordres de travail des 2 dernières années est l'investissement le plus rentable.
Intégration capteurs, automates et GMAO
Le pipeline de données d'un projet de maintenance prédictive comporte trois couches qu'il faut relier sans créer de silos.
Collecte : OPC-UA, MQTT et capteurs IoT
Deux sources d'alimentation coexistent sur un site industriel. Les automates (PLC) et systèmes SCADA exposent déjà des données process (pression, débit, température, état marche/arrêt) via le protocole OPC-UA (standard industriel ISO/IEC 62541) ou Modbus. Ces données sont souvent disponibles sans nouveau capteur - elles sont juste mal exploitées.
Les noeuds IoT industriels (capteurs sans fil WiFi ou LoRaWAN) s'ajoutent là où l'automate ne remonte rien : vibration de roulement, température de surface, émission acoustique. Les protocoles MQTT et AMQP sont les standards côté IoT, avec une passerelle (edge gateway) qui agrège les flux avant envoi vers le serveur.
Stockage : bases de données séries temporelles
Les données capteurs sont des séries temporelles - un timestamp plus une ou plusieurs valeurs numériques, à haute fréquence. Les bases relationnelles classiques (PostgreSQL, MySQL) ne sont pas optimisées pour ce cas d'usage. Les solutions courantes en 2026 :
- InfluxDB : open-source, très répandu pour les flux IoT, compression native des séries temporelles.
- TimescaleDB : extension PostgreSQL, intéressant si l'équipe maîtrise déjà SQL.
- PI System (OSIsoft/AVEVA) : standard dans les grandes industries (chimie, énergie), coûteux mais avec un historien robuste.
Interface GMAO : créer les ordres de travail automatiquement
L'objectif final est qu'une anomalie détectée par le modèle crée automatiquement un ordre de travail dans la GMAO (SAP PM, Infor EAM, Divalto, CARL...) avec le bon équipement, la priorité suggérée et les données d'alerte en pièce jointe. La plupart des GMAO modernes exposent une API REST pour ça. Le flux typique : alerte modele -> webhook -> API GMAO -> OT préventif avec fenetre d'intervention suggérée.
Pour le pilotage et le suivi des rapports de maintenance, notre article rapports de maintenance industrielle avec l'IA couvre la génération automatisée des comptes-rendus d'intervention.
Par où commencer concrètement : le PoC en 4 etapes
Un projet de maintenance prédictive qui démarre trop large finit en pilote éternel. La clé est de cadrer un PoC sur un périmètre restreint mais à fort impact visible.
Etape 1 - Identifier l'équipement critique et le mode de défaillance cible
Partir de la liste des pannes les plus coûteuses des 2 dernières années (arrêts de production, coûts de réparation, délais de réapprovisionnement). Sélectionner un ou deux équipements dont la défaillance a un impact mesurable et un mode de défaillance dominant connu - idéalement un défaut de roulement sur une machine tournante, car c'est le cas d'usage le plus documenté et le plus facile à instrumenter.
Etape 2 - Instrumenter et collecter 3 à 6 mois
Installer les capteurs (vibration triaxial + température) sur les paliers de roulement des équipements retenus. Connecter à un edge gateway. Stocker dans une base séries temporelles. Pendant cette phase, aucun modèle n'est nécessaire : on constitue l'historique. Si une panne survient pendant cette période, c'est une opportunité de labellisation à ne pas manquer - documenter précisément dans la GMAO.
Etape 3 - Croiser GMAO et capteurs pour constituer le dataset
Extraire les ordres de travail correctifs des 2 à 3 dernières années depuis la GMAO. Synchroniser avec les données capteurs (si elles existent pour les équipements ciblés). Labelliser les fenêtres de dégradation. Si l'historique de pannes est insuffisant, démarrer directement par un modèle de détection d'anomalies non supervisé sur les 3 à 6 mois collectés à l'étape 2.
Etape 4 - Entraîner, evaluer et connecter à la GMAO
Entraîner un premier modèle (Isolation Forest pour le non supervisé, ou XGBoost / Random Forest sur des features vibratoires extraites par FFT pour le supervisé). Evaluer sur une fenêtre de test hors entraînement. Brancher les alertes sur un canal de notification (email, SMS, OT GMAO). Suivre les vrais positifs / faux positifs pendant 4 à 8 semaines avant de décider d'élargir le périmètre.
Pour les aspects analyse vibratoire en détail (FFT, enveloppe, indicateurs RMS/kurtosis), notre article analyse vibratoire et IA pour la maintenance prédictive couvre les algorithmes et les outils.
Pour un panorama complet sur la maintenance prédictive IA en industrie PME/ETI, l'article maintenance prédictive IA en industrie pour les PME pose le cadre business et technique de référence.
Cadrage maintenance predictive
Quels capteurs sur quels equipements, quel modele pour votre historique disponible - on cadre votre PoC en 30 minutes.
En résumé : les données avant les algorithmes
Un projet de maintenance prédictive bien instrumenté avec des données médiocrement labellisées donnera de mauvais résultats. Un projet avec des données propres et un modèle simple donnera de bons résultats. L'investissement dans la qualité des données - calibration des capteurs, rigueur des comptes-rendus GMAO, synchronisation des sources - est toujours plus rentable que la recherche du meilleur algorithme.
Le trio vibration + température + courant couvre 70 à 80 % des modes de défaillance courants sur des machines tournantes. La détection d'anomalies non supervisée permet de démarrer sans historique de pannes. Et un PoC sur 2 équipements critiques avec un ROI mesurable en 6 mois est un point de départ bien plus solide qu'une plateforme déployée sur 50 machines sans cas d'usage validé.
Pour aller plus loin
- Maintenance prédictive IA en industrie pour les PME - cadre business, ROI et architectures.
- Données nécessaires pour un projet machine learning prédictif - guide générique sur la qualite et le volume de données ML.
- Analyse vibratoire et IA pour la maintenance prédictive - FFT, enveloppe, indicateurs RMS et kurtosis.
- Durée de vie résiduelle (RUL) en maintenance prédictive - prognostics, architectures LSTM et approches probabilistes.
- Algorithmes ML pour surveiller les séries de capteurs industriels - méthodes non supervisées et supervisées comparées.
- Détection d'anomalies et contrôle qualité par vision IA - complémentaire pour les lignes de production.
- Rapports de maintenance industrielle avec l'IA - générer automatiquement les comptes-rendus d'intervention.
- Notre offre IA prédictive sur mesure - du cadrage à la mise en production.
- ISO 13374 : surveillance et diagnostic des machines - norme de référence pour l'architecture des systèmes de maintenance prédictive.
- GEO : Generative Engine Optimization (arXiv 2311.09735) - étude de référence sur la citabilité du contenu par les moteurs IA.