La détection d'anomalies sur les données de vol par machine learning permet de repérer les opérations atypiques que les programmes FDM / FOQA classiques ratent : non pas les dépassements de seuils, mais les combinaisons inhabituelles de paramètres qui signalent un risque latent sans jamais franchir une limite réglementaire. C'est la différence entre un programme de sécurité réactif et un système capable de capturer les near-misses avant qu'ils deviennent des incidents.
Cet article couvre les fondamentaux du FDM / FOQA et leurs limites actuelles, puis détaille comment les algorithmes non supervisés sur séries temporelles multivariées transforment l'analyse des données de vol - avec les enjeux réels pour les compagnies aériennes et les MRO, et les contraintes d'interprétabilité qu'il faut anticiper avant de déployer.
Ce qu'est le FDM / FOQA et pourquoi c'est critique pour la sécurité aérienne
Le Flight Data Monitoring (FDM) et le Flight Operations Quality Assurance (FOQA) désignent la même pratique : enregistrer systématiquement les paramètres de vol et les analyser pour améliorer la sécurité opérationnelle. En Europe, l'EASA impose le FDM aux compagnies exploitant des avions commerciaux de grande capacité (règlement ORO.AOC.130). Aux États-Unis, le FOQA reste à ce jour volontaire pour la FAA, mais largement adopté par les grandes compagnies.
Un enregistreur de vol moderne capte entre 500 et 2 000 paramètres en temps réel, à des fréquences allant de 1 Hz à 8 Hz selon le capteur. Pour chaque vol, on obtient une série temporelle multivariée de plusieurs dizaines de milliers de points. Multiplié par les milliers de vols d'une flotte, le volume de données est considérable.
Les paramètres analysés en priorité :
- Vitesse air calibrée (CAS), altitude pression, taux de montée/descente
- Assiette : tangage (pitch), roulis (roll), lacet (yaw)
- Accélérations selon les trois axes (normale, latérale, longitudinale)
- Paramètres moteur : N1, N2, EGT (température des gaz d'échappement), débit carburant
- Position des surfaces de contrôle : volets, ailerons, gouverne de profondeur
- Paramètres d'approche : angle de descente, hauteur de décision, vitesse sol, vent de travers
Selon le rapport de sécurité IATA 2024, le taux d'accidents toutes causes s'établissait à 1,13 par million de vols, contre une moyenne quinquennale de 1,25. Une amélioration continue, largement attribuée à la généralisation des programmes FDM dans les compagnies membres de l'IOSA - dont le taux d'accidents était de 0,92, contre 1,70 pour les non-membres (IATA Safety Report 2025).
FDM vs FOQA vs FDA
Les trois termes couvrent le même concept avec des nuances géographiques. FDM (Flight Data Monitoring) est le terme européen EASA. FOQA (Flight Operations Quality Assurance) est le terme FAA. FDA (Flight Data Analysis) est parfois utilisé dans la littérature OACI. Dans cet article, les termes sont interchangeables.
Les limites de l'approche classique par exceedance
L'approche par seuils - ou exceedance detection - est le coeur des programmes FDM depuis leur création. Le principe est simple : on définit des valeurs limites pour des paramètres clés (vitesse max, taux de descente, angle de tangage, etc.), et tout vol qui franchit l'un de ces seuils génère une alerte.
C'est robuste, explicable, et conforme à ce que les autorités de sécurité comprennent. Mais les limites sont structurelles.
Ce que les seuils fixes ne voient pas
Un vol peut rester dans les limites réglementaires sur chaque paramètre individuellement, et pourtant être anormal. Imaginez une approche finale où la vitesse est dans les clous, la pente dans les clous, mais la combinaison vitesse basse + volets non sortis + vent de travers élevé + assiette inhabituelle constitue un profil de risque que personne n'a pensé à encoder dans un seuil.
C'est précisément la zone aveugle de l'exceedance. Les incidents d'approche instable non détectés, les dégradations progressives de procédure qui n'atteignent jamais un seuil individuel, les near-misses à paramètres "légalement corrects" - tout cela passe au travers.
Le problème des faux positifs et des seuils arbitraires
À l'inverse, les seuils génèrent aussi beaucoup de bruit. Un seuil de taux de descente calibré pour un Boeing 737 peut déclencher en permanence sur un ATR-72 qui a une trajectoire d'approche naturellement plus abrupte. Les équipes de sécurité passent un temps considérable à filtrer les alertes sans valeur.
Les seuils sont aussi figés dans le temps. Ils ne s'adaptent pas aux conditions (aéroport montagneux, conditions météo saisonnières, spécificité d'une route) ni à l'évolution des pratiques opérationnelles.
L'analyse mensuelle décalée des données
La plupart des programmes FDM fonctionnent sur un cycle mensuel : téléchargement des données en base, traitement, rapport. C'est un cycle hérité des contraintes techniques d'il y a vingt ans. Il signifie qu'un problème détecté en fin de mois a potentiellement généré des risques pendant quatre semaines sans être vu.
L'apport du ML : anomaly detection non supervisée sur séries temporelles de vol
Le machine learning non supervisé change la logique. Au lieu de définir a priori ce qui est anormal, on apprend ce qui est normal. Le modèle ingère des milliers de vols représentatifs (phase d'entraînement sur données "saines"), construit une représentation compacte du comportement nominal, puis signale les vols dont la structure s'écarte de ce profil appris.
Concrètement, cela permet de détecter des opérations atypiques que personne n'aurait pensé à encoder dans un seuil - et c'est précisément ce qui manquait à l'approche classique.
Autoencoders LSTM : reconstruire pour détecter
Les autoencoders à base de LSTM sont l'architecture la plus couramment appliquée aux données FDM. Le principe : un encoder compresse la séquence temporelle d'un vol en une représentation latente, un decoder la reconstruit. Entraîné sur des vols normaux, le modèle reconstruit bien les vols normaux et mal les vols atypiques. L'erreur de reconstruction devient le score d'anomalie.
L'avantage du LSTM sur ce type de données : il capture naturellement les dépendances temporelles longue portée (comment évolue la vitesse 30 secondes avant le toucher des roues, en relation avec la poussée et la position des volets). Une étude comparative publiée en juillet 2025 dans Aerospace (MDPI) confirme que le LSTM avec mécanisme d'attention offre des avantages notables sur les séries temporelles longues caractéristiques des données FDM (MDPI Aerospace, 2025).
Local Outlier Factor et méthodes basées sur la densité
Le Local Outlier Factor (LOF) évalue l'anomalie d'un vol en comparant la densité de son voisinage à celle de ses voisins dans l'espace des features. Un vol isolé dans une zone de faible densité est signalé comme outlier. L'avantage du LOF : il requiert peu de réglage d'hyperparamètres et produit moins de faux positifs que certaines méthodes profondes. Une étude comparative sur des données FDM réelles publiée en février 2025 dans Aerospace (MDPI) montre qu'une approche hybride LOF réduit significativement les faux positifs par rapport à l'état de l'art sur des jeux de données réels (MDPI Aerospace, février 2025).
SOM, Isolation Forest et clustering incrémental
Les Self-Organizing Maps (SOM) projettent les profils de vol sur une carte 2D en préservant la topologie. Les vols nominaux se regroupent en clusters denses et cohérents ; les vols atypiques tombent dans des zones peu peuplées ou à la frontière entre clusters. L'Isolation Forest isole les anomalies en construisant des arbres aléatoires : les points anormaux sont isolés plus vite (moins de coupures nécessaires). Pour les très larges flottes, des méthodes de clustering incrémental permettent de traiter les vols un à un sans recharger l'historique complet en mémoire.
| Algorithme | Avantages | Limites | Interprétabilité |
|---|---|---|---|
| Autoencoder LSTM | Capture les dépendances temporelles, score par point de la série | Boite noire, coût d'entraînement, sensible aux hyperparamètres | Faible sans post-processing (SHAP, attribution) |
| Local Outlier Factor | Peu de faux positifs, faible paramétrage, interprétable | Scalabilité sur très grandes flottes, travaille sur features agrégées | Bonne (distance aux voisins explicable) |
| Isolation Forest | Rapide, scalable, robuste aux outliers de bruit | Ne capture pas bien les anomalies de forme temporelle | Moyenne |
| Self-Organizing Map | Visualisation intuitive des clusters de vols | Perd l'information temporelle fine si mal configuré | Bonne (carte visuelle explorable) |
| VAE (autoencoder variationnel) | Modele la distribution des vols normaux, score probabiliste | Complexite d'implémentation, interprétabilité difficile | Faible |
Enjeux pour les compagnies aériennes et les MRO
L'analyse des données de vol ne concerne pas seulement les équipes sécurité des compagnies. Pour les MRO, le croisement des données FDM avec les données de maintenance ouvre la voie à des pratiques nouvelles.
Compagnies : de la conformité à la culture sécurité proactive
Dans la plupart des compagnies, le FDM est géré par le département sécurité comme un outil de conformité réglementaire. L'IA permet de changer de posture : on passe d'un système qui vérifie a posteriori si des règles ont été enfreintes à un système qui détecte en continu les opérations inhabituelles.
Cela change aussi le rapport avec les équipages. Plutôt que de signaler uniquement les écarts réglementaires (ce qui crée naturellement une posture défensive), on peut identifier des patterns atypiques sans jugement individuel, les anonymiser, et les utiliser comme base de formation ciblée. La différence entre "tu as dépassé un seuil" et "sur cette route en conditions hivernales, voici comment les 5 % de vols les plus atypiques se comportent".
MRO : maintenance basée sur l'usage réel
C'est peut-être le cas d'usage le plus concret pour un MRO. Un vol dur (hard landing) détecté par les accéléromètres peut déclencher une inspection structurale ciblée avant le prochain vol. Une dégradation progressive du profil de poussée sur une série de vols peut signaler une dégradation moteur avant qu'elle devienne un problème opérationnel.
On parle de usage-based maintenance : la maintenance planifiée selon des cycles calendaires ou horaires est complétée par des alertes basées sur l'usage réel de l'appareil, détectées dans les données de vol. Pour un MRO qui gère plusieurs dizaines d'avions d'une même flotte, la capacité à corréler les anomalies FDM avec les événements de maintenance ouvre des perspectives réelles sur la durée de vie des composants. Cette approche est complémentaire de l'l'analyse vibratoire appliquée à la maintenance, qui exploite les spectres fréquentiels issus des capteurs embarqués pour détecter en amont les défauts de roulements et de turbines.
Notre article sur l'IA en MRO et maintenance aéronautique détaille les cas d'usage opérationnels les plus matures dans l'écosystème toulousain.
Sous-traitants et petites compagnies : le problème du volume de données
L'anomaly detection non supervisée requiert un historique de vols "normaux" suffisant pour que le modèle apprenne une représentation fiable du comportement nominal. Pour les petites compagnies ou les opérateurs de flottes réduites, le volume de données disponibles est souvent insuffisant pour entraîner un modèle robuste. Les solutions possibles : partage de données anonymisées entre opérateurs du même type d'appareil, recours à des modèles pré-entraînés sur des jeux de données publics (ASIAS, NASA Aviation Safety Reporting System), ou adaptation de modèles existants par transfer learning.
Mise en oeuvre et limites à anticiper
Avant de déployer un système d'anomaly detection sur des données FDM, plusieurs enjeux concrets doivent être anticipés.
Interprétabilité : le blocage principal
Un analyste sécurité qui reçoit une alerte "ce vol est anormal" sans explication ne peut pas agir dessus. L'interprétabilité n'est pas un nice-to-have : c'est une condition opérationnelle. Sur des séries temporelles, les méthodes d'attribution (SHAP time-series, gradient-based attribution) permettent d'identifier quels paramètres, à quels instants, ont le plus contribué à l'anomalie. Mais ces méthodes ajoutent de la complexité et doivent être intégrées dès la conception, pas en post-production.
C'est l'un des arguments pour des approches comme le LOF ou les SOM en première instance : leur interprétabilité native réduit la friction à l'adoption par les équipes sécurité. Un modèle profond peut être utilisé en deuxième niveau, sur les cas que le premier niveau a remonté.
Architecture recommandée
Une architecture en deux niveaux fonctionne bien en pratique : un premier filtre rapide et interprétable (LOF, Isolation Forest) trie les vols à regarder de plus près, un second niveau profond (LSTM autoencoder) fournit un score granulaire par instant du vol et des attributions par paramètre. L'analyste n'intervient qu'au second niveau.
Sécurité et certification : le bon périmètre
La détection d'anomalies FDM opère dans le cadre du Safety Management System, pas dans la boucle de commande de vol. Elle n'est donc pas soumise aux niveaux de certification avionique DO-178C ou ED-12C. C'est un avantage : les contraintes de validation sont proches de celles de n'importe quel outil d'aide à la décision opérationnelle.
En revanche, la robustesse du modèle doit être documentée rigoureusement : taux de faux positifs, taux de faux négatifs sur un ensemble de validation labellisé (incidents connus), stabilité dans le temps (le modèle doit être ré-entraîné quand la flotte ou les procédures changent). Un plan de MLOps adapté au contexte réglementaire de l'aviation est non négociable.
Qualité des données : le vrai premier chantier
Les données FDM brutes ne sont pas directement exploitables pour du ML. Les problèmes récurrents : valeurs manquantes sur certains capteurs, décalages temporels entre enregistreurs, hétérogénéité des formats entre types d'appareils et sous-versions. Avant toute modélisation, un travail de normalisation, d'alignement temporel et de gestion des valeurs aberrantes est indispensable. C'est souvent 50 à 70 % du projet.
Les approches abordées ici partagent les mêmes défis de données avec d'autres applications ML industrielles. Notre article sur la détection d'anomalies sur séries temporelles de capteurs couvre les méthodes génériques applicables à ce pré-traitement.
Anomaly detection sur vos données de vol
Vous exploitez des données FDM / FOQA et voulez aller au-dela des seuils classiques ? Discutons des méthodes adaptées à votre flotte et vos contraintes.
Pour aller plus loin
- IA en MRO et maintenance aéronautique Toulouse - cas d'usage opérationnels et maturité de l'écosystème.
- Détection d'anomalies sur séries temporelles de capteurs par IA - méthodes génériques et pré-traitement des données.
- Maintenance prédictive par IA en industrie - contexte, modèles et ROI pour une PME industrielle.
- passer de la détection d'anomalie à la prédiction de durée de vie résiduelle - estimer la durée de vie résiduelle des composants à partir des données.
- IA et contrôle qualité vision en aéronautique - détection de défauts par vision artificielle dans la chaine de production.
- Données nécessaires pour un projet ML prédictif - volume, qualité et format des données avant de démarrer.
- Détection de fraude et anomalies par machine learning - algorithmes non supervisés appliqués à d'autres domaines.
- Notre service IA prédictive et détection d'anomalies - comment Tensoria accompagne les projets ML sur données industrielles.
- Étude comparative ML non supervisé sur données FDM réelles - MDPI Aerospace, février 2025.
- IATA Safety Report 2025 - statistiques de sécurité aérienne mondiales.