L'IA peut-elle lire un CCTP scanné ?

Oui, mais la qualité dépend du scan, de l'OCR et de la mise en page. Un texte extrait doit être rapproché de la page originale ; aucune précision universelle ne peut être promise sans test.

L'IA peut-elle remplir une DPGF automatiquement ?

Elle peut extraire ou rapprocher des lignes, mais unités, quantités, formules, prix et périmètre doivent être contrôlés. La feuille de calcul d'origine reste la référence.

L'IA sait-elle réaliser un métré depuis des plans PDF ?

Pas avec une fiabilité suffisante pour engager un prix. Elle peut aider à repérer des zones, légendes ou annotations sur un plan lisible, mais le métré doit rester effectué ou vérifié dans un outil métier.

Comment tester un extracteur de DCE ?

Constituez un jeu de dossiers représentatifs et mesurez séparément le rappel des champs attendus, l'exactitude, les faux rapprochements, la citation des pages et le temps de validation humaine.

Quel modèle choisir pour analyser un DCE ?

Choisissez selon la qualité obtenue sur vos documents, la sortie structurée, les citations, la confidentialité, le coût et la stabilité de l'API. Le prétraitement documentaire et le protocole de contrôle comptent souvent plus que le nom du modèle.

IA pour dépouiller un DCE : CCTP, DPGF et limites des plans

« Extraire un DCE avec l'IA » recouvre des tâches très différentes. Retrouver une date dans un règlement de consultation, reprendre les lignes d'une DPGF et compter des équipements sur un plan n'ont ni la même difficulté ni le même risque.

La démarche pragmatique consiste à séparer les documents, définir les champs attendus et mesurer les erreurs. Le but n'est pas de supprimer le dépouillement humain, mais de concentrer la lecture sur les points ambigus et contractuels.

Guide pilier

Cet article fait partie de notre Guide IA pour bureaux d'études, qui regroupe l'ensemble de nos ressources sur le sujet.

Points clés à retenir

Un PDF texte, un tableau et un plan ne sont pas le même problème. Ils exigent des chaînes de traitement et des contrôles différents.
Une extraction utile cite la pièce et la page. Sans source, le contrôleur doit recommencer la lecture.
Les plans servent au repérage assisté, pas au métré autonome.
La performance se mesure par champ sur un jeu de DCE représentatif.

La matrice de faisabilité par type de document

Document	Usage réaliste	Contrôle indispensable
PDF texte natif	Dates, critères, prescriptions, livrables, clauses et citations.	Exhaustivité et sens de la clause dans son contexte.
Scan OCR	Mêmes champs après reconnaissance du texte.	Pages floues, orientation, caractères et tableaux.
DPGF/BPU Excel	Classification, rapprochement de libellés, signalement d'écarts.	Structure, unités, quantités, formules et prix.
DPGF en PDF	Reconstitution indicative de lignes et colonnes.	Cellules fusionnées, sauts de page et décalages de lignes.
Plan PDF	Repérage d'une légende, d'une annotation ou d'une zone visible.	Échelle, exhaustivité, superpositions et cohérence entre plans.
DWG/IFC	Extraction via un logiciel ou une API spécialisée avant analyse textuelle.	Géométrie et propriétés dans l'outil métier source.

Étape 1 : préparer les documents

Le pipeline doit détecter les PDF natifs, les scans, les tableurs et les plans. Les pages doivent être dans le bon sens et suffisamment nettes. Google indique que ses modèles peuvent traiter texte, tableaux, diagrammes et images dans les PDF, mais recommande d'éviter les pages floues ou mal orientées. Les grandes pages sont aussi redimensionnées pendant le traitement. Voir la documentation officielle Gemini.

Ces capacités multimodales sont utiles, mais ne créent pas une garantie métier. Un cartouche minuscule ou un réseau dense peut devenir illisible après redimensionnement.

Étape 2 : extraire dans un schéma fermé

Une consigne « résume ce DCE » donne un texte difficile à contrôler. Préférez un tableau imposé :

champ recherché ;
valeur extraite ;
citation exacte courte ;
nom du fichier et page ;
statut : trouvé, ambigu ou absent ;
commentaire du valideur.

Demander « absent » plutôt qu'une réponse probable réduit les inventions. Pour les informations contractuelles, la citation doit être vérifiée dans le PDF rendu, pas uniquement dans le texte OCR.

Étape 3 : traiter la DPGF comme une donnée, pas comme du texte

Si le fichier Excel est fourni, conservez-le. L'objectif est de lire ses cellules et formules sans reconstruire inutilement le tableau depuis un PDF. L'IA peut proposer une catégorie, rapprocher un poste d'une bibliothèque ou signaler qu'une prescription du CCTP semble sans ligne correspondante.

Règle de contrôle

Aucun prix, taux, quantité, unité ou formule ne doit être remplacé silencieusement. Toute modification doit être visible et réversible.

Pourquoi les plans restent le cas difficile

Un plan combine géométrie, échelle, couches, symboles, renvois, détails et informations réparties entre plusieurs feuilles. Une vision correcte d'une page ne garantit pas que tous les éléments ont été vus ni que deux symboles très proches ont été distingués.

Les usages raisonnables sont : retrouver une annotation, dresser une liste de zones à contrôler, lire un cartouche suffisamment net ou comparer une légende à un CCTP. Compter des équipements, mesurer une longueur ou produire un métré engageant exige un outil métier et une vérification complète.

Comparer CCTP et DPGF sans surpromettre

Le système peut générer une liste d'écarts potentiels : prestation citée dans le CCTP mais non retrouvée dans la DPGF, unité inhabituelle, libellé divergent ou marque imposée. Le terme important est « potentiel » : les prestations peuvent être regroupées, implicites ou décrites dans une autre pièce.

Chaque alerte doit donc inclure les deux extraits sources et être qualifiée par le chargé d'affaires : écart confirmé, faux positif, question à poser ou point intégré ailleurs.

Le protocole de benchmark

Échantillonner. Dossiers simples, complexes, scans, tableaux et plans de qualité variable.
Établir une vérité terrain. Un expert renseigne les champs attendus et leurs pages.
Mesurer le rappel. Quelle part des informations attendues a été retrouvée ?
Mesurer l'exactitude. Quelle part des valeurs produites est correcte ?
Compter les faux rapprochements. Ils sont particulièrement coûteux sur les DPGF.
Chronométrer la validation. Le gain net inclut le temps de correction.

Ne mélangez pas ces résultats dans un taux de « précision » unique. Un système peut être bon sur les dates et mauvais sur les tableaux ; cette distinction détermine ce qui peut réellement passer en production.

Architecture cible : garder un chemin de preuve

Une chaîne robuste combine stockage sécurisé, classification, OCR si nécessaire, extraction structurée, règles déterministes, modèle de langage et interface de validation. Les résultats validés peuvent ensuite alimenter le mémoire ou le logiciel de chiffrage, sans écraser les sources.

Si les DCE sont sensibles, vérifiez le contrat, la rétention, les accès et la localisation de chaque composant. La politique professionnelle du fournisseur ne couvre pas automatiquement un connecteur tiers ou un OCR ajouté au pipeline.

Pilote de dépouillement

Testez dix champs sur trois DCE

Tensoria peut construire la vérité terrain, mesurer omissions et faux rapprochements, puis chiffrer le temps de validation. Vous saurez précisément quelles tâches sont automatisables et lesquelles doivent rester manuelles.

Cadrer le benchmark

Articles liés

Vous voulez appliquer ça dans votre entreprise ?

En quelques minutes, identifiez les cas d'usage IA les plus rentables pour votre métier. Sans engagement, et sans jargon.

IA pour dépouiller un DCE : CCTP, DPGF et limites des plans

La matrice de faisabilité par type de document

Étape 1 : préparer les documents

Étape 2 : extraire dans un schéma fermé

Étape 3 : traiter la DPGF comme une donnée, pas comme du texte

Pourquoi les plans restent le cas difficile

Comparer CCTP et DPGF sans surpromettre

Le protocole de benchmark

Architecture cible : garder un chemin de preuve

Testez dix champs sur trois DCE

Articles liés

Vous voulez appliquer ça dans votre entreprise ?

Articles liés

RAG sur CCTP et DPGF : architecture pour les BET

Logiciel avant-métré IA 2026 : comparatif BTP/BET

Étude de prix BTP automatisée par IA, 4 méthodes 2026

IA à Colomiers : bureaux d'études et PME industrielles

IA et calcul thermique RE2020, bureaux d'études

IA pour le BET Fluides : ce qu'elle apporte en CVC