Comment exploiter les conventions collectives avec Claude : la recette pas-à-pas avec PISTE
- Julien ASTRUC
- 18 mai
- 4 min de lecture
Pourquoi ce projet
Mon premier outil m'avait permis d'exploiter efficacement les accords collectifs d'entreprise (la base ACCO de data.gouv.fr — 268 000 textes au moment où j'écris). Demeurait l'autre partie du paysage conventionnel : les conventions collectives de branche.
Deux problèmes empêchent de simplement « demander à ChatGPT ou Claude » :
Les IA généralistes hallucinent. Elles « connaissent » les conventions collectives à grands traits, mais elles citent des numéros d'articles qui n'existent pas, des avenants abrogés, voire des jurisprudences inventées.
Légifrance bloque l'accès direct aux IA. Impossible de demander à un assistant d'aller vérifier directement sur le site.
Conclusion : pour utiliser l'IA proprement sur cette matière, il faut lui donner accès à la donnée brute, sous une forme contrôlable. Et il existe une voie d'accès officielle, gratuite et largement méconnue : PISTE.
La pièce manquante : PISTE
PISTE : « Plateforme d'Intermédiation des Services pour la Transformation de l'État » est la plateforme opérée par la DINUM qui distribue les API publiques de l'État.
Une API, c'est une « porte d'entrée » technique qui permet à un programme d'aller récupérer automatiquement des données dans une autre application, sans passer par le site web. Là où un humain ouvre Légifrance dans son navigateur, un programme branché sur l'API Légifrance reçoit le texte directement, sous forme exploitable.
L'API Légifrance est gratuite via PISTE. Elle donne accès, entre autres, à l'intégralité de la base KALI qui contient toutes les conventions collectives de branche, leurs annexes et leurs avenants.
Étape 1 : Créer son accès PISTE
Concrètement :
Aller sur piste.gouv.fr, créer un compte.
Dans l'espace personnel, créer une « application » (terme un peu pompeux, ça désigne simplement votre projet).
Souscrire à l'API Légifrance depuis le catalogue des API disponibles.
Récupérer les identifiants techniques générés (client_id / client_secret). Ce sont les clés qui permettront à votre programme de s'authentifier.
C'est tout. Pas de validation manuelle, pas de coût.
Étape 2 : Comprendre ce qu'on récupère : la base KALI
Petit détour utile, parce que comprendre la structure aide à demander la bonne chose à Claude ensuite.
KALI organise chaque convention collective sous trois niveaux d'identifiants :
KALICONT : la convention elle-même (ex. : convention collective de l'industrie nautique, IDCC 3236).
KALITEXT : un texte attaché — la convention de base et ses avenants, accords et adhésions successifs.
KALIARTI : un article individuel, avec son numéro, son état (en vigueur / abrogé), ses dates de début et de fin de vigueur.
Cette structure permet, à terme, des recherches très précises : « donne-moi tous les avenants salaires de cette convention, dans l'ordre chronologique » ou « retrouve la version en vigueur au 1er juin 2023 de l'article 37 ».
Étape 3 : Faire construire l'outil par Claude
C'est ici que la « magie de l'IA » opère. Je n'écris pas une ligne de code moi-même (j'en suis bien incapable en dépit de quelques vagues connaissances). J'explique à Claude ce que je veux, et Claude écrit le programme. Mon prompt initial, en substance :
« Tu vas construire pour moi un petit outil local qui : (1) se connecte à l'API Légifrance via PISTE avec mes identifiants OAuth, (2) télécharge l'intégralité des conventions collectives, de leurs avenants et de leurs articles, (3) stocke tout ça dans une base locale interrogeable, et (4) m'expose une recherche plein texte rapide. Tu choisis la stack la plus simple et tu m'expliques chaque étape. »
Claude a proposé :
Un script Python qui appelle l'API Légifrance et écrit dans une base SQLite locale.
Une indexation FTS5 (le module de recherche plein texte de SQLite) pour pouvoir interroger des centaines de milliers d'articles en quelques millisecondes.
Un schéma de tables aligné sur la structure KALI : conventions, textes, articles, avec leurs métadonnées (état, dates de vigueur, IDCC).
Le téléchargement complet a pris +/- 24h. Une fois fait, la base entière vit sur mon disque dur. Plus de risque de saturation côté serveur public.
Étape 4 : La fonction qui fait toute la différence : le vérificateur de citations
J'ai demandé à Claude d'ajouter une fonction très simple, mais que je n'ai vue dans aucun outil grand public : un vérificateur de citations. La fonction me répond trois choses :
Cet article existe-t-il ?
Est-il toujours en vigueur ?
Son contenu correspond-il bien à l'extrait que je cite ?
Étape 5 : Le brancher au quotidien : un connecteur (MCP)
Pour pouvoir interroger Claude depuis n'importe quelle conversation sur une question mettant aux prises avec les Conventions & Accords Collectifs de travail, j'ai demandé à Claude de transformer l'outil en serveur MCP (Model Context Protocol, le standard ouvert pour brancher des outils tiers sur les IA).
Une fois ce serveur lancé sur ma machine, Claude (dans son application de bureau) le voit comme un connecteur natif : il peut, dans n'importe quelle conversation, appeler mes fonctions de recherche, récupérer un article, ou vérifier une citation.
Concrètement, au quotidien, ça donne ça : je pose une question en langage naturel, Claude consulte mon index local en arrière-plan, et me rend une réponse structurée, sourcée, vérifiable. Sans que j'aie à ouvrir un seul onglet Légifrance.
Le résultat
« Quel est le salaire minimum d'un cadre au forfait dans l'industrie nautique ? »
Voici ce que Claude fait, en moins d'une minute :
Identifie la convention applicable : CCN de l'industrie et des services nautiques, IDCC 3236.
Repère l'article 37, qui prévoit qu'une convention de forfait jours ne peut être conclue qu'avec les cadres autonomes et que la rémunération forfaitaire ne peut être inférieure au minimum conventionnel majoré de 10 %.
Va chercher la grille des ingénieurs et cadres au 1er avril 2025 (issue du dernier avenant salaires en vigueur).
Applique la majoration de 10 % à chaque échelon et restitue le tableau.
Cite chaque source avec son lien Légifrance pour contrôle.
Vingt à trente minutes de recherche transformées en une « question parlée ».

Commentaires