Au-delà de 200 mots, ton prompt cesse d'être lu comme une instruction. Il devient un blob.
Si tu as déjà écrit un prompt long — avec du contexte, des instructions, un document à analyser, et peut-être des exemples du résultat attendu — tu as probablement constaté que l'IA mélange les sections. Elle traite ton document comme une instruction, ou tes instructions comme du contexte. Le résultat est confus, alors même que ton prompt était bien construit.
La solution est étonnamment simple : encadrer chaque section avec des balises XML. Ce sont les mêmes balises que celles utilisées pour le HTML — <balise>contenu</balise>. Elles n'ont aucune fonction technique active dans ton prompt, mais elles servent de séparateurs visuels que l'IA reconnaît comme des frontières fortes entre les sections.
Cette technique est devenue standard en 2026, particulièrement sur Claude où elle est officiellement recommandée par Anthropic. Cet article te donne les six balises essentielles, le template à recopier, le cas d'usage type, et les pièges à éviter.
— 1 / 5Pourquoi les prompts longs deviennent confus.
Sur un prompt court (50-150 mots), l'IA n'a pas de difficulté à comprendre la structure. Le persona est au début, la tâche au milieu, le format à la fin. Le découpage est implicite et marche très bien.
Au-delà de 200 mots, et surtout quand tu intègres des éléments très différents dans le même prompt (ton instruction + un long document + des exemples + des contraintes), l'IA perd la frontière entre ces éléments. Elle peut interpréter une partie de ton document source comme une instruction. Elle peut prendre tes exemples pour des consignes. Elle peut traiter ton contexte comme la tâche elle-même.
Le test typique : tu mets un long extrait de texte à analyser dans ton prompt. L'IA te répond comme si l'extrait était la question. Tu te demandes pourquoi elle n'a pas compris. Réponse : elle n'a pas vu où ton instruction se terminait et où le document commençait. Avec des balises XML, ce problème disparaît.
Les balises XML ne sont pas du jargon technique. Ce sont des bornes pour ton prompt.
— 2 / 5Pourquoi les balises XML marchent si bien.
Les modèles de langage 2026 (Claude Opus 4.7, GPT-5.5, Gemini 3.1 Pro) ont été massivement entraînés sur du contenu web — donc sur du HTML et du XML. Ils reconnaissent immédiatement les balises comme des structures sémantiques. Une balise <document> déclenche dans le modèle l'interprétation « ce qui suit est un document à traiter, pas une instruction ».
Cette reconnaissance n'est pas de la magie — c'est statistique. Dans les milliards de pages vues à l'entraînement, les balises XML ont quasi toujours servi à délimiter du contenu structuré. Le modèle a intégré ce pattern. Quand tu utilises des balises dans ton prompt, tu actives ce comportement appris.
Anthropic recommande explicitement cette technique pour Claude depuis Claude 3 (2024). En 2026, elle marche aussi très bien sur GPT-5.5 et Gemini 3.1 Pro, même si ces modèles ne la documentent pas aussi fortement. C'est devenu une convention universelle du prompt engineering avancé.
— 3 / 5Les 6 balises essentielles.
Tu n'as pas besoin de connaître des dizaines de balises. Six suffisent pour 95 % des cas. Voici la liste minimale à mémoriser. Tu peux inventer tes propres balises pour des besoins spécifiques — le modèle s'adapte — mais ces six couvrent la majorité des situations.
— 4 / 5Avant / après : la transformation.
Voici un cas concret. Tu veux faire analyser un long extrait de transcription de réunion par l'IA, en lui demandant de produire un compte-rendu structuré selon ton format préféré.
Le prompt « avant » est lisible mais l'IA peut confondre la transcription avec une instruction. Tu peux obtenir une réponse qui prend les paroles de Marie et Tom comme des consignes à respecter, ou un compte-rendu qui rate la moitié des décisions parce que l'IA n'a pas su distinguer le bruit de la réunion du vrai contenu.
Le prompt « après » a la même information. Mais grâce aux 4 balises (contexte, document, instructions, contraintes), l'IA comprend immédiatement la structure. Elle traite le contexte comme contexte, le document comme document, et les instructions comme instructions. Le compte-rendu produit est nettement plus précis et mieux calibré.
Le coût ? 8 lignes supplémentaires. Le bénéfice : une réponse fiable au lieu d'une réponse aléatoire. Le ratio est imbattable.
Les balises XML se combinent parfaitement avec le framework RISEN et le Few-Shot Prompting. Tu peux mettre tes exemples Few-Shot dans <exemples>, ta mission RISEN dans <instructions>, ton contexte dans <contexte>. C'est la structure native des prompts professionnels en 2026.
— 5 / 5Les 3 pièges à éviter.
Piège 1 : utiliser les balises sur tous tes prompts
Pour un prompt court (sous 150 mots), les balises XML ne servent à rien. Tu alourdis ton prompt sans gagner en précision. Garde les balises pour les prompts longs ou complexes — typiquement, dès que tu mélanges plusieurs types de contenu (instructions + document + exemples).
La règle pratique : si tu peux lire ton prompt d'un coup d'œil et savoir où chaque section commence et finit, tu n'as pas besoin de balises. Si ton œil hésite à la lecture, l'œil de l'IA hésite aussi.
Piège 2 : multiplier les balises imbriquées
L'IA gère parfaitement 4-6 balises au même niveau. Elle gère mal les balises imbriquées sur 3+ niveaux. « <instructions> <etape> <sous-etape> <detail> », c'est trop. À ce niveau de profondeur, l'IA perd la trace de la structure et peut traiter une sous-balise comme une balise principale.
Reste sur 1 niveau de balises au maximum, avec éventuellement une seule sous-balise pour les structures simples. Si ta hiérarchie est complexe, c'est que ton prompt l'est aussi — découpe-le en plusieurs prompts successifs au lieu de tout caser.
Piège 3 : utiliser des noms de balises ambigus
Si tu utilises <texte> pour le document à traiter et <texte> aussi pour les exemples, tu crées de la confusion. Choisis des noms distincts et descriptifs : <document_source>, <exemples_format>, <contraintes_finales>. Plus le nom est explicite, mieux l'IA comprend la fonction de la balise.
Note : les noms de balises peuvent être en français ou en anglais. Le modèle s'adapte. Le critère est la clarté, pas la langue.
9 articles plus tard, tu maîtrises tout l'arsenal du prompt engineering 2026 : RISEN et CRISPE pour les missions complexes, Chain of Thought pour le raisonnement, Few-Shot pour le format, Ask Me Questions First pour le diagnostic, instructions négatives pour les contraintes, Perspective Shifting pour les angles, méta-prompting pour la formulation, et maintenant les balises XML pour la structure des prompts longs. La prochaine rubrique passe à un autre niveau : Bien configurer ton IA — Memory, Custom Instructions, Projects, choix du modèle, fichiers de référence.
5 points sur les balises XML.
- Au-delà de 200 mots, l'IA mélange les sections de ton prompt. Les balises XML servent de bornes.
- Ce ne sont pas du jargon technique. Ce sont des marqueurs <mot>...</mot> que l'IA reconnaît comme des frontières fortes.
- 6 balises suffisent : <contexte>, <instructions>, <document>, <exemples>, <contraintes>, <reflexion>.
- Les balises se combinent avec RISEN, Few-Shot et Chain of Thought. C'est la structure native des prompts professionnels en 2026.
- 3 pièges à éviter : utiliser les balises sur tous les prompts (inutile sous 150 mots), multiplier les niveaux (max 1-2), choisir des noms ambigus.