Donner des documents de référence à ton IA

Introduction

Charger un fichier change la nature de la conversation : ton IA passe de l'opinion générale au travail sur ton vrai matériel. Tant que tu poses des questions en langage libre, tu obtiens des réponses générales.

Le moment où tu charges un rapport, un contrat ou un tableur, tout change. Voici comment exploiter à fond les fichiers de référence.

— 1 / 4Ce que change le chargement d'un fichier.

En chargeant un fichier, l'IA bascule dans un autre mode : au lieu de générer à partir de connaissances générales, elle se connecte à ton matériel précis. Elle cite, extrait, compare ce que contient réellement le document plutôt que d'inventer.

Trois conséquences pratiques en découlent. Les voici.

Le cœur du sujetappliquer & déployer

— 2 / 6Les limites par plateforme en avril 2026.

Chaque outil a ses propres bornes. Connaître ces limites évite les uploads ratés et permet de choisir la bonne plateforme selon le fichier. Voici la grille de référence en avril 2026.

Taille max par fichier

512 MB

30 MB

100 MB

Taille pratique fiable

~50 MB

~25 MB

~80 MB

Fichiers max par chat

5 (Free) / 20 (Pro)

Quota Free

3 / jour

5 / chat

10 / prompt

Quota Plus / Pro

80 / 3h

20 / chat

Élargi

Token limit / fichier

2 M tokens

1,2 M (Opus)

2 M+ tokens

Quelques remarques importantes. Sur ChatGPT, la limite théorique de 512 MB est rarement atteignable en pratique : au-delà de 50 MB, les uploads échouent fréquemment ou expirent. Garde tes fichiers sous les 20-30 MB pour la fiabilité.

Sur Claude, la limite à 30 MB paraît stricte mais le contexte large (1,2 M tokens sur Opus 4.7) permet de charger des documents très denses en texte sans problème. Pour 90 % des PDFs et docs professionnels, 30 MB est largement suffisant.

Sur Gemini, le contexte de 2 M+ tokens en fait l'outil de choix pour les très longs documents (rapports de plus de 200 pages, codes complets, livres entiers). Mais attention : le plan gratuit ne supporte ni les fichiers de code ni les tableurs — il faut Gemini Advanced ($19.99/mois) pour les débloquer.

— 3 / 6Les formats qui marchent et ceux qui posent problème.

Tous les formats ne sont pas traités de la même manière. Voici l'état des lieux pratique en avril 2026.

Les formats qui marchent bien partout

.pdf (textuel)

Format universellement supporté. Important : seulement si le PDF contient du texte sélectionnable. Un PDF scanné (image de pages) demande une étape OCR préalable que ChatGPT et Gemini font automatiquement, mais Claude pas systématiquement. Pour les PDFs scannés, préfère ChatGPT ou Gemini.

.docx, .doc (Word)

Lus correctement par les trois plateformes. Les éléments visuels (images insérées, tableaux complexes, mise en page) peuvent être perdus ou mal interprétés. Si la structure du document compte, copie-colle plutôt le texte directement dans le prompt.

.txt, .md (texte brut)

Format idéal. Aucune perte de mise en forme parasite, traitement le plus rapide, le plus fiable. Si tu peux convertir tes documents en texte brut avant l'upload, tu obtiens souvent de meilleurs résultats qu'avec le format d'origine.

.jpg, .png, .webp (images)

Les trois plateformes supportent l'analyse visuelle. ChatGPT et Gemini lisent les images avec une bonne fiabilité. Claude Opus 4.7 a fait un saut majeur sur l'analyse d'images en avril 2026 (résolution passée de 1,15 à 3,75 mégapixels). Excellent pour analyser des captures d'écran, des graphiques, des photos de documents.

Les formats qui demandent un plan payant

.xlsx, .csv (tableurs)

Supportés par ChatGPT (Free et payant), Claude (tous plans), mais bloqués sur le plan gratuit de Gemini. Pour analyser des tableurs sur Gemini, il faut le plan Advanced. Pour de la vraie analyse de données chiffrées, ChatGPT Plus est le plus fiable grâce à son outil de Code Interpreter intégré.

.py, .js, .html, autres fichiers de code

Supportés par ChatGPT et Claude sur tous plans. Bloqués sur le plan gratuit de Gemini. Pour le code, Claude Pro est le choix de référence (meilleur sur SWE-bench Pro, voir l'article 3.1).

Les formats spécialisés

.mp3, .mp4, fichiers audio/vidéo

Gemini est le seul à supporter nativement l'audio et la vidéo (jusqu'à 5 min en gratuit, 1h en Advanced). ChatGPT et Claude ne traitent pas directement ces formats — il faut passer par une transcription préalable. Si tu travailles régulièrement avec de l'audio ou de la vidéo, Gemini est le choix par défaut.

Les formats qui posent problème

PDFs scannés ou protégés

PDF protégés par mot de passe : aucune des plateformes ne peut les lire — tu dois retirer la protection avant l'upload. PDFs scannés (image-only) : ChatGPT et Gemini font automatiquement l'OCR (reconnaissance de caractères), Claude pas toujours fiable. Solution : convertir le PDF scanné en texte via un OCR externe avant l'upload.

Dossiers complets

Aucune plateforme ne supporte l'upload de dossiers. Tu dois sélectionner les fichiers individuellement. Pour traiter un projet entier (codebase, archive de documents), tu dois soit zipper le tout (ChatGPT le décompresse en mode Code Interpreter), soit fusionner les fichiers en un seul document avant l'upload.

— 4 / 6Comment l'IA lit vraiment ton fichier.

Comprendre comment l'IA traite réellement un fichier change la façon dont tu vas formuler ton prompt et structurer ton fichier source. Deux mécanismes coexistent en 2026.

Mécanisme 1 : extraction de texte

C'est le mode standard pour les PDFs textuels, docs Word et fichiers texte. L'IA lance un parser qui extrait tout le texte du document, puis le traite comme du texte brut intégré à ton prompt. La mise en page d'origine est largement perdue — l'IA voit une longue suite de paragraphes, sans nécessairement savoir ce qui était en gras, en italique, en colonne, ou dans un tableau.

Conséquence pratique : si la structure visuelle du document compte (un tableau de comparaison, une mise en page complexe), l'extraction texte simple peut perdre l'information. Pour ces cas, préfère uploader une image du document plutôt que le PDF.

Mécanisme 2 : analyse visuelle

Pour les images uploadées (et les PDFs scannés sur ChatGPT/Gemini), l'IA utilise un modèle de vision. Elle voit l'image comme une image, comprend la disposition spatiale, lit les graphiques, repère les annotations manuscrites. C'est plus puissant que l'extraction texte pour les documents visuellement structurés.

L'analyse visuelle est aussi plus coûteuse en tokens et plus lente. À utiliser quand la mise en forme compte vraiment (graphiques à interpréter, schémas, captures d'écran de logiciels). Pour le texte pur, l'extraction est plus efficace.

L'astuce des utilisateurs avancés

Si tu uploads un fichier complexe et que l'IA semble mal le comprendre, fais une capture d'écran des pages importantes et upload l'image en plus du document. L'IA combine les deux modes (texte + vision) et la qualité de compréhension monte d'un cran.

— 5 / 6Les 4 pièges classiques.

Piège 1 : l'illusion de la lecture complète

Tu uploads un rapport de 80 pages. L'IA te répond comme si elle l'avait entièrement lu. En réalité, elle peut avoir tronqué silencieusement au-delà de sa fenêtre de contexte ou de la limite tokens de la plateforme. Tu obtiens une réponse fluide qui rate les éléments des dernières pages.

Le test : pose une question précise sur une information située en fin de document (un chiffre, un nom, une conclusion). Si l'IA bloque ou invente, c'est qu'il y a eu troncature. Sur les très longs documents, préfère Gemini 3.1 Pro (2M+ tokens) qui digère vraiment l'ensemble, ou découpe ton document en sections traitées séparément.

Piège 2 : le mélange de plusieurs fichiers sans structure

Tu charges 5 PDFs en une fois et tu poses une question générale. L'IA mélange les sources, attribue mal les informations, ou répond uniquement sur le premier fichier en oubliant les autres. C'est mécanique : sans structure explicite, l'IA ne sait pas quoi prioriser.

Solution : nomme tes fichiers explicitement dans le prompt. « Compare les arguments du fichier "Rapport_2025.pdf" et du fichier "Rapport_2026.pdf" sur le sujet X ». Combine avec les balises XML pour les prompts longs : <document_1> ... </document_1>, etc.

Piège 3 : la confusion entre fichier et contexte permanent

Tu uploads un document dans une conversation, l'IA le lit, te répond. Tu ouvres une nouvelle conversation : le fichier n'existe plus. L'IA n'a aucun souvenir de son contenu. Beaucoup d'utilisateurs s'étonnent de devoir re-uploader systématiquement les mêmes documents.

Pour les fichiers de référence permanents (charte graphique, base de connaissances, documentation produit), utilise les Projects (ChatGPT/Claude) ou les Gems (Gemini) qui maintiennent les fichiers en mémoire entre conversations. Sujet traité dans l'article 3.6 de cette rubrique.

Piège 4 : la donnée sensible uploadée sans précaution

Tu uploads un contrat client, un document RH, une base clients pour analyse. Sur les plans grand public, ces données peuvent être utilisées pour entraîner les futures versions du modèle, sauf si tu désactives explicitement cette option. Sur les plans Enterprise, ce n'est jamais le cas par défaut.

Avant chaque upload sensible : (1) vérifie ton paramètre « utiliser mes données pour l'entraînement » dans les settings, (2) anonymise les noms et données identifiantes quand tu peux, (3) considère un compte Enterprise pour les données vraiment confidentielles. Voir l'article sur la confidentialité pour le détail.

Conclusion

— 6 / 6Les 4 bonnes pratiques à appliquer.

— PRATIQUE 1

Prépare ton fichier avant l'upload

Avant d'uploader, regarde ton fichier comme l'IA va le voir. Supprime les éléments parasites : en-têtes répétitifs, pieds de page, tables des matières si elles ne servent pas, sections inutiles. Renomme le fichier de manière descriptive (« contrat-client-X-v3.pdf » au lieu de « document.pdf »). Ces 2 minutes de préparation améliorent significativement la qualité de la réponse.

— PRATIQUE 2

Précise ton attente dans le prompt

Uploader sans contexte produit une réponse générique. Toujours dire à l'IA quoi faire avec le fichier, pas juste le lui donner. « Voici le rapport. Extrais les 3 chiffres-clés et explique-moi leur évolution. » est mille fois plus efficace que « Voici le rapport. ». Combine avec un prompt PTCF pour les demandes complexes.

— PRATIQUE 3

Découpe les très longs documents

Si ton document fait plus de 100 pages, ne compte pas sur l'IA pour tout traiter d'un coup, même sur les modèles à long contexte. Divise en sections logiques et traite-les séparément, en synthétisant à la fin. Cette discipline donne de bien meilleurs résultats qu'un upload monolithique. Exception : Gemini 3.1 Pro avec ses 2M+ tokens peut effectivement avaler des documents très longs en une seule passe.

— PRATIQUE 4

Vérifie avec une question test

Avant de te fier à une réponse basée sur un long fichier, pose une question dont tu connais déjà la réponse pour vérifier que l'IA a bien lu le document. Si elle se trompe sur ce que tu sais déjà, tu ne peux pas te fier à ses réponses sur ce que tu ne sais pas. Ce test prend 30 secondes et te protège des hallucinations basées sur des extractions ratées.

Ce que tu vas voir dans le prochain article

Tu sais maintenant choisir ton modèle, le configurer, et le nourrir avec les bons fichiers. Le prochain article aborde le Reasoning mode — Extended Thinking sur Claude, Thinking sur GPT-5.5, Deep Think sur Gemini. Quand vaut-il le coup d'attendre 30 secondes à 2 minutes pour une réponse plus poussée ? La grille des 5 cas où ça change tout, et des 10 cas où c'est de la perte de temps.

— L'essentiel à retenir —

5 points sur les fichiers de référence.

Charger un fichier change la nature de la conversation : moins d'hallucinations, accès à ton matériel précis, mais nouvelles questions de confidentialité.
Limites en avril 2026 : ChatGPT 512 MB max (50 MB fiable), Claude 30 MB, Gemini 100 MB et 2M+ tokens de contexte (le meilleur pour les longs documents).
Formats universels : PDF textuel, Word, texte brut, images. Bloqués sur Gemini Free : tableurs et code. Audio/vidéo : Gemini uniquement.
L'IA traite les fichiers en deux modes : extraction texte (rapide, perd la mise en page) ou analyse visuelle (plus coûteuse, garde la structure).
Toujours préciser ce que tu veux faire du fichier dans ton prompt. Tester avec une question dont tu connais déjà la réponse pour détecter les troncatures silencieuses.

— Article suivant

Le Reasoning mode : quand l'activer, quand l'éviter

→

— Retour à la rubrique

Bien configurer ton IA · Niveau II

→