Claude Computer Use en 2026 : Claude pilote ton ordinateur

En octobre 2024, Anthropic a publié quelque chose d'inhabituel : un modèle qui ne se contentait pas de répondre à tes prompts, mais qui pouvait voir ton écran et cliquer dessus. Claude 3.5 Sonnet est devenu le premier modèle frontier à proposer du computer use en public beta. 18 mois plus tard, en avril 2026, cette capacité a quitté le laboratoire pour s'installer dans le quotidien des utilisateurs Pro et Max.

Le 23 mars 2026, Anthropic a lancé Claude Computer Use Agent en research preview pour les abonnés Pro et Max via Claude Cowork et Claude Code. Le score sur OSWorld (benchmark de référence pour le pilotage d'ordinateur) est passé de moins de 15 % en 2024 à 72,5 % en 2026 avec Claude Opus 4.5 puis 4.6. Le modèle Opus 4.7 (sorti en avril 2026, le plus récent) tient cette barre tout en améliorant le coding et le raisonnement. Les chercheurs en agentique parlent d'un « breakthrough » — pas en marketing, dans les benchmarks.

L'approche Anthropic est structurellement différente de ChatGPT Agent (cf article 3.2). ChatGPT Agent navigue sur le web et utilise des connecteurs SaaS. Claude Computer Use pilote ton ordinateur entier : applications natives, fichiers locaux, terminaux, IDE. Il prend une capture d'écran, raisonne sur ce qu'il voit, choisit où cliquer, exécute. Cette différence d'approche détermine pour quels cas chaque outil brille — et pour quels cas il échoue.

Cet article te donne (1) pourquoi computer use est différent et la généalogie technique 2024-2026, (2) comment ça marche concrètement avec le permission-first design d'Anthropic, (3) les cas d'usage qui marchent en 2026 (et qui ne marchent pas), (4) limites et précautions incluant la décision controversée d'Anthropic du 4 avril 2026 de bannir les agents tiers. Plus 5 pièges. Pré-requis : article fondation 3.1 et article 3.2 sur ChatGPT Agent.

— Sources : Anthropic · Tech Insider · SiliconANGLE · NxCode · 2024-2026

72,5 % · sur OSWorld

Score Claude Opus 4.5/4.6 sur le benchmark OSWorld (mesure de la capacité à contrôler un desktop). Évolution de moins de 15 % en 2024 à 72,5 % en 2026 — multiplication par ~5x en 18 mois. Anthropic a officiellement lancé Claude Computer Use Agent en research preview pour Pro et Max le 23 mars 2026, accessible via Claude Cowork et Claude Code. Claude Opus 4.7 (modèle le plus récent en avril 2026) à 5 $/M input et 25 $/M output tokens (avec économies de 90 % via prompt caching et 50 % via batch processing). Permission-first design : Claude demande l'accès avant de toucher chaque nouvelle application, l'utilisateur peut stopper à tout moment. Levée de fonds Series G à 30 Md $ en février 2026 (valorisation post-money 380 Md $) — Anthropic a maintenant les ressources pour itérer rapidement (12 features majeures en ~12 semaines, cadence d'environ deux semaines). Cas d'usage prouvés : dev (modifications IDE, soumission PRs, exécution tests via Claude Code 2.1.76+), background agents avec worktree isolation, Dispatch (assignment depuis mobile pour exécution sur ordi pendant que tu déjeunes), voice mode 20 langues, remote control via téléphone/web. Limite déclarée par Anthropic : « Computer use is still early compared to Claude's ability to code or interact with text. Claude can make mistakes. » Mac uniquement en research preview (Windows/Linux non supportés en avril 2026). Décision controversée 4 avril 2026 : Anthropic a banni les agents tiers sur Pro/Max — Claude ne peut plus servir d'API pour des agents externes (impact sur l'écosystème de fournisseurs comme Cursor, Cline et autres).

— 1 / 4Pourquoi computer use est différent.

Comprendre la différence entre « agent web » (ChatGPT Agent) et « computer use » (Claude) est essentiel pour faire le bon choix. Ce n'est pas une différence marketing — c'est une différence d'architecture qui détermine ce que chacun peut faire.

Approche 1 — Agent web (ChatGPT Agent, Operator)

Architecture : navigateur intégré dans le produit (Chromium-based), connecteurs SaaS pour les apps populaires (Gmail, Slack, etc.), code interpreter en sandbox.

Couverture : tout ce qui se fait dans un navigateur web ou via API publique d'un SaaS. Excellente couverture pour les SaaS mainstream.

Limite structurelle : ne peut pas interagir avec les apps natives de ton ordinateur (Excel desktop, Photoshop, IDE local, terminal, fichiers sur disque). Ne peut pas piloter les apps métier installées localement.

Approche 2 — Computer use (Claude)

Architecture : screenshot de ton écran à chaque étape → vision-language model qui raisonne sur ce qu'il voit → décision (cliquer ici, taper ça, appuyer sur cette touche) → exécution → nouveau screenshot → ainsi de suite. Boucle perception-action visuelle, comme un humain.

Couverture : potentiellement n'importe quelle app qui s'affiche sur ton écran. IDE, Excel desktop, Photoshop, terminal, app métier installée localement, n'importe quoi avec une UI graphique.

Limite structurelle : demande une boucle screenshot → modèle → action, donc plus lent (chaque tour = analyse d'image). Plus consommateur de tokens (chaque screenshot pèse). Échec sur les UIs avec animations rapides ou états transitoires courts.

La conséquence pratique

Pour un développeur qui utilise VS Code en local, lance des tests dans le terminal, edit des fichiers Markdown sur disque — Computer Use est l'option qui marche. ChatGPT Agent ne peut pas atteindre le terminal local.

Pour un commercial qui doit extraire des leads d'un site web, remplir un CRM cloud, envoyer des mails via Gmail — ChatGPT Agent est plus efficace. Computer Use peut le faire mais c'est un détour (passer par le navigateur du Mac, plus lent et plus cher en tokens).

Pour quelqu'un qui veut juste explorer ce qui marche le mieux pour lui — tester les deux sur la même tâche donne la réponse la plus claire en 1 semaine d'essai.

ChatGPT Agent est un agent qui sait naviguer le web. Claude Computer Use est un agent qui sait utiliser un ordinateur. Le premier est plus précis sur le web. Le deuxième est plus large. Aucun n'est intrinsèquement meilleur — chacun a son territoire.

— 2 / 4Comment ça marche concrètement.

Voici ce qui se passe quand tu lances Claude Computer Use sur une mission. Comprendre le mécanisme te permet d'anticiper les bonnes pratiques (et les pièges).

La boucle perception-action

Étape 1 : tu donnes une mission à Claude (« sauvegarde une image de chat sur mon bureau », « relance les tests dans ce repo et ouvre une PR si ils passent »).

Étape 2 : Claude prend une capture de ton écran. Il voit ce qui est affiché.

Étape 3 : il raisonne sur ce qu'il voit (« le navigateur est ouvert, je vois la barre d'adresse, je vais d'abord faire une recherche d'images »).

Étape 4 : il choisit une action (cliquer ici, taper ça, appuyer sur entrée). Si l'action concerne une nouvelle application, il demande ta permission. Tu valides.

Étape 5 : l'action est exécutée. Nouveau screenshot. Boucle.

Cette boucle continue jusqu'à ce que Claude considère la mission accomplie, ou que tu interrompes. Chaque étape consomme des tokens (screenshot pesant + raisonnement + commande). Une mission de 30 actions peut consommer 50 000 tokens — d'où l'importance des plans Pro/Max et de la recommandation Max 5x à 100 $/mois pour usage régulier.

Permission-first design

Anthropic a conçu Computer Use avec une logique de permission par application. Quand Claude veut interagir avec une nouvelle app pour la première fois (Photoshop, ton IDE, ton mailer), il te demande explicitement. Tu approuves ou refuses.

Cette friction est volontaire. Anthropic considère que l'utilisateur doit garder un contrôle granulaire sur ce que l'IA touche. La conséquence pratique : les premières utilisations sont plus lentes (validation à chaque nouvelle app), puis le rythme s'accélère une fois que les apps courantes sont validées.

C'est aussi un design défensif contre l'indirect prompt injection (cf article 2.8 ★) : si une page web malveillante essaie d'inciter Claude à ouvrir ton client mail, tu vois la demande et peux refuser. Sans ce design, l'agent serait beaucoup plus exposé.

Dispatch et Cowork — la couche produit

Computer Use n'est pas un produit isolé — il s'intègre dans l'écosystème Anthropic 2026. Deux composants importants à connaître :

Claude Cowork (lancé janvier 2026) : la couche d'orchestration pour les workflows persistants. Tu peux y construire des agents thread-based qui maintiennent leur contexte entre sessions. Computer Use s'invoque depuis Cowork comme un outil. Cowork Marketplace (février 2026) centralise des plugins pour workflows professionnels (legal, financial analysis).

Claude Code (version 2.1.76 en mars 2026) : l'outil agentique pour développeurs. Computer Use y est intégré pour les tâches ordi-locales (modifications IDE, soumission PRs, lancement de tests). Inclut désormais : scheduled tasks (commande loop pour cron-style), background agents avec worktree isolation, voice mode 20 langues, remote control via téléphone/web. La feature Dispatch permet à Claude d'utiliser ton ordinateur en autonomie pendant que tu fais autre chose — « AI coworker who keeps working while you take a lunch break » selon Anthropic.

— 3 / 4Cas d'usage 2026.

Voici les patterns documentés où Computer Use brille en avril 2026. La plupart sont concentrés autour du développement, mais d'autres territoires émergent.

Cas 1 — Développement et review de code (le territoire fort)

« Lance les tests dans ce repo, identifie les échecs, corrige-les, fais une PR. » Claude Computer Use via Claude Code peut le faire de bout en bout. Il ouvre le terminal, lance pytest/jest, lit les erreurs, édite les fichiers via l'IDE, commit, push, ouvre la PR sur GitHub. Tu reviens 20 minutes plus tard avec une PR à reviewer.

Ce qui le rend fort : Claude Opus 4.7 score 64,3 % sur SWE-Bench Pro (vs 58,6 % pour GPT-5.5). Le modèle a été optimisé pour les tâches de coding agentique. Les feedback loops du code (tests qui passent ou échouent) lui permettent de se corriger sans intervention humaine.

Cas Anthropic interne documenté : Claude résout des issues GitHub réelles sur le SWE-bench Verified à partir de la description de la PR seulement. Cas Sentry : agent qui va du bug flagué au PR ouvert, fully autonomous. Cas Notion : teams délèguent du coding sans quitter Notion, dozens of parallel tasks.

Cas 2 — Manipulation Excel et PowerPoint locaux

Anthropic a lancé une intégration Excel et PowerPoint le 11 mars 2026. Tu demandes à Claude de prendre un fichier Excel local, d'ajouter des colonnes calculées, de faire un graphique, de sauvegarder en PDF. Computer Use ouvre Excel desktop, exécute les manipulations, sauvegarde.

Pourquoi c'est unique : ChatGPT Agent ne peut pas faire ça avec Excel desktop (il a besoin de la version web Excel ou d'un export). Computer Use travaille avec ton fichier local, dans l'app native, comme tu le ferais. Excellent quand le fichier contient des macros, références complexes, ou est trop gros pour l'upload.

Limite actuelle : Mac uniquement (en avril 2026). La version Windows est en développement mais pas dispo en research preview.

Cas 3 — Workflows multi-apps qui mélangent web et local

« Vérifie ces 5 sites concurrents, extrais les nouveautés produit dans un Excel local, et envoie-moi un mail récap. » Computer Use peut alterner entre Safari (web), Excel (desktop) et Mail (desktop) sans sortir du flow.

C'est exactement le « lonely agent » évoqué par Ryan Gavin (Slack/Salesforce) — sauf qu'ici, l'agent fonctionne parce que tu lui donnes une mission claire et un environnement cohérent (ton ordinateur). Le piège du lonely agent (cf article fondation 3.1) est l'agent qui reste inutilisé. L'agent qui fait des workflows mélangés perso/SaaS/local trouve son utilité.

Cas 4 — Dispatch : automation pendant ton absence

Tu actives Dispatch sur ton téléphone : « Pendant que je déjeune, lance la suite de tests sur le repo X, monitor leur exécution, et résume-moi les résultats au retour. » Tu pars. Computer Use sur ton ordinateur prend la main, lance, monitor, résume. Au retour, le résumé est dans ton inbox.

Cas où Dispatch brille : tâches longues que tu ne veux pas regarder (CI/CD, data processing, batch tasks), tâches que tu peux mettre en arrière-plan pendant des meetings, monitoring de processus déterministes.

Précaution : Dispatch implique que ton ordinateur reste allumé et déverrouillé. En entreprise, ça pose des questions de sécurité physique — quelqu'un qui passe pendant ton déjeuner voit l'écran. Pas un risque IA, juste un risque « écran déverrouillé ». À considérer selon ton contexte.

Cas où Computer Use n'est PAS la bonne réponse

Tâches purement web sur SaaS mainstream → ChatGPT Agent ou Comet sont plus rapides et moins chers (cf article 3.2 et article 2.7).

Workflows déterministes répétitifs sur déclencheur → Zapier/Make/n8n (cf article 2.6) sont plus fiables et moins chers.

Tu es sur Windows ou Linux → Computer Use n'est pas dispo en avril 2026. Attends ou utilise ChatGPT Agent / Manus AI.

Quick lookups, génération de contenu, raisonnement guidé → utilise Claude.ai classique, pas Computer Use. Pas besoin du surcoût ni de la latence.

— 4 / 4Limites et précautions.

Anthropic admet ouvertement les limites de Computer Use — « still early compared to Claude's ability to code or interact with text ». Voici les 5 limites majeures à connaître en avril 2026.

Limite 1 — Mac uniquement (research preview)

En avril 2026, Computer Use est dispo uniquement sur Mac via Claude Cowork et Claude Code. Anthropic a annoncé travailler sur Windows/Linux mais sans calendrier précis. Pour ~70 % des utilisateurs en entreprise (Windows-dominants), ce n'est pas accessible aujourd'hui.

Limite 2 — Lenteur structurelle

La boucle screenshot → modèle → action prend 5-15 sec par étape. Une mission de 30 étapes = 5-7 minutes minimum. Pour des tâches courtes (< 5 étapes manuelles), c'est plus lent que toi. Le break-even est autour de 15-20 actions — au-delà, Computer Use gagne sur le total.

Limite 3 — Le ban des agents tiers (4 avril 2026)

Décision controversée d'Anthropic : le 4 avril 2026, ils ont banni les agents tiers sur Claude Pro/Max. Concrètement, des outils comme certaines extensions ou frameworks externes qui utilisaient Claude API via Pro/Max ne peuvent plus le faire — il faut passer par l'API directement (avec billing token-based).

Impact pratique : si tu utilisais Claude via Cursor, Cline ou un autre agent tiers en mode « my Pro plan », tu dois maintenant repasser par l'API directe. Coût additionnel pour les power users qui consommaient beaucoup. Anthropic a justifié par « usage abusif » qui consommait massivement le quota Max au détriment des utilisateurs réguliers.

Solution alternative : Claude Managed Agents lancé 4 jours plus tard (8 avril 2026) à 0,08 $/h runtime + tokens. Anthropic positionne ça comme la nouvelle voie pour des agents en production — payant à l'usage plutôt que « leveraging » les plans seat-based.

Limite 4 — Coût en quota

Computer Use consomme énormément de tokens (chaque screenshot pèse, chaque tour analyse l'image). Sur Pro à 20 $/mois, tu verras vite ton quota partir. Recommandation pour usage régulier : Max 5x à 100 $/mois (5x le quota Pro). Pour usage intensif : Managed Agents à 0,08 $/h runtime + tokens.

Calcul typique : une mission Computer Use de 30 actions = ~50 000 tokens (entre les screenshots, le raisonnement, et les outputs). Sur API GPT-5.2 : ~0,75 $. Sur Claude Opus 4.7 : ~1,25 $. Pas anodin pour des missions répétitives.

Limite 5 — Risques de sécurité spécifiques

Donner à Claude les « clés de ton ordinateur » est puissant — et inquiétant. Anthropic l'admet : « avoid letting Claude have access to sensitive data during the research preview. » Spécifiquement :

Indirect prompt injection via les pages web ou documents que Claude lit (cf article 2.8 ★). Le permission-first design mitigue mais n'élimine pas. Cyber-attaques : le fait que Claude pilote ton ordi crée une nouvelle surface d'attaque potentielle. Anthropic scanne pour les vulnérabilités mais reconnaît que « threats are constantly evolving ». Données client side : tous les screenshots, mouse actions, keyboard inputs et fichiers sont stockés dans ton environnement, pas chez Anthropic. ZDR (zero data retention) eligible. C'est plutôt rassurant côté privacy — mais ça veut aussi dire que tu es responsable du stockage.

Conseil pratique : ne lance pas Computer Use sur un Mac partagé ou avec des données sensibles côté écran. Crée un espace utilisateur dédié si possible. Ne fais jamais Dispatch sur des données critiques pendant que tu n'es pas physiquement présent.

Computer Use 2026 est puissant et impressionnant — mais c'est encore une research preview. Anthropic admet ses limites avec une honnêteté rare. Bénéficie-en avec discernement : excellents cas d'usage en dev et automation Mac, mais pas un outil pour tâches business critiques sans supervision.

— Bonus5 pièges classiques.

Piège 1 : essayer Computer Use sur Windows en 2026

Tu lis cet article, tu t'enthousiasmes, tu prends Pro à 20 $. Tu vas activer Computer Use. Surprise : tu es sur Windows, ce n'est pas dispo. Tu as cramé 20 $ pour rien. Correction : vérifie systématiquement la disponibilité plateforme avant de souscrire. État avril 2026 : Mac uniquement en research preview. Windows et Linux annoncés mais sans calendrier. Si tu es sur Windows : utilise ChatGPT Agent (cf article 3.2) ou attends. Suis le blog Anthropic ou fais un test gratuit avant.

Piège 2 : activer Dispatch sans considérer la sécurité physique

Tu actives Dispatch en open space d'entreprise pour qu'un workflow tourne pendant ton meeting. Tu pars. Pendant ton absence, n'importe qui qui passe voit l'écran de ton Mac avec Claude qui ouvre tes mails, ton IDE, tes fichiers. Risque « écran déverrouillé » classique amplifié par la visibilité de l'agent en action. Correction : Dispatch est génial dans des contextes contrôlés (ton domicile, ton bureau privé). En open space, soit tu l'utilises avec écran orienté contre mur, soit tu attends d'être seul. Le risque IA est faible. Le risque humain (collègue curieux, photo malveillante) est réel.

Piège 3 : cramer son quota Pro sans s'en rendre compte

Tu lances Computer Use sur 3 missions de 30+ actions chacune dans la même journée. Tu utilises ~150 000 tokens en agentique seulement. Le lendemain, ton quota Pro mensuel est dans le rouge, tu ne peux plus utiliser Claude pour les tâches normales. Frustration. Correction : si tu prévois d'utiliser Computer Use plus de 30 min/jour ou 5 missions agentiques/semaine, prends directement Max 5x à 100 $/mois. Le surcoût (80 $) est largement compensé par la disparition du stress du quota. Pour usage occasionnel (1-2 missions/semaine), Pro à 20 $ suffit. Pour usage intensif business critique, considère Managed Agents (pricing à l'heure de runtime).

Piège 4 : oublier le ban des agents tiers du 4 avril 2026

Tu construis un workflow business critique en utilisant Cursor ou Cline avec ton plan Max « pour économiser sur l'API ». Le 4 avril 2026, Anthropic ban ces accès. Ton workflow casse du jour au lendemain. Tu dois soit migrer vers l'API directe (coût additionnel non budgété), soit changer d'outil. Perte de temps et d'argent. Correction : pour des workflows critiques, utilise toujours l'API directe avec billing token-based. Les plans seat-based (Pro, Max) sont conçus pour usage « humain », pas comme abstraction d'API. Si tu construis un produit ou un workflow récurrent : passe par l'API. Anthropic Managed Agents (lancé 4 jours après le ban) est conçu exactement pour ce cas.

Piège 5 : croire que Computer Use va remplacer ton workflow Zapier/Make

Tu découvres Computer Use, c'est impressionnant. Tu décides de migrer tes 10 workflows Zapier vers Computer Use parce que « c'est plus moderne ». Erreur. Pour des workflows déterministes 24/7 sur déclencheur (nouveau lead → 7 actions), Zapier/Make/n8n sont 10x plus fiables et 50x moins chers. Computer Use a besoin de ton ordi allumé, est lent (5-15 sec/action), et coûte des tokens. Correction : ne migre pas. Computer Use est un agent tactique qui démarre quand tu lui demandes. Zapier/Make/n8n sont des workflows persistants qui tournent 24/7 sur événement. Couches complémentaires, pas concurrentes. Cf article 2.6 et article 3.1.

Ma règle de mentor

Claude Computer Use 2026 est le bon outil pour les développeurs Mac et les power users qui veulent piloter leurs apps natives. Pour 70 % du grand public en entreprise (Windows-dominants), il n'est pas encore accessible. Pour les 30 % sur Mac, c'est un upgrade significatif vs ChatGPT Agent quand tes workflows mélangent web et local. Mon stack 2026 : Claude Pro à 20 $ (Computer Use occasionnel + chat principal pour rédaction longue), ChatGPT Plus à 20 $ (research extraction + Agent web), Comet gratuit (veille cross-platform). Total 40 $/mois — couvre 95 % des cas tactiques. Pour usage Computer Use intensif (developpeurs lourds), Max 5x à 100 $/mois est inévitable. Suite logique : la rubrique R3 complète avec les articles 3.4 (multi-agent systems), 3.5 (cas d'usage qui marchent), 3.6 (gouvernance), 3.7 (article-pilier à venir).

5 points sur Claude Computer Use en 2026.

Approche fondamentalement différente de ChatGPT Agent : Computer Use voit ton écran et clique, pilote ton ordinateur entier (apps natives + web + fichiers locaux). ChatGPT Agent navigue le web et utilise des connecteurs SaaS. Couvertures complémentaires : Computer Use plus large, Agent plus rapide sur le web mainstream.
Lancé en research preview Pro/Max le 23 mars 2026, accessible via Claude Cowork et Claude Code. Score OSWorld 72,5 % (vs < 15 % en 2024 — multiplication par ~5x en 18 mois). Modèles principaux Opus 4.5/4.6/4.7 avec 1M tokens de contexte. Mac uniquement en avril 2026 (Windows/Linux annoncés sans calendrier).
Permission-first design : Claude demande l'accès avant chaque nouvelle application. Boucle perception-action (screenshot → raisonnement → action → screenshot). Plus lent et plus consommateur de tokens que les agents web. Recommandation pour usage régulier : Max 5x à 100 $/mois (5x le quota Pro).
Cas d'usage qui marchent : développement et review de code (territoire fort, intégration Claude Code 2.1.76+ avec scheduled tasks, background agents, voice mode 20 langues, Dispatch), manipulation Excel et PowerPoint locaux (intégration 11 mars 2026), workflows multi-apps mélangeant web et local, automation pendant ton absence via Dispatch. Pas adapté pour : tâches purement web mainstream (utilise ChatGPT Agent ou Comet), workflows déterministes 24/7 sur déclencheur (utilise Zapier/Make/n8n), Windows/Linux.
5 limites importantes : Mac uniquement (élimine 70 % en entreprise), lenteur structurelle (5-15 sec par action, break-even autour de 15-20 actions), ban des agents tiers le 4 avril 2026 (Cursor/Cline doivent passer par API directe, alternative Claude Managed Agents lancé 8 avril 2026 à 0,08 $/h runtime), coût en quota élevé (50 000 tokens pour mission 30 actions), risques sécurité (indirect prompt injection, données client side, ne pas exposer données sensibles en research preview).

— Article suivant

3.4 · Construire ton premier agent (à venir)

→

— Voir tous les articles

Déléguer aux agents · Rubrique complète

→