Course mondiale vers l’AGI : juillet 2025, l’accélération finale ?
En l’espace de six mois, la frontière entre simple IA générative et véritable Intelligence Artificielle Générale (AGI) a reculé à grande vitesse. La promesse n’est plus cantonnée aux laboratoires : elle s’affiche dans les keynotes produits, les budgets gouvernementaux et les cours de bourse. À l’été 2025, quatre laboratoires privés — OpenAI, Google DeepMind, Anthropic et xAI — se livrent une bataille à plusieurs milliards, tandis que les États‑Unis, l’Union européenne et la Chine redessinent les règles du jeu pour s’assurer une position stratégique.
Qu’est‑ce que l’AGI ?
Contrairement aux IA dites « étroites » (narrow AI), spécialisées dans une tâche unique — classer des images, prédire des achats, traduire des phrases —, l’Intelligence Artificielle Générale vise une compréhension et une résolution de problèmes polyvalentes. Un système AGI doit apprendre de nouvelles compétences avec peu de données, transférer son savoir d’un domaine à l’autre, raisonner de façon abstraite et planifier des actions dans des contextes inconnus, comme un humain… mais à la vitesse et à l’échelle du numérique. Pour qu’un modèle mérite cette étiquette, les chercheurs retiennent généralement trois critères :
- Transfert de compétences sans entraînement supervisé massif ;
- Planification hiérarchique sur des horizons longs ;
- Auto‑évaluation et capacité de méta‑apprentissage.
2025 n’a pas encore validé ces trois points simultanément, mais les prototypes actuels cochent déjà un ou deux items — assez pour déclencher investissements et régulation.
1. Le contexte : pourquoi parle‑t‑on d’AGI aujourd’hui ?
De 2017 (Transformer) à 2023 (ChatGPT), l’IA générative a évolué surtout par la quantité de calcul disponible. Depuis 2024, on observe un saut qualitatif : multimodalité native (texte, image, audio, vidéo), exécution de code, agents capables d’orchestrer des tâches et, surtout, fenêtres de contexte géantes qui permettent d’ingérer des bases de connaissance entières. Les chercheurs évoquent désormais la « courbe S d’émergence » : une pente abrupte où chaque doublement de calcul révèle des capacités inattendues. Ajoutez la baisse continue du coût GPU (‑18 % par an malgré les pénuries) et l’évangélisation via les interfaces chat — on obtient un cocktail prêt pour l’adoption de masse.
2. xAI : Grok 4 prend la lumière
Annoncé le 9 juillet 2025, Grok 4 élargit la fenêtre de contexte à 256 000 tokens, accepte texte, image et audio, et intègre nativement la recherche temps réel sur X. Côté architecture, xAI mise sur un Mixture‑of‑Experts à 512 experts activés dynamiquement et entraîné sur plus de 400 000 GPU H100. La variante « Heavy » obtient 50 % au benchmark Humanity’s Last Exam — 12 points de mieux que Grok 3 — et 15,9 % sur arc‑AGI v2. Elon Musk promet une intégration dans les Tesla d’ici fin 2025, relançant le débat sur la sécurité routière.
Pour financer l’itération suivante, la société lève 4,3 G $ (dont 2 G $ confirmés par SpaceX) et a signé un contrat de 200 M $ avec le Département de la Défense américain pour une suite « Grok for Government ». La facture énergétique de l’entraînement dépasse 190 GWh, soit l’équivalent d’une ville de 50 000 habitants.
3. OpenAI : GPT‑5 se fait attendre, mais l’argent afflue
OpenAI finalise les derniers tests de GPT‑5, attendu pour la fin de l’été 2025. Les fuites internes évoquent :
- une fenêtre de contexte comparable à Grok 4 ;
- une mémoire à long terme persistante entre sessions ;
- un module de planification symbolique inspiré de recherches présentées à ICLR 2025.
La version « open‑weight » est repoussée pour raisons de sûreté, tandis que le programme Superalignment publie ses premiers garde‑fous avec un budget dédié de 1 G $.
Côté finances, SoftBank pilote un tour de 40 G $ valorisant OpenAI 300 G $. Microsoft convertit ses royalties cloud en parts supplémentaires et Disney teste déjà Sora 2 (module vidéo) dans ses pipelines.
4. Google DeepMind : un million de tokens avec Gemini 2.5 Pro
Google DeepMind poursuit sa stratégie « long context ». Gemini 2.5 Pro accepte jusqu’à 1 million de tokens via l’API Context Caching de Vertex AI. Combiné à la diffusion vidéo 8K, cela ouvre la voie aux agents incarnés capables de lire un manuel complet puis de guider l’utilisateur en réalité augmentée. La division AlphaFold‑X utilise la version Recherche de Gemini pour simuler des protéines en direct, et Google Cloud promet un accès public limité au T4 2025.
5. Anthropic : la voie de la sûreté avec Claude Opus 4
Sorti en mai, Claude Opus 4 maintient une fenêtre de 200 000 tokens et inaugure un mode « extended thinking » dissociant réflexion et réponse. Anthropic reste fidèle à sa méthode Constitutional AI : les refus et redirections s’appuient sur un socle de principes modifiables. AWS héberge l’entraînement — 80 % des requêtes Claude passent par Bedrock — pendant que Google renforce son investissement (2,25 G $ convertibles).
Un point notable : Anthropic expérimente un cadre d’évaluation critical‑catastrophic avec l’AI Safety Institute britannique, visant à mesurer la capacité d’un modèle à planifier des armements biologiques. Ces tests devraient devenir un standard post‑AI Act.
6. Une marée d’argent frais
- 162,8 G $ injectés aux États‑Unis au S1 2025 (+76 % YoY), dont 64 % dans l’IA ;
- 31 G $ en Europe, tirés par Mistral AI et Aleph Alpha ;
- 18 G $ en Asie hors Chine (Corée, Singapour).
Les IPO se préparent : Hugging Face vise une cotation au NASDAQ début 2026 (~25 G $) et Databricks intègre un LLM propriétaire pour séduire les marchés.
7. Régulation : trois blocs, trois philosophies
- Union européenne : l’AI Act entre en vigueur le 2 août 2025. Les modèles « haut risque » devront publier des fiches d’impact, documenter leurs datasets et, dans certains cas, déposer les poids sous licence protégée.
- États‑Unis : l’administration Trump privilégie des Executive Orders sectoriels. Le Pentagone obtient toutefois des dérogations pour auditer les modèles critiques.
- Chine : Pékin regroupe 300 labos sous le programme « Projet 863‑Plus » visant la souveraineté AGI en 2030.
Londres étend l’AI Safety Institute avec des antennes à Boston, Ottawa et Tokyo pour imposer ses protocoles d’audit.
8. Six axes techniques clés en 2025
- Hyper‑contexte : 256 k‑1 M tokens, mémoire externe à faible latence.
- Multimodal natif : texte‑vision‑audio‑vidéo fusionnés dans un même espace d’embeddings.
- Tool‑use généralisé : interpréteur de code, requêtes SQL, navigation web, actions sur API.
- Planification symbolique : mélange LLM + algorithmes logiques.
- Alignement & robustesse : Constitutional AI, boucles d’auto‑critique, adversarial red‑team.
- Efficacité énergétique : quantisation 4‑bits, sparsity, refroidissement immersif.
9. L’ombre de la consommation énergétique
Chaque entraînement de dernière génération engloutit entre 150 et 300 GWh. À ce rythme, les data‑centers AGI pourraient peser 3 % de la consommation électrique mondiale en 2030. Microsoft et Google investissent donc dans le nucléaire modulaire, tandis que xAI projette des fermes solaires couplées à du stockage liquide‑air.
10. Guerre froide ou coopération ?
La course prend des allures de guerre froide technologique. Washington et Londres misent sur la puissance privée et une régulation « light », Pékin prône l’autosuffisance, Bruxelles joue l’arbitre éthique. Au milieu, des coalitions émergent : le Paris Summit 2025 prévoit un fonds de 2,5 G € pour les modèles open‑source du Sud global.
11. Conclusion : vers une coalition de l’alignement
Personne n’a verrouillé la route vers l’AGI. Le prochain jalon viendra peut‑être de l’alliance qui saura équilibrer puissance de calcul, capital et normes de sécurité. Chaque acteur vise une solution « tout‑en‑un » — mais la gouvernance devra être multipartite : entreprises, États, société civile. Les prochains mois, entre déploiements industriels, tension énergétique et premières sanctions AI Act, serviront de répétition générale avant l’invention potentielle d’une intelligence plus‑qu’humaine.
Sources et références
- dhruvam.medium.com – « Elon Musk’s X just released Grok 4, the most advanced AI », 9 juillet 2025.
- chatbase.co – « Grok 4 : first look and benchmarks », 10 juillet 2025.
- Houston Chronicle – « xAI signs $200 M Pentagon deal for Grok for Government », 2 juillet 2025.
- Reuters – « Musk’s xAI in talks to raise $4.3 billion », 17 juin 2025.
- Techzine.eu – « New capital injection to bring OpenAI valuation to $300 billion », 1ᵉʳ avril 2025.
- SoftBank Group, Press Release – « SoftBank to lead $40 bn round in OpenAI », 1ᵉʳ avril 2025.
- Google Cloud Documentation – « Gemini 2.5 Pro : long‑context model », juin 2025.
- DeepMind Blog – « Gemini 2.5 Pro advances long‑context reasoning », juin 2025.
- Anthropic – « Claude Opus 4 Overview », mai 2025.
- Anthropic Newsroom – « Introducing Claude 4 family », mai 2025.
- Reuters – « US AI startups see funding surge while more VC funds struggle », 15 juillet 2025.
- Reuters – « Thinking Machines raises $2 bn in a16z‑led round », 15 juillet 2025.
- AP News – « EU’s AI Act enters into force on Aug 2 », 12 avril 2025.
- Commission européenne, Communiqué IP_25_1787 – « Adoption de l’AI Act », 15 mars 2025.
- EU Digital Strategy – « AI Code of Practice for GPAI », mai 2025.
- GOV.UK – « Introducing the AI Safety Institute », décembre 2024 (mise à jour 2025).
- AISI Annual Report – « Our first year », juillet 2025.
Commentaires
Enregistrer un commentaire