![[Image: newsbot_ba90525907c7cbce54b8b583285bfe89...52836.webp]](https://blog.ckforum.com/uploads/2026-07/newsbot_ba90525907c7cbce54b8b583285bfe89_1783052836.webp)
AWS RENFORCE LES CAPACITÉS D'EXÉCUTION D'AGENTCORE POUR SOUTENIR LES DÉPLOIEMENTS D'IA À GRANDE ÉCHELLE
AWS a annoncé une augmentation significative des quotas de runtime d'AgentCore, permettant ainsi aux entreprises de soutenir un plus grand nombre de sessions d'agents d'IA et de gérer des charges de travail plus importantes sans avoir besoin de demander une augmentation de quota. Cette évolution vise à faciliter la mise à l'échelle des déploiements d'IA dans les entreprises. Les nouvelles limites par défaut permettent de supporter jusqu'à 5 000 sessions actives simultanées dans certaines régions, contre 1 000 auparavant.
Augmentation des quotas de runtime
Les quotas de runtime d'AgentCore ont été augmentés pour permettre aux entreprises de gérer un plus grand nombre de sessions d'agents d'IA et de gérer des charges de travail plus importantes. Les nouvelles limites par défaut permettent de supporter jusqu'à 5 000 sessions actives simultanées dans certaines régions, contre 1 000 auparavant. De plus, le nombre d'interactions que chaque agent d'IA peut gérer a été augmenté de 25 tokens par seconde à 200 tokens par seconde.
Impact sur les déploiements d'IA
Cette augmentation des quotas de runtime devrait avoir un impact positif sur les déploiements d'IA dans les entreprises. Les entreprises pourront désormais soutenir un plus grand nombre de sessions d'agents d'IA et gérer des charges de travail plus importantes sans avoir besoin de demander une augmentation de quota. Cela devrait réduire les frais administratifs et les temps d'attente liés aux demandes de quota. Les entreprises qui utilisent des charges de travail d'IA à haute concurrence et à forte intensité de transaction devraient être les plus à même de profiter de cette augmentation des quotas de runtime.
Concurrence avec d'autres hyperscalers
AWS n'est pas le seul hyperscaler à s'adapter à la mise à l'échelle des agents d'IA dans les entreprises. Les autres hyperscalers, tels que Microsoft et Google, abordent ce défi de différentes manières. Par exemple, Microsoft propose une approche différente avec son service Azure Foundry Agent, qui permet une plus grande flexibilité dans la mise à l'échelle des modèles de déploiement. Les entreprises devraient prendre en compte ces différences lorsqu'elles évaluent les options de mise à l'échelle de leurs déploiements d'IA.
En conclusion, l'augmentation des quotas de runtime d'AgentCore par AWS devrait faciliter la mise à l'échelle des déploiements d'IA dans les entreprises. Les entreprises pourront désormais soutenir un plus grand nombre de sessions d'agents d'IA et gérer des charges de travail plus importantes sans avoir besoin de demander une augmentation de quota. Cela devrait avoir un impact positif sur la mise à l'échelle des déploiements d'IA dans les entreprises et les aider à profiter des avantages de l'IA. Vous pouvez en savoir plus sur les notes de version d'AgentCore et les services d'AgentCore.
Source : Microsoft launches AI engineering company | InfoWorld
