- Les modèles frontier d’OpenAI et Codex sont désormais disponibles officiellement sur AWS, permettant à des millions de clients AWS de construire avec OpenAI sur la plateforme où ils exploitent déjà leur activité
- Les entreprises peuvent mettre l’IA frontier en production via leurs workflows existants de sécurité, conformité, achats, facturation et gouvernance, réduisant les frictions entre l’évaluation et le déploiement réel
- OpenAI models on Amazon Bedrock permet de créer des applications d’IA avec les contrôles natifs de sécurité et de gouvernance d’AWS
- Codex on Amazon Bedrock apporte dans l’environnement AWS l’agent d’ingénierie logicielle d’OpenAI, utilisé chaque semaine par plus de 5 millions de personnes, pour aider à écrire, relire, déboguer et moderniser le code
- À l’avenir, l’offre sera étendue avec Daybreak pour les clients AWS, afin d’intégrer à la boucle de développement quotidienne la revue de code de sécurité, la modélisation des menaces, la vérification des correctifs, l’analyse des risques liés aux dépendances, la détection et les recommandations d’amélioration
Mettre OpenAI en production sur AWS
- Les modèles frontier d’OpenAI et Codex sont désormais en disponibilité générale sur AWS
- Les clients AWS peuvent utiliser les fonctionnalités d’OpenAI via la plateforme AWS sur laquelle ils exploitent déjà leur activité
- Les entreprises peuvent traiter les principaux freins que sont la sécurité, la conformité, les achats, la facturation et la gouvernance dans leurs workflows existants
- Les organisations peuvent réduire les obstacles opérationnels et passer plus rapidement de l’évaluation au déploiement réel
Modalités de disponibilité et plan d’extension
- OpenAI models on Amazon Bedrock permet de créer des applications d’IA à l’aide des contrôles natifs de sécurité et de gouvernance d’AWS
- Codex on Amazon Bedrock est proposé comme un agent d’ingénierie logicielle aidant les équipes à écrire, relire, déboguer et moderniser le code dans l’environnement AWS où elles construisent et déploient déjà
- Ces deux offres sont disponibles dans les régions AWS Commercial et GovCloud
- OpenAI et AWS prévoient de continuer à étendre les fonctionnalités OpenAI proposées via AWS afin d’aider les équipes à passer de l’évaluation à la production avec moins de friction et davantage de confiance
- Daybreak, qui sera proposé ultérieurement, inclura des modèles cyber et Codex Security, conçus pour aider les défenseurs à repérer les risques plus tôt, à réagir plus vite et à rendre les logiciels plus résilients
1 commentaires
Commentaires Hacker News
Chaque fois que je vois quelqu’un demander pourquoi on fait confiance à AWS, Azure ou GCP, et pourquoi on paie une prime, je me dis qu’il n’a jamais travaillé en environnement enterprise
Dans le grand groupe où je travaille, les contrats clients imposent une gouvernance des données stricte, et nous avons aussi nos propres exigences internes de gouvernance. Utiliser un fournisseur non seulement approuvé par la sécurité informatique, mais aussi explicitement désigné comme sous-traitant de données dans les contrats clients, est le meilleur moyen d’éviter un licenciement et des poursuites
Quand on bricole chez soi avec son propre code et ses propres données, on peut faire ce qu’on veut, mais avec les données de l’entreprise et des clients, c’est absolument exclu. C’est la même raison pour laquelle on n’utilise pas n’importe quel modèle frontier à la mode. Les side projects et les startups ont des contraintes et des considérations complètement différentes
Quand on lit les petites lignes, c’est assez amusant. La responsabilité en cas de perte de données retombe en grande partie sur le client, les réclamations SLA exigent des preuves précises, et les recours acceptés se résument en général à des crédits d’usage futurs sur le produit même qui a perdu les données
Les conditions AWS sont plutôt raisonnables comparées à celles de GCP, par exemple. Le SLA de GCP semble surtout utile pour que les équipes achats enterprise puissent dire : « il y a bien un SLA, donc on a fait la due diligence, et si on choisit ça on ne se fera pas virer ». En revanche, GCP peut répondre : « vous avez déjà accepté le recours proposé au moment de signer le contrat, donc si vous nous attaquez en justice, on vous montrera cette clause. Merci de votre confiance. » [0]
[0] https://docs.cloud.google.com/storage/docs/storage-classes
Le stockage standard multi-région ou bi-région a un SLA de disponibilité de 99,95 %, le standard régional est à 99,9 %, et le Nearline, Coldline ou Archive régional peut descendre à 99,0 %. Les crédits sont de 10 %, 25 % ou 50 % de la facture mensuelle de la classe de service affectée, avec un plafond mensuel cumulé de 50 %, appliqué à un usage futur. Google précise aussi que si le client ne demande pas le crédit sous 30 jours, il est considéré comme abandonné
AWS peut aussi se faire compromettre, mais ils ont clairement travaillé à réduire un peu cette probabilité et à faciliter l’identification des clients touchés. Par exemple, si on explore les logs AWS, il y a énormément de traces rien qu’en les activant, ce qui permet de reconstituer qui a fait quoi sur les permissions ou l’environnement. J’imagine que les accès des employés AWS sont eux aussi assez bien journalisés. À une époque, il fallait passer par plusieurs étapes pour rattacher un employé AWS à mon compte
J’ai été choqué de découvrir à quel point il était compliqué d’utiliser une simple licence GitHub Copilot sur Azure. Pourtant ce sont deux produits Microsoft, mais l’IT a dû comprendre comment configurer GitHub Enterprise, le relier à l’abonnement Azure, et faire tout un tas d’autres manipulations
Si vous avez déjà utilisé des modèles de code IA en grand groupe, vous savez que beaucoup de déploiements enterprise imposent en pratique l’usage d’AWS Bedrock. La raison est simple
Nous ne travaillons pas depuis les États-Unis, et nous avons des exigences fortes pour que les données restent dans notre pays ; Bedrock fournit ce contrôle
Si cette dynamique continue, je me demande comment l’IA va poursuivre sa croissance. Si on part du principe que la plupart des données de valeur sont derrière ce genre de pare-feu, alors les données publiques ont déjà été moissonnées, et il est possible qu’il y ait eu un entraînement sur des données obtenues illégalement. C’est une zone grise
Est-ce qu’on finira par avoir un écosystème fermé sans entrée externe ?
Si vous vous demandez pourquoi payer plus cher pour accéder à ces API via AWS plutôt que directement, c’est parce que, dans certaines entreprises, faire approuver un nouveau fournisseur relève quasiment de l’impossible. Si l’entreprise a un contrat AWS, alors il faut utiliser ce qu’AWS propose
Selon le contrat client, il peut aussi falloir notifier ce nouveau fournisseur au client, ce qui peut déclencher un nouvel examen sécurité. Alors que s’il s’agit juste d’ajouter un modèle de plus dans Bedrock ? C’est beaucoup plus simple
C’est énorme pour OpenAI. Il y avait bien plus d’entreprises ayant adopté Claude simplement parce qu’il était disponible sur AWS qu’on ne l’imaginait, et maintenant la concurrence devient sérieuse
C’est une bonne évolution pour OpenAI, et Anthropic a des raisons de s’inquiéter. À cause de la dépendance à AWS et des exigences de sécurité, Bedrock a longtemps été pour moi la seule façon d’utiliser des modèles de base
Ils ne doivent pas se réjouir de voir disparaître leur avantage de premier entrant, mais ils s’y attendaient probablement depuis longtemps
C’est une bonne nouvelle pour la concurrence
Claude Code continue de retirer de nouvelles fonctionnalités aux utilisateurs qui passent par Amazon Bedrock. Par exemple le mode automatique, le forfait Ultra, ou Claude for Chrome. Un peu plus de concurrence pourrait les pousser à revoir leur stratégie
Pendant un temps, j’ai créé un émulateur api.anthropic.com pour transférer « discrètement » les requêtes vers Amazon Bedrock. Ça fonctionne bien, et maintenant on peut même utiliser immédiatement des fonctionnalités réservées au fournisseur primaire
Anthropic devrait sans doute accélérer son IPO. Son énorme envolée de revenus est en pratique le résultat de l’échec du lancement de Gemini et du fait qu’OpenAI était ligoté par son attachement à Azure
Les modèles Anthropic étaient littéralement la seule API serverless réellement pratique disponible sur AWS, c’est-à-dire les modèles Bedrock. Les gammes récentes Qwen 3.5/3.6 n’ont même pas été lancées. Avec en plus la tendance centrée sur l’efficacité des tokens et le retour sur investissement, j’ai vraiment hâte de voir comment Anthropic terminera le troisième trimestre
Les laboratoires frontier fournissent aux hyperscalers des builds de modèles figés qu’ils servent sans collecte de données. Pour la plupart des entreprises qui veulent utiliser des LLM frontier tout en conservant des données sensibles, c’est une condition préalable
C’est une mauvaise nouvelle pour Azure. Ils étaient les élus, mais ils n’ont pas su suivre la demande
Quand OpenAI a quitté son exclusivité en disant qu’Azure n’était pas fiable, on savait déjà que la destination suivante serait AWS