2 points par GN⁺ 11 시간 전 | 1 commentaires | Partager sur WhatsApp
  • Les modèles frontier d’OpenAI et Codex sont désormais disponibles officiellement sur AWS, permettant à des millions de clients AWS de construire avec OpenAI sur la plateforme où ils exploitent déjà leur activité
  • Les entreprises peuvent mettre l’IA frontier en production via leurs workflows existants de sécurité, conformité, achats, facturation et gouvernance, réduisant les frictions entre l’évaluation et le déploiement réel
  • OpenAI models on Amazon Bedrock permet de créer des applications d’IA avec les contrôles natifs de sécurité et de gouvernance d’AWS
  • Codex on Amazon Bedrock apporte dans l’environnement AWS l’agent d’ingénierie logicielle d’OpenAI, utilisé chaque semaine par plus de 5 millions de personnes, pour aider à écrire, relire, déboguer et moderniser le code
  • À l’avenir, l’offre sera étendue avec Daybreak pour les clients AWS, afin d’intégrer à la boucle de développement quotidienne la revue de code de sécurité, la modélisation des menaces, la vérification des correctifs, l’analyse des risques liés aux dépendances, la détection et les recommandations d’amélioration

Mettre OpenAI en production sur AWS

  • Les modèles frontier d’OpenAI et Codex sont désormais en disponibilité générale sur AWS
  • Les clients AWS peuvent utiliser les fonctionnalités d’OpenAI via la plateforme AWS sur laquelle ils exploitent déjà leur activité
  • Les entreprises peuvent traiter les principaux freins que sont la sécurité, la conformité, les achats, la facturation et la gouvernance dans leurs workflows existants
  • Les organisations peuvent réduire les obstacles opérationnels et passer plus rapidement de l’évaluation au déploiement réel

Modalités de disponibilité et plan d’extension

  • OpenAI models on Amazon Bedrock permet de créer des applications d’IA à l’aide des contrôles natifs de sécurité et de gouvernance d’AWS
  • Codex on Amazon Bedrock est proposé comme un agent d’ingénierie logicielle aidant les équipes à écrire, relire, déboguer et moderniser le code dans l’environnement AWS où elles construisent et déploient déjà
  • Ces deux offres sont disponibles dans les régions AWS Commercial et GovCloud
  • OpenAI et AWS prévoient de continuer à étendre les fonctionnalités OpenAI proposées via AWS afin d’aider les équipes à passer de l’évaluation à la production avec moins de friction et davantage de confiance
  • Daybreak, qui sera proposé ultérieurement, inclura des modèles cyber et Codex Security, conçus pour aider les défenseurs à repérer les risques plus tôt, à réagir plus vite et à rendre les logiciels plus résilients

1 commentaires

 
Commentaires Hacker News
  • Chaque fois que je vois quelqu’un demander pourquoi on fait confiance à AWS, Azure ou GCP, et pourquoi on paie une prime, je me dis qu’il n’a jamais travaillé en environnement enterprise
    Dans le grand groupe où je travaille, les contrats clients imposent une gouvernance des données stricte, et nous avons aussi nos propres exigences internes de gouvernance. Utiliser un fournisseur non seulement approuvé par la sécurité informatique, mais aussi explicitement désigné comme sous-traitant de données dans les contrats clients, est le meilleur moyen d’éviter un licenciement et des poursuites
    Quand on bricole chez soi avec son propre code et ses propres données, on peut faire ce qu’on veut, mais avec les données de l’entreprise et des clients, c’est absolument exclu. C’est la même raison pour laquelle on n’utilise pas n’importe quel modèle frontier à la mode. Les side projects et les startups ont des contraintes et des considérations complètement différentes

    • Je me demande si vous avez vérifié le contrat AWS réel, ainsi que la responsabilité limitée explicitée dans le contrat et les documents liés depuis les supports contractuels et marketing
      Quand on lit les petites lignes, c’est assez amusant. La responsabilité en cas de perte de données retombe en grande partie sur le client, les réclamations SLA exigent des preuves précises, et les recours acceptés se résument en général à des crédits d’usage futurs sur le produit même qui a perdu les données
      Les conditions AWS sont plutôt raisonnables comparées à celles de GCP, par exemple. Le SLA de GCP semble surtout utile pour que les équipes achats enterprise puissent dire : « il y a bien un SLA, donc on a fait la due diligence, et si on choisit ça on ne se fera pas virer ». En revanche, GCP peut répondre : « vous avez déjà accepté le recours proposé au moment de signer le contrat, donc si vous nous attaquez en justice, on vous montrera cette clause. Merci de votre confiance. » [0]
      [0] https://docs.cloud.google.com/storage/docs/storage-classes
      Le stockage standard multi-région ou bi-région a un SLA de disponibilité de 99,95 %, le standard régional est à 99,9 %, et le Nearline, Coldline ou Archive régional peut descendre à 99,0 %. Les crédits sont de 10 %, 25 % ou 50 % de la facture mensuelle de la classe de service affectée, avec un plafond mensuel cumulé de 50 %, appliqué à un usage futur. Google précise aussi que si le client ne demande pas le crédit sous 30 jours, il est considéré comme abandonné
    • En plus, il y a un monde entre « cette équipe a dépensé 1 000 dollars en IA sur sa note de frais, qu’est-ce qu’on en a tiré ? » et « la facture AWS globale de l’entreprise a augmenté de quelques pourcents, on regardera ça quand on aura le temps ». Le second cas rend le projet bien plus réaliste
    • La posture de sécurité d’AWS est différente. Les startups IA, les outils de création de webapps pour startups, ou les éditeurs de plugins VSCode ont de fortes chances de se faire pirater et de voir leurs données fuiter
      AWS peut aussi se faire compromettre, mais ils ont clairement travaillé à réduire un peu cette probabilité et à faciliter l’identification des clients touchés. Par exemple, si on explore les logs AWS, il y a énormément de traces rien qu’en les activant, ce qui permet de reconstituer qui a fait quoi sur les permissions ou l’environnement. J’imagine que les accès des employés AWS sont eux aussi assez bien journalisés. À une époque, il fallait passer par plusieurs étapes pour rattacher un employé AWS à mon compte
    • En bref : personne ne s’est jamais fait virer pour avoir acheté IBM
    • Je viens justement de passer d’un environnement très libre, où on pouvait utiliser n’importe quel harnais IA ou modèle, à un environnement enterprise strict
      J’ai été choqué de découvrir à quel point il était compliqué d’utiliser une simple licence GitHub Copilot sur Azure. Pourtant ce sont deux produits Microsoft, mais l’IT a dû comprendre comment configurer GitHub Enterprise, le relier à l’abonnement Azure, et faire tout un tas d’autres manipulations
  • Si vous avez déjà utilisé des modèles de code IA en grand groupe, vous savez que beaucoup de déploiements enterprise imposent en pratique l’usage d’AWS Bedrock. La raison est simple

    1. Les grandes entreprises ont souvent déjà une relation avec AWS, donc la procédure est bien plus simple que de créer une nouvelle relation fournisseur
    2. Les grandes entreprises ont souvent des exigences internes fortes pour que les données internes restent sous le contrôle de l’entreprise. Avec AWS Bedrock, on peut être bien plus certain que ce qu’on envoie au modèle n’ira pas se retrouver dans un dataset d’entraînement quelque part. Là où je travaille, cette exigence impose de passer par AWS Bedrock plutôt que d’utiliser directement l’API OpenAI
    • Si on va un cran plus loin, ajouter un nouveau fournisseur est souvent impossible parce que divers contrats passés avec des clients promettent, sous différentes formes, de ne pas envoyer les données clients à un autre fournisseur
    • Pour beaucoup de LLM, Bedrock permet de contrôler dans quel pays les données restent. Par exemple, l’API Claude n’offre pas ce contrôle
      Nous ne travaillons pas depuis les États-Unis, et nous avons des exigences fortes pour que les données restent dans notre pays ; Bedrock fournit ce contrôle
    • C’est intéressant
      Si cette dynamique continue, je me demande comment l’IA va poursuivre sa croissance. Si on part du principe que la plupart des données de valeur sont derrière ce genre de pare-feu, alors les données publiques ont déjà été moissonnées, et il est possible qu’il y ait eu un entraînement sur des données obtenues illégalement. C’est une zone grise
      Est-ce qu’on finira par avoir un écosystème fermé sans entrée externe ?
    • Je me demande comment on peut être certain que les données Bedrock ne sont pas transférées à des prestataires externes
  • Si vous vous demandez pourquoi payer plus cher pour accéder à ces API via AWS plutôt que directement, c’est parce que, dans certaines entreprises, faire approuver un nouveau fournisseur relève quasiment de l’impossible. Si l’entreprise a un contrat AWS, alors il faut utiliser ce qu’AWS propose

    • Attendez, AWS revend l’accès aux serveurs de certaines entreprises d’IA, ou bien AWS exécute les modèles sur son propre matériel ?
    • Même quand l’approbation est possible, cela élargit le périmètre de l’audit de sécurité annuel, ajoute un fournisseur à divulguer dans les évaluations de sécurité, diffuse les données chez un processeur supplémentaire, et ajoute une facture et une discussion budgétaire de plus
      Selon le contrat client, il peut aussi falloir notifier ce nouveau fournisseur au client, ce qui peut déclencher un nouvel examen sécurité. Alors que s’il s’agit juste d’ajouter un modèle de plus dans Bedrock ? C’est beaucoup plus simple
    • Les CEO, conseils d’administration et managers intermédiaires du monde entier sont maintenant obsédés par le jargon de l’IA. J’aurais pensé qu’une demande de contrat direct avec un labo frontier ne se heurterait pas à autant de blocages
  • C’est énorme pour OpenAI. Il y avait bien plus d’entreprises ayant adopté Claude simplement parce qu’il était disponible sur AWS qu’on ne l’imaginait, et maintenant la concurrence devient sérieuse

  • C’est une bonne évolution pour OpenAI, et Anthropic a des raisons de s’inquiéter. À cause de la dépendance à AWS et des exigences de sécurité, Bedrock a longtemps été pour moi la seule façon d’utiliser des modèles de base

    • Claude est déjà proposé à la fois via un passage par les serveurs d’Anthropic depuis AWS, et via Bedrock. https://aws.amazon.com/claude-platform/
      Ils ne doivent pas se réjouir de voir disparaître leur avantage de premier entrant, mais ils s’y attendaient probablement depuis longtemps
  • C’est une bonne nouvelle pour la concurrence
    Claude Code continue de retirer de nouvelles fonctionnalités aux utilisateurs qui passent par Amazon Bedrock. Par exemple le mode automatique, le forfait Ultra, ou Claude for Chrome. Un peu plus de concurrence pourrait les pousser à revoir leur stratégie

    • Ce qui est étrange, c’est que les modèles Claude sur Amazon Bedrock prennent déjà en charge toutes ces fonctionnalités
      Pendant un temps, j’ai créé un émulateur api.anthropic.com pour transférer « discrètement » les requêtes vers Amazon Bedrock. Ça fonctionne bien, et maintenant on peut même utiliser immédiatement des fonctionnalités réservées au fournisseur primaire
    • Le mode automatique fonctionne maintenant aussi sur Bedrock
  • Anthropic devrait sans doute accélérer son IPO. Son énorme envolée de revenus est en pratique le résultat de l’échec du lancement de Gemini et du fait qu’OpenAI était ligoté par son attachement à Azure
    Les modèles Anthropic étaient littéralement la seule API serverless réellement pratique disponible sur AWS, c’est-à-dire les modèles Bedrock. Les gammes récentes Qwen 3.5/3.6 n’ont même pas été lancées. Avec en plus la tendance centrée sur l’efficacité des tokens et le retour sur investissement, j’ai vraiment hâte de voir comment Anthropic terminera le troisième trimestre

  • Les laboratoires frontier fournissent aux hyperscalers des builds de modèles figés qu’ils servent sans collecte de données. Pour la plupart des entreprises qui veulent utiliser des LLM frontier tout en conservant des données sensibles, c’est une condition préalable

  • C’est une mauvaise nouvelle pour Azure. Ils étaient les élus, mais ils n’ont pas su suivre la demande
    Quand OpenAI a quitté son exclusivité en disant qu’Azure n’était pas fiable, on savait déjà que la destination suivante serait AWS