5 points par ironlung 2022-07-19 | 1 commentaires | Partager sur WhatsApp
  1. Amazon « Alexa »
  • En 2019, l’équipe IA d’Alexa a développé des outils de génération de données synthétiques
  • Ces outils ont servi à lancer des versions de l’assistant IA d’Amazon, « Alexa », en hindi, en espagnol utilisé aux États-Unis et en portugais utilisé au Brésil
  • Chez Amazon, les données étaient parfois insuffisantes pour entraîner des modèles de compréhension du langage naturel fiables
  • L’entreprise a donc décidé de créer des données synthétiques pour compenser ce manque
  • L’un des outils de génération de données synthétiques d’Amazon utilise une technique appelée « induction grammaticale »
  • Cette technique analyse un petit nombre de commandes de référence afin d’apprendre des structures générales et des formes sémantiques (patterns)
  • À partir de ces formes, elle génère des milliers de nouvelles phrases similaires
  • Un autre outil crée de nouvelles phrases en recombinant des mots et des expressions issus d’exemples de données disponibles
  1. Technologie Amazon « Just Walk Out »
  • Amazon utilise aussi des données synthétiques pour perfectionner la technologie « Just Walk Out (JWO) »
  • Il s’agit d’une technologie qui permet au client de scanner sa carte bancaire ou une application à l’entrée, puis d’entrer dans le magasin, de prendre les produits qu’il souhaite et de sortir, le paiement étant effectué automatiquement ; elle est notamment connue comme la technologie d’exploitation des magasins sans caisse « Amazon Go »
  • La technologie JWO combine deep learning, computer vision et fusion de capteurs
  • Elle permet de déterminer « qui a pris quoi » dans le magasin
  • Amazon a estimé qu’un jeu de données d’entraînement plus varié était nécessaire pour garantir une meilleure précision des modèles d’IA, et a décidé de le compléter avec des données synthétiques
  • Dans le cadre de la technologie JWO, l’entreprise a construit des jeux de données synthétiques imitant de multiples variantes de scénarios d’achat réalistes
  • Par exemple, Amazon a utilisé des données synthétiques pour générer de nombreux personnages synthétiques afin de garantir que le magasin puisse traiter un grand nombre de clients en même temps
  • L’entreprise a également utilisé des données synthétiques pour créer, à titre de test, un modèle virtuel d’une épicerie plus grande avant d’agrandir la taille réelle du magasin
  1. J.P. Morgan
  • Chez J.P. Morgan, l’équipe de recherche en IA génère des données synthétiques liées à la finance
  • Elle développe des jeux de données synthétiques pour les comportements de lutte contre le blanchiment d’argent, les trajectoires de déplacement des clients, les données d’exécution de marché et les données de paiement destinées à la détection de fraude
  • J.P. Morgan explique que « le secteur des services financiers produit beaucoup de données utiles, mais qu’elles étaient souvent difficiles à exploiter »
  • L’entreprise s’intéresse aux données synthétiques comme moyen d’innover et de construire de nouveaux produits et services fondés sur les données
  • Elle crée des jeux de données synthétiques afin d’accélérer la recherche et le développement de modèles dans les services financiers
  1. Anthem
  • Anthem, entreprise américaine d’assurance santé, collabore avec Google Cloud pour développer une plateforme de données synthétiques
  • L’entreprise prévoit de générer environ 1,5 à 2 pétaoctets de données synthétiques à l’aide d’algorithmes et de modèles statistiques
  • Ces données incluront des jeux de données artificiellement créés contenant des antécédents médicaux, des demandes de remboursement d’assurance maladie et d’autres données médicales essentielles
  • Ces données synthétiques devraient être utilisées pour valider et entraîner des algorithmes d’IA capables d’identifier des demandes de remboursement frauduleuses ou des anomalies dans les dossiers de santé
  • Anthem prévoit de créer une plateforme de données synthétiques afin de mieux détecter la fraude et de fournir un suivi personnalisé à ses adhérents

1 commentaires

 
v08zbv8fvlkjasdflkj 2022-07-19

Il semble que Synthetic data ait été traduit par données synthétiques. Je pense que données artificielles serait plus approprié.