3 points par GN⁺ 4 시간 전 | 1 commentaires | Partager sur WhatsApp
  • Apple Intelligence s’intègre à VoiceOver, Magnifier, Voice Control et Accessibility Reader pour renforcer la description d’images, la navigation en langage naturel et l’aide à la lecture
  • VoiceOver et Magnifier permettent, via Image Explorer et Live Recognition, de poser des questions sur le contenu affiché par la caméra et d’obtenir des réponses, mais il ne faut pas s’y fier dans des situations à haut risque
  • Voice Control permet de naviguer sur iPhone et iPad avec des commandes en langage naturel comme « tap the purple folder », au lieu d’exiger des libellés exacts ou des numéros
  • Pour les vidéos sans sous-titres, des sous-titres générés sur l’appareil s’afficheront automatiquement sur iPhone, iPad, Mac, Apple TV et Apple Vision Pro
  • Apple Vision Pro peut contrôler les systèmes de conduite alternatifs Tolt et LUCI grâce au suivi oculaire, et le Hikawa Grip & Stand est également lancé dans le monde entier

Calendrier de lancement et protection de la vie privée

  • Les nouvelles fonctionnalités et les mises à jour basées sur Apple Intelligence seront disponibles plus tard cette année
  • Apple affirme appliquer Apple Intelligence aux fonctions d’accessibilité tout en maintenant le principe de privacy by design
  • Le Hikawa Grip & Stand for iPhone est lancé sur l’Apple Store en ligne en trois nouvelles couleurs

Exploration des informations visuelles avec VoiceOver et Magnifier

  • VoiceOver et Magnifier décrivent plus en détail les informations à l’écran et l’environnement alentour pour les utilisateurs aveugles ou malvoyants
  • Image Explorer dans VoiceOver fournit, grâce à Apple Intelligence, des descriptions d’images dans l’ensemble du système, notamment pour des photos, des factures numérisées et des documents personnels
  • Grâce à une mise à jour de Live Recognition, les utilisateurs de VoiceOver peuvent appuyer sur le Action button de l’iPhone pour poser des questions sur ce qui apparaît dans le viseur de la caméra et obtenir des réponses
  • Les utilisateurs peuvent enchaîner avec des questions de suivi formulées dans leurs propres mots pour obtenir davantage d’informations visuelles
  • Magnifier propose les mêmes fonctions d’exploration assistée et de description visuelle dans une interface à contraste élevé pour les personnes malvoyantes
  • Magnifier fonctionne aussi avec le Action button, et l’app peut être contrôlée par des requêtes vocales comme « zoom in » ou « turn on flashlight »
  • Il ne faut pas se reposer sur VoiceOver et Magnifier dans des situations où une personne pourrait être blessée ou mise en danger, dans des situations à haut risque, pour l’orientation, ni pour le diagnostic ou le traitement d’un état médical

Saisie en langage naturel dans Voice Control

  • Voice Control utilise Apple Intelligence pour permettre aux personnes en situation de handicap moteur de naviguer plus intuitivement sur iPhone et iPad uniquement avec la voix
  • La nouvelle fonction de saisie flexible permet de décrire en langage naturel les boutons et contrôles visibles à l’écran, au lieu d’utiliser des libellés exacts ou des numéros
  • Cette approche « say what you see » fonctionne dans toutes les apps, y compris celles dont la disposition est visuelle, comme Apple Maps ou Files
  • Parmi les commandes d’exemple figurent « tap the guide about best restaurants » et « tap the purple folder », qui décrivent directement les éléments visibles à l’écran
  • Elle peut aussi contribuer à réduire les obstacles quand les éléments ne sont pas correctement étiquetés pour l’accessibilité
  • Voice Control basé sur Apple Intelligence sera disponible en anglais pour les environnements des États-Unis, du Canada, du Royaume-Uni et de l’Australie

Accessibility Reader et sous-titres générés

  • Accessibility Reader propose une expérience de lecture personnalisée pour les utilisateurs présentant différents handicaps, de la dyslexie à la basse vision
  • Avec Apple Intelligence, il peut aussi traiter des documents source plus complexes, comme des articles scientifiques
  • Il peut gérer des textes comportant plusieurs colonnes, des images et des tableaux
  • Le résumé à la demande permet de consulter d’abord une vue d’ensemble d’un document avant d’en lire les détails
  • La nouvelle traduction intégrée permet de lire un texte dans sa langue maternelle tout en conservant la mise en forme personnalisée, les polices et les couleurs
  • Les nouveaux sous-titres générés affichent automatiquement une transcription de l’audio parlé dans les vidéos dépourvues de légendes ou de sous-titres
  • Cela inclut des clips enregistrés avec un iPhone, des vidéos reçues d’amis ou de membres de la famille, ainsi que des vidéos en streaming en ligne
  • Les sous-titres sont générés de façon privée grâce à la reconnaissance vocale sur l’appareil et s’affichent automatiquement sur les vidéos sans sous-titres sur iPhone, iPad, Mac, Apple TV et Apple Vision Pro
  • L’apparence des sous-titres peut être personnalisée dans le menu de lecture vidéo ou dans Settings
  • Les sous-titres générés seront disponibles en anglais pour les environnements des États-Unis et du Canada

Contrôle d’un fauteuil roulant électrique avec Apple Vision Pro

  • Certains utilisateurs de fauteuils roulants électriques ne peuvent pas conduire avec un joystick, et des commandes de conduite alternatives peuvent alors être essentielles à une mobilité autonome
  • Le système de suivi oculaire de haute précision d’Apple Vision Pro sert de méthode d’entrée réactive pour les systèmes de conduite alternatifs compatibles
  • Le suivi oculaire de Vision Pro ne nécessite pas de recalibrages fréquents et fonctionne dans diverses conditions d’éclairage
  • Cette fonctionnalité est lancée aux États-Unis avec les systèmes de conduite alternatifs Tolt et LUCI
  • La prise en charge des accessoires comprend à la fois le Bluetooth et la connexion filaire, cette dernière nécessitant l’achat d’un Apple Vision Pro Developer Strap
  • Apple prévoit de continuer à collaborer avec les développeurs afin de prendre en charge davantage de systèmes de conduite pour fauteuil roulant
  • Cette fonctionnalité et Apple Vision Pro sont destinés à être utilisés dans un environnement contrôlé ; davantage d’informations sont disponibles sur support.apple.com/en-us/118507
  • Pat Dolan, qui vit avec la SLA depuis dix ans, déclare que la possibilité de contrôler lui-même son fauteuil roulant électrique est pour lui « de l’or »

Hikawa Grip & Stand for iPhone

  • Hikawa Grip & Stand for iPhone est lancé dans le monde entier sur l’Apple Store en ligne et proposé en trois nouvelles couleurs
  • Il s’agit d’un accessoire MagSafe conçu avec l’accessibilité à l’esprit par le designer de Los Angeles Bailey Hikawa
  • Des personnes présentant divers handicaps affectant la préhension, la force et la mobilité ont participé à son développement
  • C’est à la fois une poignée adaptative et un support, pensés pour aider chacun à tenir son iPhone de la manière qui lui convient le mieux
  • Cette collaboration entre Hikawa et PopSockets rend cet accessoire adaptatif disponible dans le monde entier pour la première fois
  • Une session Today at Apple réunissant Hikawa, Shane Burcaw et Alex Barone se tiendra à l’Apple The Grove de Los Angeles
  • Les pays où l’achat est possible sont Australia, Austria, Belgium, Canada, China, Denmark, France, Hong Kong, Italy, Japan, the Netherlands, Singapore, South Korea, Spain, Sweden, Switzerland, Taiwan, the United Arab Emirates, the UK et the U.S., avec achat possible sur apple.com

Autres mises à jour d’accessibilité

  • Vehicle Motion Cues arrive sur visionOS pour aider à réduire le mal des transports lorsqu’on utilise Apple Vision Pro comme passager dans un véhicule en mouvement
  • Vision Pro prend en charge des gestes du visage permettant d’effectuer des taps et des actions système
  • Vision Pro ajoute aussi une nouvelle façon de sélectionner des éléments avec les yeux pendant l’utilisation de Dwell Control
  • Touch Accommodations offre une nouvelle manière de personnaliser les réglages iOS et iPadOS
  • Les Made for iPhone hearing aids assurent un jumelage et un handoff plus fiables entre appareils Apple sur iOS, iPadOS, macOS et visionOS, avec une expérience de configuration améliorée
  • La prise en charge de Larger Text est ajoutée à tvOS afin que les spectateurs malvoyants puissent augmenter la taille du texte à l’écran pour le lire plus facilement
  • Name Recognition permet aux personnes sourdes ou malentendantes de recevoir une alerte lorsque quelqu’un prononce leur nom, et fonctionne dans plus de 50 langues à travers le monde
  • Une nouvelle API pour les développeurs d’apps d’interprétation en langue des signes permet aux utilisateurs d’ajouter un interprète humain à un appel vidéo FaceTime en cours
  • Le Sony Access controller peut être connecté comme manette de jeu sur iOS, iPadOS et macOS
  • Sur le Sony Access controller, il est possible de configurer le joystick, les 9 boutons intégrés et jusqu’à 4 boutons externes supplémentaires ou interrupteurs spécialisés afin de personnaliser la disposition
  • Les utilisateurs peuvent combiner deux contrôleurs pour créer une expérience de jeu encore plus personnalisée

Langues prises en charge et restrictions régionales

  • Apple Intelligence est proposé en bêta, avec comme langues prises en charge English, Danish, Dutch, French, German, Italian, Norwegian, Portuguese, Spanish, Swedish, Turkish, Vietnamese, Chinese (simplified), Chinese (traditional), Japanese et Korean
  • Certaines fonctionnalités peuvent ne pas être disponibles dans toutes les régions ou dans toutes les langues
  • La disponibilité des fonctionnalités et des langues, ainsi que la configuration système requise, peuvent être consultées sur support.apple.com/en-us/121115

1 commentaires

 
GN⁺ 4 시간 전
Commentaires sur Hacker News
  • Apple aime glisser de nouvelles technologies dans des endroits anodins pour les tester discrètement au grand jour, donc lancer d’abord une IA agentique comme fonctionnalité d’accessibilité paraît très typique d’Apple
    La Touch Bar n’était pas juste une simple bande OLED, c’était le premier mouvement vers la transition du Mac vers Apple Silicon, et la puce Apple T1 du MacBook Touch Bar de 2016 était le premier processeur entièrement conçu par Apple dans un Mac
    Elle reprenait au chipset Intel des rôles comme la gestion de l’alimentation, des ventilateurs, de la veille/réveil, de l’accès à la caméra et au micro, ainsi que le Secure Enclave pour Touch ID, puis la T2 a ensuite pris en charge le chiffrement du SSD, la gestion audio, le traitement d’image de la caméra et même la protection du processus de démarrage contre les altérations
    L’iPhone 3G était livré avec un outil d’éjection de SIM en Liquidmetal, un alliage métallique sur mesure presque impossible à plier à la main, et même si Apple n’a pas sorti ensuite de produit utilisant cet alliage, il y a des rumeurs, près de 20 ans plus tard, sur l’usage de métal liquide dans un iPhone pliable
    RealityKit aussi proposait depuis des années la numérisation 3D et diverses fonctions AR dont le sens n’est devenu clair qu’avec l’arrivée de l’Apple Vision Pro

    • Ça me paraît surinterprété, on dirait simplement des tentatives ratées de commercialisation
      Les gens détestaient la Touch Bar, et elle n’est devenue intéressante que plusieurs années plus tard, quand des passionnés l’ont bidouillée et configurée pour lui ajouter des fonctions plus poussées
      Fabriquer un outil d’éjection de SIM dans un alliage coûteux n’avait pas beaucoup de sens, et RealityKit comme Vision donnent l’impression d’être des solutions en quête de problème, Vision lui-même étant en train de sombrer
      3D Touch avait aussi des problèmes de découvrabilité et d’utilisabilité, et les exemples du genre ne manquent pas
    • Le premier modem maison d’Apple a aussi été lancé d’abord sur l’iPhone 16e, la gamme la moins chère
    • “liquid metal”, ça sonne bien, mais il s’agit probablement surtout de verre métallique
      Ces matériaux existent depuis des décennies, et pourtant ils finissent presque par paraître synonymes de la marque Apple, ce que je trouve assez agaçant
      S’ils ne sont pas plus utilisés, c’est surtout parce qu’ils coûtent très cher, mais quand on est dans une position comme Apple avec une demande garantie de dizaines de millions de pièces, il est bien plus facile d’en rendre l’économie viable
    • Je me demande si “LiquidMetal” apportait vraiment quelque chose de plus qu’un bon alliage d’aluminium
    • Les futures lunettes connectées d’Apple pourraient offrir une bien meilleure expérience utilisateur dans presque toutes les situations où, dans la vidéo, l’utilisateur devait lever son iPhone
      J’ai lu que, pour filmer ou prendre des photos, la lentille s’allumerait ou clignoterait de manière plus visible que chez Meta, ce qui pourrait aider sur les questions de confidentialité, et au moins ce ne serait pas Meta
      J’aime bien les lunettes connectées de Meta, mais mes deux paires sont tombées en panne et il n’y a aucun magasin où obtenir de l’assistance, donc si Apple sort un produit, je passerai probablement vite chez eux
  • Du point de vue d’un développeur, les API d’accessibilité au niveau du système d’exploitation chez Apple sont vraiment excellentes
    Là où ça casse, c’est à la frontière entre WebKit et l’application native
    J’ai distribué une application Tauri avec l’éditeur Monaco intégré dans un WKWebView, et j’ai découvert à la dure que le mode accessibilitySupport: auto de VoiceOver cassait discrètement la sélection de texte vers l’arrière dans Monaco
    Il fallait le régler sur "off" pour que la sélection fonctionne correctement, et au final il fallait choisir entre une sélection de texte normale et le support de VoiceOver, et la réponse a été la sélection de texte
    C’est solide dans AppKit/UIKit, mais ça s’effondre à la frontière du WebView embarqué où la plupart des applis desktop actuelles finissent en pratique par vivre

  • Il y a longtemps, je me suis inscrit à Be My Eyes en tant que personne voyante
    Je n’ai pas reçu autant d’appels que je l’espérais, mais j’ai pu aider quelques fois, et c’était agréable
    J’ai déjà lu une enveloppe, lu un flacon de médicament, et aidé deux types assez drôles assis dans de gros fauteuils moelleux avec un sac de courses rempli de boîtes de céréales à identifier une par une
    Je me souviens que l’un d’eux détestait vraiment une variété en particulier
    Cette appli avait une fonction unique permettant à la personne voyante d’activer l’appareil photo de la personne malvoyante
    https://www.bemyeyes.com

    • J’ai toujours l’appli Be My Eyes installée, mais je n’ai pas reçu d’appel depuis plus d’un an, ce qui semble bien montrer à quel point les modèles de vision par IA sont devenus puissants
      Je trouve ça formidable que l’IA fonctionne assez bien pour que les personnes aveugles puissent résoudre leurs problèmes elles-mêmes
      Cela dit, il y avait aussi quelque chose de très humain et agréable dans le fait d’aider de temps en temps un inconnu pour une petite tâche aléatoire
      Je garde un très bon souvenir d’une vieille dame qui avait renversé une boîte de myrtilles sur le sol de sa cuisine, et je l’avais aidée à toutes les retrouver en lui donnant des indications
      C’étaient dix minutes amusantes passées à être connecté à une inconnue, et quatre ans plus tard j’en garde encore un souvenir chaleureux
    • Il me semble qu’avec l’arrivée des fonctions d’IA dans Be My Eyes, le besoin de bénévoles a énormément diminué
      En tant que personne totalement aveugle, j’ai commencé à utiliser l’appli après l’ajout de l’IA, et elle marche très bien pour lire les étiquettes alimentaires après que les enfants ont déplacé des choses, ou pour vérifier si la télé est allumée
      Si je vivais encore seul, j’utiliserais probablement aussi la fonction avec les bénévoles, mais ce n’est plus le cas aujourd’hui
    • Il y a toujours eu bien plus de gens voulant aider que de gens ayant besoin d’aide
      C’est une bonne chose, et je ne vais pas m’en plaindre, mais je m’étais inscrit il y a des années, je n’ai jamais reçu un seul appel et j’ai fini par supprimer l’appli
    • Je me demande qui appelait. Des personnes aveugles ?
  • Une chose qu’Apple devrait vraiment réussir, c’est la reconnaissance vocale
    Ils ont très bien travaillé sur beaucoup d’aspects de l’accessibilité, mais sur la transcription vocale, j’ai l’impression qu’ils ont au moins 5 ans de retard, sinon 10
    La saisie sur iPhone est horrible ces temps-ci
    Le rejet des contacts accidentels de la paume est clairement pire qu’avant, donc les fautes de frappe sont plus fréquentes, et l’algorithme d’autocorrection est aussi moins bon qu’avant, au point de remplacer souvent à tort des mots plusieurs positions avant l’endroit où je suis en train de taper
    La reconnaissance vocale ne s’est pas améliorée non plus, et la forme même du téléphone fatigue les doigts
    J’aimerais qu’utiliser un iPhone ne soit plus une corvée

    • Wispr Flow est un excellent exemple de reconnaissance vocale bien faite
      À côté, la solution d’Apple donne l’impression de venir du siècle dernier
      C’est pareil pour la synthèse vocale d’Apple, alors qu’ElevenLabs et OpenAI ont une énorme avance
      Tout ce qu’il faut, c’est que l’iPhone prenne en charge ce genre de choses nativement avec la même qualité, parce que dans l’écosystème fermé d’Apple, il faut que ça soit natif pour pouvoir l’utiliser partout
    • Tant que Siri ne saura pas gérer de façon fiable “Navigate to ” avec des cartes téléchargées à l’avance et utilisables hors ligne, je considérerai toute fonction plus ambitieuse de transcription vocale ou de conversation comme du pur mirage
      Hier, j’ai encore découvert une autre horrible “fonction” de saisie sur iPhone
      Si, dans une appli CarPlay tierce, on parcourt une liste et qu’on appuie sur l’accélérateur juste avant de toucher un élément pour le sélectionner, la liste se réduit à seulement quelques éléments et remonte en haut
      Formidable moyen de réduire les distractions au volant. La prochaine étape, c’est quoi, changer la destination sur la carte dès que la voiture bouge ?
      J’aimerais que la recherche en interaction humain-machine soit davantage appliquée, et je pense que quand on fait des choses aussi stupides, comme dans l’écosystème automobile/CarPlay, on devrait en répondre devant les tribunaux
      J’ai déjà conduit une voiture qui cachait systématiquement la caméra de recul derrière un avertissement légal, et je suis certain qu’au moins un piéton s’est déjà fait renverser en marche arrière pendant que cet écran était affiché
      Les fabricants devraient être tenus pour 100 % responsables de ce genre de mauvaises décisions d’UI
    • Ce qui a beaucoup aidé à corriger le clavier de l’iPhone chez moi, ça a été de désactiver Slide to Type
      J’ai aussi appris cette astuce sur HN
      Il suffit d’ouvrir Réglages, de toucher General, puis de descendre vers Keyboard et de désactiver Slide to Type
    • Chaque jour, toute la journée, l’iPhone me donne l’impression d’être idiot
      Je dois corriger presque un mot sur deux de ce que je tape, ou de ce que l’iPhone croit que j’ai tapé
      Et pendant que je corrige, l’autocorrection invente de nouvelles fautes encore plus incompréhensibles
      Par moments, ça atteint un niveau de folie digne d’un rêve fiévreux où l’on n’arrive soudain plus à faire les choses les plus ordinaires
      Le pire, c’est qu’avant, ça allait
      Sur l’iPhone 4S, je tapais avec une vitesse et une précision proches d’un vrai clavier complet
    • Depuis que Colin Hughes a recensé les problèmes de Voice Control il y a quelques années, je n’ai pas l’impression que ça se soit beaucoup amélioré
      https://www.theregister.com/on-prem/2023/08/16/those-who-rel...
      J’aimerais au moins qu’ils corrigent deux gros bugs
      Même là où c’est censé être pris en charge, la saisie échoue de façon apparemment aléatoire, et beaucoup d’applis de grands éditeurs, comme OneNote, ne prennent pas du tout en charge la dictée
      Dans ces cas-là, il devrait au moins exister une voie de secours, comme Dragon Dictate il y a des décennies
      La capitalisation reste elle aussi aléatoire, donc il y a encore beaucoup d’erreurs à corriger
      Apple semble considérer l’accessibilité moins comme une vraie fonctionnalité que comme un sujet utile pour rédiger de beaux communiqués de presse
  • Fait amusant : cette vidéo est rendue accessible pour des personnes voyantes
    Si quelqu’un était réellement aveugle, personne n’écouterait une voix à cette vitesse, et quand on voit comment des personnes aveugles utilisent un ordinateur, on est souvent stupéfait par leur capacité à écouter de l’audio à des vitesses qu’on imagine à peine

    • https://youtu.be/wKISPePFrIs?si=ahGfFp0U7-pTU9w6&t=43
      L’exemple que je donne souvent, c’est cette vidéo où l’ingénieur logiciel aveugle de Microsoft, Saqib Shaikh, présente Visual Studio
      Le lien pointe directement vers le bon moment
    • Il y a longtemps, je travaillais dans l’informatique dans un centre communautaire, et le directeur du centre était aveugle
      J’étais absolument sidéré par la vitesse à laquelle son lecteur d’écran lisait le contenu, c’était totalement incompréhensible pour moi
      Son efficacité avec les raccourcis clavier aurait fait rougir même l’élite de vim/emacs
    • C’est probablement parce que c’est une pub
      Une voix robotique très rapide peut paraître assez rude et agaçante, et même les personnes aveugles qui en dépendent peuvent parfois se sentir surstimulées par ça
    • Oui. Ce n’est pas seulement rapide, c’est aussi souvent une voix très robotique, au point que beaucoup de voyants ont du mal à comprendre même à vitesse 1,5x
      J’ai lu des choses sur des personnes aveugles qui ont appris l’écholocalisation sonore, et ça ressemble vraiment à un super-pouvoir fascinant, au point de me donner envie de débrancher mon moniteur un jour et d’apprendre à utiliser correctement les outils
      Une collègue aveugle avec qui j’ai travaillé il y a quelques années gardait toujours son écran éteint, donc la batterie de son portable tenait presque deux fois plus longtemps que celle du reste de l’équipe, ce qui en faisait déjà une excellente fonctionnalité
      Même sans atteindre un niveau incroyable d’écholocalisation, faire la moitié de ça serait déjà génial, avec en bonus la possibilité de réellement faire de la QA sur les changements d’accessibilité
    • Il y a 20 ans, je faisais du support technique de niveau 1 au téléphone, et il m’a fallu environ 3,2 secondes pour comprendre que j’avais affaire à une personne aveugle, et tout aussi vite pour réaliser que grâce à son lecteur d’écran, cela ne constituait absolument pas un handicap pour utiliser son ordinateur
  • Ça ressemble à une application vraiment utile des LLM
    J’aimerais que davantage d’entreprises se concentrent sur la manière d’aider les gens, plutôt que sur le remplacement des humains ou l’optimisation à l’extrême au nom de la productivité

    • Je préfère suspendre mon jugement jusqu’à ce que cela arrive réellement entre les mains des personnes que ça pourrait aider
      Mon expérience se limite à des parents âgés dont la vue a baissé, mais quand on règle la taille de texte à ce qu’Apple autorise, le téléphone devient illisible
      Dans toutes les applis, qu’elles soient de première partie ou tierces, le texte déborde de l’écran
      Dans l’exemple de la facture, on dit à l’utilisateur de vérifier auprès du fournisseur, mais je ne comprends pas pourquoi on ne lui propose pas simplement d’appeler le numéro indiqué sur la facture
      Pourquoi lui dire d’utiliser la détection de texte au lieu de le faire directement ? Apple Intelligence est censé en avoir déjà la capacité
      J’ai peur que, dans le meilleur des cas, cela ne reste qu’une fonction gadget
      Cela dit, la poignée a l’air bien, et j’espère qu’ils ne vont pas lui ajouter la taxe Apple
    • C’est exactement ce qu’Apple fait le mieux
      Traiter le développement d’une nouvelle industrie comme une technologie et non comme le produit lui-même
      L’IA ne sera pas le produit lui-même, mais une fonctionnalité qui améliore l’expérience client
    • D’accord. Même vu de l’extérieur, ce domaine semble plein de potentiel
      J’espère simplement vraiment que ce problème évoqué dans un précédent billet (https://news.ycombinator.com/item?id=48178378) ne va pas devenir plus fréquent au point de mettre en danger ce genre de fonctions utiles
      À court terme, cela paraît peu probable, mais à mesure que les usages se multiplient, les acteurs malveillants risquent eux aussi de se multiplier
    • Ça passe par des serveurs ? Je me demande si on confie sa vie à un iPhone, ou si on la confie à un datacenter
    • Honnêtement, il suffit de comparer l’argent qu’une entreprise peut gagner en aidant les personnes aveugles avec celui qu’elle peut gagner en remplaçant des développeurs logiciels et des analystes financiers
      Il est louable qu’Apple aide des gens dans le besoin avec ce genre de technologie
      Mais il ne faut pas faire semblant de ne pas comprendre pourquoi la plupart des entreprises ne se lancent pas dans cette direction
      Franchement, tout le monde connaît très bien la raison, et ce genre de sujet finit toujours par être laissé à ce vague “quelqu’un d’autre”
  • J’ai l’impression que tout le monde a sauté ce point, mais le contrôle par le regard pour fauteuils roulants électriques paraît être une excellente idée
    C’est peut-être juste moi, et peut-être que c’est déjà une vieille idée
    La VR complète n’a pas vraiment décollé, mais ça me fait toujours me demander s’il n’existe pas un marché pour des appareils plus légers et plus fins
    Si ça tient dans des lunettes de taille normale, ça pourrait vraiment m’intéresser comme dispositif de contrôle par le regard
    Avec un système HUD, ce serait encore plus intéressant, même à un niveau très basique qui n’afficherait que quelques symboles
    Un peu d’audio de base serait encore mieux, mais préserver une forme de lunettes normales m’importe plus qu’un HUD ou que l’audio

    • C’est une technologie qui existe déjà depuis un moment
      En suivant le lien de la source référencée, on tombe sur des exemples comme https://www.tolt.tech
      Ce qui est intéressant, c’est qu’Apple l’a intégrée au système d’exploitation
    • Ça ressemble fortement à un signal indiquant qu’ils continuent à développer des lunettes AR
      On a vraiment l’impression que c’est l’une de ces fonctionnalités qu’Apple sort d’abord pour l’affiner avant que le matériel final soit prêt
  • Le montant total dû sur la facture est de 83,89 $. Vérifiez ce montant auprès de votre fournisseur d’électricité avant de payer ou utilisez Text Detection pour le confirmer

    1. L’IA détermine le montant de la facture
    2. On appelle les gens qui ont émis la facture pour leur demander combien ils ont facturé
    3. On paie le montant facturé
    • Le simple fait d’obtenir l’information immédiatement et de pouvoir la vérifier ensuite reste utile
      Demander à une personne de confiance de lire le chiffre peut être préférable à appeler l’entreprise, mais tout le monde n’a pas forcément cette possibilité
    • Après quelques mois à payer la même facture, on finit par savoir à peu près combien coûte son abonnement téléphonique, donc il n’y aura probablement pas besoin de faire ça à chaque fois
      Cette phrase est évidemment une mention obligatoire, un peu comme quand ChatGPT met en bas de page “vérifiez tout ce que nous vous disons”
    • J’imagine qu’appeler le support client est au moins tout aussi frustrant pour une personne handicapée que pour n’importe qui d’autre
    • Cela pourrait être utile si le système se souvenait de la facture, mettons, pendant 60 jours, et indiquait aussi le taux de variation par rapport à la facture précédente
      Quelque chose comme : “Le montant total dû sur cette facture est de 83,89 $, soit 4 % de plus que la facture du mois dernier du même fournisseur.”
  • Je trouve dommage qu’Apple ait retiré dans la version YouTube de la publicité l’indication du lecteur d’écran “the Apple logo”
    https://www.youtube.com/watch?v=B3SmsSCvoss
    À mon avis, c’était ce détail qui faisait ressortir la pub

    • Il suffit de changer la langue audio en "English descriptive"
  • Honnêtement, en tant que personne aveugle et développeur aveugle, la plupart de ces fonctionnalités me laissent au mieux assez froid
    Des applis tierces comme Seeing AI, Envision AI, BeMyEyes et Aira font déjà la plupart de ces choses
    Donc au mieux, cela fera la même chose qu’elles, plus vite et en local sur l’appareil, mais cela peut aussi vouloir dire moins de précision, donc il faudra voir
    Pendant ce temps, VoiceOver, le lecteur d’écran de macOS, est en pratique laissé en mode maintenance, et les utilisateurs ont dû créer eux-mêmes des solutions tierces assez impressionnantes pour ajouter des fonctionnalités que le lecteur d’écran équivalent sous Windows possède depuis longtemps
    Vu sous cet angle, tout cela paraît un peu démonstratif, mais je peux quand même avoir une bonne surprise
    Ce qui m’intéresse un peu plus, ce sont les améliorations de Voice Control
    Parce qu’essayer de deviner le nom programmatique d’un bouton ou devoir constamment utiliser une grille numérotée pour viser des éléments n’a rien d’agréable
    Concernant la vitesse de voix, il faut énormément de pratique pour la pousser très haut, et changer de voix demande aussi un certain réentraînement
    Les voix plus “humaines” sont souvent plus difficiles à suivre à très haute vitesse, donc beaucoup de gens préfèrent des voix plus robotiques mais plus régulières, et ne sont pas encore convaincus par le TTS basé sur l’IA
    Ces voix ont souvent tendance à s’effondrer quand on augmente trop le débit
    La question d’attendre le jugement des véritables personnes concernées est vraiment essentielle
    De plus en plus d’entreprises et d’individus parlent d’accessibilité, créent des solutions d’accessibilité et évangélisent l’IA pour l’accessibilité, sans jamais parler aux personnes qu’ils prétendent aider
    Dans ces conditions, les erreurs sont presque garanties, et dans le pire des cas cela peut faire plus de mal que de bien
    Pour bien faire l’accessibilité, y compris avec des produits IA, il faut embaucher des personnes qui ont une véritable expérience vécue
    Sinon on obtient des textes traduits automatiquement, une sécurité anti-hacker en un clic, ou des bars à café pilotés par IA qui commandent des milliers de gants en caoutchouc
    Au passage, j’ai justement un peu de temps pour un nouveau projet en ce moment :P

    • D’accord. Si la situation n’a pas changé dans l’heure qui a suivi ma première lecture de ce billet, alors c’est ici le premier commentaire de tête d’une personne réellement aveugle ou malvoyante
      En tant que personne qui passe d’une vue “mauvaise mais corrigeable” à une basse vision, cela m’a aussi été utile
      Je ne connaissais pas ces applis, et c’est exactement le genre de technologie d’assistance que je cherchais
    • C’est rassurant d’entendre quelqu’un que je n’ai jamais rencontré arriver aux mêmes conclusions que nous
      Apple donne l’impression de fabriquer ce genre de produits sans avoir jamais parlé à des personnes réellement concernées par le problème
      Fait amusant, nous sommes en train de construire un concurrent des applis tierces mentionnées, et mon collègue a une grande expérience du sujet parce qu’il a un parent aveugle
      Nous avons bien un MVP en ligne, mais il n’est pas encore extraordinaire, et je n’ai pas envie d’être “la personne qui dit hé, on a fait cette appli, au fait”
    • C’est bien d’avoir un point de vue de première main
      Il y a juste une chose qui me trouble : le passage où tu sembles penser que le traitement sur l’appareil pourrait être un gadget
      Naïvement, j’aurais pensé que c’était un gros avantage, parce que cela veut dire que ça fonctionne toujours, indépendamment du réseau mobile
      Donc utilisable dans le métro, en avion, dans des endroits isolés, etc.
      Par ailleurs, je serais curieux de savoir quelle appli fait le plus de différence dans ton quotidien