- Apple Intelligence s’intègre à VoiceOver, Magnifier, Voice Control et Accessibility Reader pour renforcer la description d’images, la navigation en langage naturel et l’aide à la lecture
- VoiceOver et Magnifier permettent, via Image Explorer et Live Recognition, de poser des questions sur le contenu affiché par la caméra et d’obtenir des réponses, mais il ne faut pas s’y fier dans des situations à haut risque
- Voice Control permet de naviguer sur iPhone et iPad avec des commandes en langage naturel comme « tap the purple folder », au lieu d’exiger des libellés exacts ou des numéros
- Pour les vidéos sans sous-titres, des sous-titres générés sur l’appareil s’afficheront automatiquement sur iPhone, iPad, Mac, Apple TV et Apple Vision Pro
- Apple Vision Pro peut contrôler les systèmes de conduite alternatifs Tolt et LUCI grâce au suivi oculaire, et le Hikawa Grip & Stand est également lancé dans le monde entier
Calendrier de lancement et protection de la vie privée
- Les nouvelles fonctionnalités et les mises à jour basées sur Apple Intelligence seront disponibles plus tard cette année
- Apple affirme appliquer Apple Intelligence aux fonctions d’accessibilité tout en maintenant le principe de privacy by design
- Le Hikawa Grip & Stand for iPhone est lancé sur l’Apple Store en ligne en trois nouvelles couleurs
Exploration des informations visuelles avec VoiceOver et Magnifier
- VoiceOver et Magnifier décrivent plus en détail les informations à l’écran et l’environnement alentour pour les utilisateurs aveugles ou malvoyants
- Image Explorer dans VoiceOver fournit, grâce à Apple Intelligence, des descriptions d’images dans l’ensemble du système, notamment pour des photos, des factures numérisées et des documents personnels
- Grâce à une mise à jour de Live Recognition, les utilisateurs de VoiceOver peuvent appuyer sur le Action button de l’iPhone pour poser des questions sur ce qui apparaît dans le viseur de la caméra et obtenir des réponses
- Les utilisateurs peuvent enchaîner avec des questions de suivi formulées dans leurs propres mots pour obtenir davantage d’informations visuelles
- Magnifier propose les mêmes fonctions d’exploration assistée et de description visuelle dans une interface à contraste élevé pour les personnes malvoyantes
- Magnifier fonctionne aussi avec le Action button, et l’app peut être contrôlée par des requêtes vocales comme « zoom in » ou « turn on flashlight »
- Il ne faut pas se reposer sur VoiceOver et Magnifier dans des situations où une personne pourrait être blessée ou mise en danger, dans des situations à haut risque, pour l’orientation, ni pour le diagnostic ou le traitement d’un état médical
Saisie en langage naturel dans Voice Control
- Voice Control utilise Apple Intelligence pour permettre aux personnes en situation de handicap moteur de naviguer plus intuitivement sur iPhone et iPad uniquement avec la voix
- La nouvelle fonction de saisie flexible permet de décrire en langage naturel les boutons et contrôles visibles à l’écran, au lieu d’utiliser des libellés exacts ou des numéros
- Cette approche « say what you see » fonctionne dans toutes les apps, y compris celles dont la disposition est visuelle, comme Apple Maps ou Files
- Parmi les commandes d’exemple figurent « tap the guide about best restaurants » et « tap the purple folder », qui décrivent directement les éléments visibles à l’écran
- Elle peut aussi contribuer à réduire les obstacles quand les éléments ne sont pas correctement étiquetés pour l’accessibilité
- Voice Control basé sur Apple Intelligence sera disponible en anglais pour les environnements des États-Unis, du Canada, du Royaume-Uni et de l’Australie
Accessibility Reader et sous-titres générés
- Accessibility Reader propose une expérience de lecture personnalisée pour les utilisateurs présentant différents handicaps, de la dyslexie à la basse vision
- Avec Apple Intelligence, il peut aussi traiter des documents source plus complexes, comme des articles scientifiques
- Il peut gérer des textes comportant plusieurs colonnes, des images et des tableaux
- Le résumé à la demande permet de consulter d’abord une vue d’ensemble d’un document avant d’en lire les détails
- La nouvelle traduction intégrée permet de lire un texte dans sa langue maternelle tout en conservant la mise en forme personnalisée, les polices et les couleurs
- Les nouveaux sous-titres générés affichent automatiquement une transcription de l’audio parlé dans les vidéos dépourvues de légendes ou de sous-titres
- Cela inclut des clips enregistrés avec un iPhone, des vidéos reçues d’amis ou de membres de la famille, ainsi que des vidéos en streaming en ligne
- Les sous-titres sont générés de façon privée grâce à la reconnaissance vocale sur l’appareil et s’affichent automatiquement sur les vidéos sans sous-titres sur iPhone, iPad, Mac, Apple TV et Apple Vision Pro
- L’apparence des sous-titres peut être personnalisée dans le menu de lecture vidéo ou dans Settings
- Les sous-titres générés seront disponibles en anglais pour les environnements des États-Unis et du Canada
Contrôle d’un fauteuil roulant électrique avec Apple Vision Pro
- Certains utilisateurs de fauteuils roulants électriques ne peuvent pas conduire avec un joystick, et des commandes de conduite alternatives peuvent alors être essentielles à une mobilité autonome
- Le système de suivi oculaire de haute précision d’Apple Vision Pro sert de méthode d’entrée réactive pour les systèmes de conduite alternatifs compatibles
- Le suivi oculaire de Vision Pro ne nécessite pas de recalibrages fréquents et fonctionne dans diverses conditions d’éclairage
- Cette fonctionnalité est lancée aux États-Unis avec les systèmes de conduite alternatifs Tolt et LUCI
- La prise en charge des accessoires comprend à la fois le Bluetooth et la connexion filaire, cette dernière nécessitant l’achat d’un Apple Vision Pro Developer Strap
- Apple prévoit de continuer à collaborer avec les développeurs afin de prendre en charge davantage de systèmes de conduite pour fauteuil roulant
- Cette fonctionnalité et Apple Vision Pro sont destinés à être utilisés dans un environnement contrôlé ; davantage d’informations sont disponibles sur support.apple.com/en-us/118507
- Pat Dolan, qui vit avec la SLA depuis dix ans, déclare que la possibilité de contrôler lui-même son fauteuil roulant électrique est pour lui « de l’or »
Hikawa Grip & Stand for iPhone
- Hikawa Grip & Stand for iPhone est lancé dans le monde entier sur l’Apple Store en ligne et proposé en trois nouvelles couleurs
- Il s’agit d’un accessoire MagSafe conçu avec l’accessibilité à l’esprit par le designer de Los Angeles Bailey Hikawa
- Des personnes présentant divers handicaps affectant la préhension, la force et la mobilité ont participé à son développement
- C’est à la fois une poignée adaptative et un support, pensés pour aider chacun à tenir son iPhone de la manière qui lui convient le mieux
- Cette collaboration entre Hikawa et PopSockets rend cet accessoire adaptatif disponible dans le monde entier pour la première fois
- Une session Today at Apple réunissant Hikawa, Shane Burcaw et Alex Barone se tiendra à l’Apple The Grove de Los Angeles
- Les pays où l’achat est possible sont Australia, Austria, Belgium, Canada, China, Denmark, France, Hong Kong, Italy, Japan, the Netherlands, Singapore, South Korea, Spain, Sweden, Switzerland, Taiwan, the United Arab Emirates, the UK et the U.S., avec achat possible sur apple.com
Autres mises à jour d’accessibilité
- Vehicle Motion Cues arrive sur visionOS pour aider à réduire le mal des transports lorsqu’on utilise Apple Vision Pro comme passager dans un véhicule en mouvement
- Vision Pro prend en charge des gestes du visage permettant d’effectuer des taps et des actions système
- Vision Pro ajoute aussi une nouvelle façon de sélectionner des éléments avec les yeux pendant l’utilisation de Dwell Control
- Touch Accommodations offre une nouvelle manière de personnaliser les réglages iOS et iPadOS
- Les Made for iPhone hearing aids assurent un jumelage et un handoff plus fiables entre appareils Apple sur iOS, iPadOS, macOS et visionOS, avec une expérience de configuration améliorée
- La prise en charge de Larger Text est ajoutée à tvOS afin que les spectateurs malvoyants puissent augmenter la taille du texte à l’écran pour le lire plus facilement
- Name Recognition permet aux personnes sourdes ou malentendantes de recevoir une alerte lorsque quelqu’un prononce leur nom, et fonctionne dans plus de 50 langues à travers le monde
- Une nouvelle API pour les développeurs d’apps d’interprétation en langue des signes permet aux utilisateurs d’ajouter un interprète humain à un appel vidéo FaceTime en cours
- Le Sony Access controller peut être connecté comme manette de jeu sur iOS, iPadOS et macOS
- Sur le Sony Access controller, il est possible de configurer le joystick, les 9 boutons intégrés et jusqu’à 4 boutons externes supplémentaires ou interrupteurs spécialisés afin de personnaliser la disposition
- Les utilisateurs peuvent combiner deux contrôleurs pour créer une expérience de jeu encore plus personnalisée
Langues prises en charge et restrictions régionales
- Apple Intelligence est proposé en bêta, avec comme langues prises en charge English, Danish, Dutch, French, German, Italian, Norwegian, Portuguese, Spanish, Swedish, Turkish, Vietnamese, Chinese (simplified), Chinese (traditional), Japanese et Korean
- Certaines fonctionnalités peuvent ne pas être disponibles dans toutes les régions ou dans toutes les langues
- La disponibilité des fonctionnalités et des langues, ainsi que la configuration système requise, peuvent être consultées sur support.apple.com/en-us/121115
1 commentaires
Commentaires sur Hacker News
Apple aime glisser de nouvelles technologies dans des endroits anodins pour les tester discrètement au grand jour, donc lancer d’abord une IA agentique comme fonctionnalité d’accessibilité paraît très typique d’Apple
La Touch Bar n’était pas juste une simple bande OLED, c’était le premier mouvement vers la transition du Mac vers Apple Silicon, et la puce Apple T1 du MacBook Touch Bar de 2016 était le premier processeur entièrement conçu par Apple dans un Mac
Elle reprenait au chipset Intel des rôles comme la gestion de l’alimentation, des ventilateurs, de la veille/réveil, de l’accès à la caméra et au micro, ainsi que le Secure Enclave pour Touch ID, puis la T2 a ensuite pris en charge le chiffrement du SSD, la gestion audio, le traitement d’image de la caméra et même la protection du processus de démarrage contre les altérations
L’iPhone 3G était livré avec un outil d’éjection de SIM en Liquidmetal, un alliage métallique sur mesure presque impossible à plier à la main, et même si Apple n’a pas sorti ensuite de produit utilisant cet alliage, il y a des rumeurs, près de 20 ans plus tard, sur l’usage de métal liquide dans un iPhone pliable
RealityKit aussi proposait depuis des années la numérisation 3D et diverses fonctions AR dont le sens n’est devenu clair qu’avec l’arrivée de l’Apple Vision Pro
Les gens détestaient la Touch Bar, et elle n’est devenue intéressante que plusieurs années plus tard, quand des passionnés l’ont bidouillée et configurée pour lui ajouter des fonctions plus poussées
Fabriquer un outil d’éjection de SIM dans un alliage coûteux n’avait pas beaucoup de sens, et RealityKit comme Vision donnent l’impression d’être des solutions en quête de problème, Vision lui-même étant en train de sombrer
3D Touch avait aussi des problèmes de découvrabilité et d’utilisabilité, et les exemples du genre ne manquent pas
Ces matériaux existent depuis des décennies, et pourtant ils finissent presque par paraître synonymes de la marque Apple, ce que je trouve assez agaçant
S’ils ne sont pas plus utilisés, c’est surtout parce qu’ils coûtent très cher, mais quand on est dans une position comme Apple avec une demande garantie de dizaines de millions de pièces, il est bien plus facile d’en rendre l’économie viable
J’ai lu que, pour filmer ou prendre des photos, la lentille s’allumerait ou clignoterait de manière plus visible que chez Meta, ce qui pourrait aider sur les questions de confidentialité, et au moins ce ne serait pas Meta
J’aime bien les lunettes connectées de Meta, mais mes deux paires sont tombées en panne et il n’y a aucun magasin où obtenir de l’assistance, donc si Apple sort un produit, je passerai probablement vite chez eux
Du point de vue d’un développeur, les API d’accessibilité au niveau du système d’exploitation chez Apple sont vraiment excellentes
Là où ça casse, c’est à la frontière entre WebKit et l’application native
J’ai distribué une application Tauri avec l’éditeur Monaco intégré dans un WKWebView, et j’ai découvert à la dure que le mode
accessibilitySupport: autode VoiceOver cassait discrètement la sélection de texte vers l’arrière dans MonacoIl fallait le régler sur
"off"pour que la sélection fonctionne correctement, et au final il fallait choisir entre une sélection de texte normale et le support de VoiceOver, et la réponse a été la sélection de texteC’est solide dans AppKit/UIKit, mais ça s’effondre à la frontière du WebView embarqué où la plupart des applis desktop actuelles finissent en pratique par vivre
Il y a longtemps, je me suis inscrit à Be My Eyes en tant que personne voyante
Je n’ai pas reçu autant d’appels que je l’espérais, mais j’ai pu aider quelques fois, et c’était agréable
J’ai déjà lu une enveloppe, lu un flacon de médicament, et aidé deux types assez drôles assis dans de gros fauteuils moelleux avec un sac de courses rempli de boîtes de céréales à identifier une par une
Je me souviens que l’un d’eux détestait vraiment une variété en particulier
Cette appli avait une fonction unique permettant à la personne voyante d’activer l’appareil photo de la personne malvoyante
https://www.bemyeyes.com
Je trouve ça formidable que l’IA fonctionne assez bien pour que les personnes aveugles puissent résoudre leurs problèmes elles-mêmes
Cela dit, il y avait aussi quelque chose de très humain et agréable dans le fait d’aider de temps en temps un inconnu pour une petite tâche aléatoire
Je garde un très bon souvenir d’une vieille dame qui avait renversé une boîte de myrtilles sur le sol de sa cuisine, et je l’avais aidée à toutes les retrouver en lui donnant des indications
C’étaient dix minutes amusantes passées à être connecté à une inconnue, et quatre ans plus tard j’en garde encore un souvenir chaleureux
En tant que personne totalement aveugle, j’ai commencé à utiliser l’appli après l’ajout de l’IA, et elle marche très bien pour lire les étiquettes alimentaires après que les enfants ont déplacé des choses, ou pour vérifier si la télé est allumée
Si je vivais encore seul, j’utiliserais probablement aussi la fonction avec les bénévoles, mais ce n’est plus le cas aujourd’hui
C’est une bonne chose, et je ne vais pas m’en plaindre, mais je m’étais inscrit il y a des années, je n’ai jamais reçu un seul appel et j’ai fini par supprimer l’appli
Une chose qu’Apple devrait vraiment réussir, c’est la reconnaissance vocale
Ils ont très bien travaillé sur beaucoup d’aspects de l’accessibilité, mais sur la transcription vocale, j’ai l’impression qu’ils ont au moins 5 ans de retard, sinon 10
La saisie sur iPhone est horrible ces temps-ci
Le rejet des contacts accidentels de la paume est clairement pire qu’avant, donc les fautes de frappe sont plus fréquentes, et l’algorithme d’autocorrection est aussi moins bon qu’avant, au point de remplacer souvent à tort des mots plusieurs positions avant l’endroit où je suis en train de taper
La reconnaissance vocale ne s’est pas améliorée non plus, et la forme même du téléphone fatigue les doigts
J’aimerais qu’utiliser un iPhone ne soit plus une corvée
À côté, la solution d’Apple donne l’impression de venir du siècle dernier
C’est pareil pour la synthèse vocale d’Apple, alors qu’ElevenLabs et OpenAI ont une énorme avance
Tout ce qu’il faut, c’est que l’iPhone prenne en charge ce genre de choses nativement avec la même qualité, parce que dans l’écosystème fermé d’Apple, il faut que ça soit natif pour pouvoir l’utiliser partout
Hier, j’ai encore découvert une autre horrible “fonction” de saisie sur iPhone
Si, dans une appli CarPlay tierce, on parcourt une liste et qu’on appuie sur l’accélérateur juste avant de toucher un élément pour le sélectionner, la liste se réduit à seulement quelques éléments et remonte en haut
Formidable moyen de réduire les distractions au volant. La prochaine étape, c’est quoi, changer la destination sur la carte dès que la voiture bouge ?
J’aimerais que la recherche en interaction humain-machine soit davantage appliquée, et je pense que quand on fait des choses aussi stupides, comme dans l’écosystème automobile/CarPlay, on devrait en répondre devant les tribunaux
J’ai déjà conduit une voiture qui cachait systématiquement la caméra de recul derrière un avertissement légal, et je suis certain qu’au moins un piéton s’est déjà fait renverser en marche arrière pendant que cet écran était affiché
Les fabricants devraient être tenus pour 100 % responsables de ce genre de mauvaises décisions d’UI
J’ai aussi appris cette astuce sur HN
Il suffit d’ouvrir Réglages, de toucher General, puis de descendre vers Keyboard et de désactiver Slide to Type
Je dois corriger presque un mot sur deux de ce que je tape, ou de ce que l’iPhone croit que j’ai tapé
Et pendant que je corrige, l’autocorrection invente de nouvelles fautes encore plus incompréhensibles
Par moments, ça atteint un niveau de folie digne d’un rêve fiévreux où l’on n’arrive soudain plus à faire les choses les plus ordinaires
Le pire, c’est qu’avant, ça allait
Sur l’iPhone 4S, je tapais avec une vitesse et une précision proches d’un vrai clavier complet
https://www.theregister.com/on-prem/2023/08/16/those-who-rel...
J’aimerais au moins qu’ils corrigent deux gros bugs
Même là où c’est censé être pris en charge, la saisie échoue de façon apparemment aléatoire, et beaucoup d’applis de grands éditeurs, comme OneNote, ne prennent pas du tout en charge la dictée
Dans ces cas-là, il devrait au moins exister une voie de secours, comme Dragon Dictate il y a des décennies
La capitalisation reste elle aussi aléatoire, donc il y a encore beaucoup d’erreurs à corriger
Apple semble considérer l’accessibilité moins comme une vraie fonctionnalité que comme un sujet utile pour rédiger de beaux communiqués de presse
Fait amusant : cette vidéo est rendue accessible pour des personnes voyantes
Si quelqu’un était réellement aveugle, personne n’écouterait une voix à cette vitesse, et quand on voit comment des personnes aveugles utilisent un ordinateur, on est souvent stupéfait par leur capacité à écouter de l’audio à des vitesses qu’on imagine à peine
L’exemple que je donne souvent, c’est cette vidéo où l’ingénieur logiciel aveugle de Microsoft, Saqib Shaikh, présente Visual Studio
Le lien pointe directement vers le bon moment
J’étais absolument sidéré par la vitesse à laquelle son lecteur d’écran lisait le contenu, c’était totalement incompréhensible pour moi
Son efficacité avec les raccourcis clavier aurait fait rougir même l’élite de vim/emacs
Une voix robotique très rapide peut paraître assez rude et agaçante, et même les personnes aveugles qui en dépendent peuvent parfois se sentir surstimulées par ça
J’ai lu des choses sur des personnes aveugles qui ont appris l’écholocalisation sonore, et ça ressemble vraiment à un super-pouvoir fascinant, au point de me donner envie de débrancher mon moniteur un jour et d’apprendre à utiliser correctement les outils
Une collègue aveugle avec qui j’ai travaillé il y a quelques années gardait toujours son écran éteint, donc la batterie de son portable tenait presque deux fois plus longtemps que celle du reste de l’équipe, ce qui en faisait déjà une excellente fonctionnalité
Même sans atteindre un niveau incroyable d’écholocalisation, faire la moitié de ça serait déjà génial, avec en bonus la possibilité de réellement faire de la QA sur les changements d’accessibilité
Ça ressemble à une application vraiment utile des LLM
J’aimerais que davantage d’entreprises se concentrent sur la manière d’aider les gens, plutôt que sur le remplacement des humains ou l’optimisation à l’extrême au nom de la productivité
Mon expérience se limite à des parents âgés dont la vue a baissé, mais quand on règle la taille de texte à ce qu’Apple autorise, le téléphone devient illisible
Dans toutes les applis, qu’elles soient de première partie ou tierces, le texte déborde de l’écran
Dans l’exemple de la facture, on dit à l’utilisateur de vérifier auprès du fournisseur, mais je ne comprends pas pourquoi on ne lui propose pas simplement d’appeler le numéro indiqué sur la facture
Pourquoi lui dire d’utiliser la détection de texte au lieu de le faire directement ? Apple Intelligence est censé en avoir déjà la capacité
J’ai peur que, dans le meilleur des cas, cela ne reste qu’une fonction gadget
Cela dit, la poignée a l’air bien, et j’espère qu’ils ne vont pas lui ajouter la taxe Apple
Traiter le développement d’une nouvelle industrie comme une technologie et non comme le produit lui-même
L’IA ne sera pas le produit lui-même, mais une fonctionnalité qui améliore l’expérience client
J’espère simplement vraiment que ce problème évoqué dans un précédent billet (https://news.ycombinator.com/item?id=48178378) ne va pas devenir plus fréquent au point de mettre en danger ce genre de fonctions utiles
À court terme, cela paraît peu probable, mais à mesure que les usages se multiplient, les acteurs malveillants risquent eux aussi de se multiplier
Il est louable qu’Apple aide des gens dans le besoin avec ce genre de technologie
Mais il ne faut pas faire semblant de ne pas comprendre pourquoi la plupart des entreprises ne se lancent pas dans cette direction
Franchement, tout le monde connaît très bien la raison, et ce genre de sujet finit toujours par être laissé à ce vague “quelqu’un d’autre”
J’ai l’impression que tout le monde a sauté ce point, mais le contrôle par le regard pour fauteuils roulants électriques paraît être une excellente idée
C’est peut-être juste moi, et peut-être que c’est déjà une vieille idée
La VR complète n’a pas vraiment décollé, mais ça me fait toujours me demander s’il n’existe pas un marché pour des appareils plus légers et plus fins
Si ça tient dans des lunettes de taille normale, ça pourrait vraiment m’intéresser comme dispositif de contrôle par le regard
Avec un système HUD, ce serait encore plus intéressant, même à un niveau très basique qui n’afficherait que quelques symboles
Un peu d’audio de base serait encore mieux, mais préserver une forme de lunettes normales m’importe plus qu’un HUD ou que l’audio
En suivant le lien de la source référencée, on tombe sur des exemples comme https://www.tolt.tech
Ce qui est intéressant, c’est qu’Apple l’a intégrée au système d’exploitation
On a vraiment l’impression que c’est l’une de ces fonctionnalités qu’Apple sort d’abord pour l’affiner avant que le matériel final soit prêt
Le montant total dû sur la facture est de 83,89 $. Vérifiez ce montant auprès de votre fournisseur d’électricité avant de payer ou utilisez Text Detection pour le confirmer
Demander à une personne de confiance de lire le chiffre peut être préférable à appeler l’entreprise, mais tout le monde n’a pas forcément cette possibilité
Cette phrase est évidemment une mention obligatoire, un peu comme quand ChatGPT met en bas de page “vérifiez tout ce que nous vous disons”
Quelque chose comme : “Le montant total dû sur cette facture est de 83,89 $, soit 4 % de plus que la facture du mois dernier du même fournisseur.”
Je trouve dommage qu’Apple ait retiré dans la version YouTube de la publicité l’indication du lecteur d’écran “the Apple logo”
https://www.youtube.com/watch?v=B3SmsSCvoss
À mon avis, c’était ce détail qui faisait ressortir la pub
"English descriptive"Honnêtement, en tant que personne aveugle et développeur aveugle, la plupart de ces fonctionnalités me laissent au mieux assez froid
Des applis tierces comme Seeing AI, Envision AI, BeMyEyes et Aira font déjà la plupart de ces choses
Donc au mieux, cela fera la même chose qu’elles, plus vite et en local sur l’appareil, mais cela peut aussi vouloir dire moins de précision, donc il faudra voir
Pendant ce temps, VoiceOver, le lecteur d’écran de macOS, est en pratique laissé en mode maintenance, et les utilisateurs ont dû créer eux-mêmes des solutions tierces assez impressionnantes pour ajouter des fonctionnalités que le lecteur d’écran équivalent sous Windows possède depuis longtemps
Vu sous cet angle, tout cela paraît un peu démonstratif, mais je peux quand même avoir une bonne surprise
Ce qui m’intéresse un peu plus, ce sont les améliorations de Voice Control
Parce qu’essayer de deviner le nom programmatique d’un bouton ou devoir constamment utiliser une grille numérotée pour viser des éléments n’a rien d’agréable
Concernant la vitesse de voix, il faut énormément de pratique pour la pousser très haut, et changer de voix demande aussi un certain réentraînement
Les voix plus “humaines” sont souvent plus difficiles à suivre à très haute vitesse, donc beaucoup de gens préfèrent des voix plus robotiques mais plus régulières, et ne sont pas encore convaincus par le TTS basé sur l’IA
Ces voix ont souvent tendance à s’effondrer quand on augmente trop le débit
La question d’attendre le jugement des véritables personnes concernées est vraiment essentielle
De plus en plus d’entreprises et d’individus parlent d’accessibilité, créent des solutions d’accessibilité et évangélisent l’IA pour l’accessibilité, sans jamais parler aux personnes qu’ils prétendent aider
Dans ces conditions, les erreurs sont presque garanties, et dans le pire des cas cela peut faire plus de mal que de bien
Pour bien faire l’accessibilité, y compris avec des produits IA, il faut embaucher des personnes qui ont une véritable expérience vécue
Sinon on obtient des textes traduits automatiquement, une sécurité anti-hacker en un clic, ou des bars à café pilotés par IA qui commandent des milliers de gants en caoutchouc
Au passage, j’ai justement un peu de temps pour un nouveau projet en ce moment :P
En tant que personne qui passe d’une vue “mauvaise mais corrigeable” à une basse vision, cela m’a aussi été utile
Je ne connaissais pas ces applis, et c’est exactement le genre de technologie d’assistance que je cherchais
Apple donne l’impression de fabriquer ce genre de produits sans avoir jamais parlé à des personnes réellement concernées par le problème
Fait amusant, nous sommes en train de construire un concurrent des applis tierces mentionnées, et mon collègue a une grande expérience du sujet parce qu’il a un parent aveugle
Nous avons bien un MVP en ligne, mais il n’est pas encore extraordinaire, et je n’ai pas envie d’être “la personne qui dit hé, on a fait cette appli, au fait”
Il y a juste une chose qui me trouble : le passage où tu sembles penser que le traitement sur l’appareil pourrait être un gadget
Naïvement, j’aurais pensé que c’était un gros avantage, parce que cela veut dire que ça fonctionne toujours, indépendamment du réseau mobile
Donc utilisable dans le métro, en avion, dans des endroits isolés, etc.
Par ailleurs, je serais curieux de savoir quelle appli fait le plus de différence dans ton quotidien