1 points par GN⁺ 6 시간 전 | 1 commentaires | Partager sur WhatsApp
  • VocabOwl est un outil de Scientific Word Count qui estime le nombre de mots anglais qu’un utilisateur connaît réellement, sur la base de 171676 mots anglais
  • Pour voir le résultat, il faut relever le défi de 100 questions ; le principe consiste à estimer l’ampleur du vocabulaire total à partir d’un test court
  • Il est indiqué que la composition des questions utilise une méthode d’échantillonnage stratifié (stratified sampling)
  • Le site met en avant l’utilisation de Gemini 3 Flash AI, intégrant ainsi l’IA dans la génération et l’exploitation du test de vocabulaire
  • Projet inspiré du podcast The Rest Is Science ainsi que de la professeure Hannah Fry et de Michael Stevens

Le test proposé par VocabOwl

  • VocabOwl est un service d’estimation du vocabulaire anglais centré sur la question : « How many of the 171,476 English words do you actually know? »
  • L’utilisateur peut relever un défi de 100 questions pour découvrir combien de mots anglais il connaît
  • Il est indiqué que les questions du test sont construites selon une méthode scientifically stratified

Méthode de mise en œuvre et sources d’inspiration

  • Le site présente le Stratified Sampling comme méthode principale
  • Gemini 3 Flash AI est mentionné parmi les technologies utilisées
  • Le podcast The Rest Is Science, la professeure Hannah Fry et Michael Stevens sont indiqués comme sources d’inspiration

1 commentaires

 
GN⁺ 6 시간 전
Réactions sur Hacker News
  • Il faut beaucoup trop de clics par mot. J’aime bien ce genre de quiz sur le « nombre de mots qu’on connaît », donc je l’ai fait jusqu’au bout, mais dans l’ensemble le classement paraît douteux
    Il y a bien une tendance générale avec des mots faciles au début et difficiles à la fin, mais le niveau intermédiaire est assez mélangé. breviary est bien plus rare que ce qu’on attendrait d’un niveau intermédiaire, et un mot de phobie comme Hippopotomonstrosesquippedaliophobia ressemble moins à un mot réellement employé qu’à une blague d’écolier qui veut impressionner en montrant ce qu’il a trouvé dans le dictionnaire. Il est aussi difficile de comprendre pourquoi metamorphosis et kinetic sont classés expert
    Les définitions étaient globalement reconnaissables, mais définir lethargy comme un « état d’apathie » est assez évident, voir complacent comme de la « suffisance autosatisfaite » est excessif, magnanimous n’a pas forcément besoin d’un « rival », et pour gauche, se limiter à « socialement maladroit » fait perdre la nuance de tactless
    Le site se dit « scientifique » mais se contente de présenter vaguement une formule sans expliquer comment les mots ont été stratifiés au départ. Si l’échantillonnage stratifié est une méthode officiellement reconnue pour ce genre de chose, j’aurais aimé voir des liens vers de vraies références. Je pense connaître beaucoup de mots, mais j’ai du mal à croire à l’estimation à plus de 75k donnée par cette app

    • Je trouve quand même que certains points se défendent. breviary est pour moi un mot familier, pas particulièrement rare. Il est largement connu des catholiques, et on a de bonnes chances de le connaître si on s’intéresse à l’art médiéval ou aux livres. C’est l’un des grands types de livres avant l’imprimerie, donc si vous visualisez des images de manuscrits enluminés, une bonne moitié vient peut-être de là
      Pour Hippopotomonstrosesquippedaliophobia, il ne s’agit pas forcément de connaître le mot entier par cœur, mais d’en déduire le sens à partir de ses composants. Je connaissais sesquippedalian, phobia est facile à reconnaître, et on peut supposer que hippo renvoie ici moins à l’animal qu’à une racine latine proche de « grand »
      J’ai aussi déjà vu complacent et gauche employés de cette manière, et dans un dictionnaire ce serait probablement au pire la 2e ou 3e définition, donc ça ne me dérange pas. J’avais de bons résultats aux concours d’orthographe, et si j’avais eu la discipline de passer des heures à étudier le dictionnaire tous les week-ends, j’aurais peut-être pu monter encore plus haut
    • L’un des derniers mots était kerfuffle, qui est en fait assez courant. En revanche, je n’avais jamais entendu Zenzizenzizenzic, même si je crois l’avoir trouvé juste
      Ce serait bien mieux d’avoir un récapitulatif montrant les réponses que j’ai choisies et les bonnes réponses pour celles que j’ai ratées
    • Je suis d’accord pour dire que complacent n’est pas intrinsèquement smug, mais curieusement dictionary.com et Wiktionary incluent tous deux smug parmi les synonymes ou dans la définition
      Cela dit, de leur côté, smug est aussi analysé comme proche de self-satisfied ou self-complacent, donc le décalage vient peut-être du sens de smug. À mon sens, smug n’est pas seulement de l’ordre du « soi- », c’est plus relationnel, avec l’idée de savourer une situation où l’on se sent supérieur à quelqu’un. Complacent, c’est fondamentalement être satisfait de sa situation, mais avec souvent une connotation négative supplémentaire : on devrait agir pour l’améliorer, et on ne le fait pas
    • C’est impressionnant que ce test soit monté en première page de HN alors qu’il ne semble presque pas adaptatif
    • Même sans connaître Hippopotomonstrosesquippedaliophobia, il était très facile de trouver la bonne réponse parmi les quatre propositions
      Il fallait trop cliquer pour chaque mot, donc c’était long à terminer, et même pour les mots inconnus, les choix rendaient les suppositions trop faciles
  • Le concept est intéressant, mais devoir répondre à 100 mots, c’est quand même beaucoup. Passer les mots faciles du début était ennuyeux, au point de me lasser avant d’arriver aux mots intéressants
    Ce genre de système pourrait s’ajuster bien plus vite en interne avec un score et un niveau de confiance. Au départ, la confiance serait faible puis augmenterait avec le temps ; au début, les bonnes et mauvaises réponses feraient beaucoup bouger le score, puis celui-ci se stabiliserait progressivement
    En pratique, on verrait apparaître des mots de moins en moins courants au début, puis, en cas d’erreur, le système reviendrait à des mots plus faciles ; dès qu’on recommence à répondre juste, il finirait par graviter autour de mots proches de son vrai niveau. Et il y a aussi beaucoup trop de clics par mot. C’est un test sans enjeu : un clic sur la définition devrait suffire à valider, et si on craint les erreurs de clic, il suffit d’ajouter un bouton Annuler

    • Il faut aussi supposer qu’il y aura des erreurs de saisie et les intégrer dans le calcul de confiance. Même la personne la plus intelligente du monde fait parfois une simple erreur de saisie ou a, sur l’instant, un neurone qui part dans la mauvaise direction
    • Je suis particulièrement d’accord avec le premier point. J’ai décroché au bout d’une dizaine de mots, car il n’était pas clair comment passer à l’étape suivante
    • Le test ne devient jamais vraiment assez difficile. En plus, beaucoup trop de mots portaient soit sur les mots longs eux-mêmes, soit sur la tendance à parler de façon ampoulée
    • Sur mobile, le bouton d’envoi est en bas de l’écran, ce qui oblige à faire défiler. Une fois qu’on l’a fait une fois, la position semble plus logique
    • Les zones à cliquer sont aussi beaucoup trop éloignées les unes des autres. Sur un ordinateur portable, il faut sans cesse bouger le curseur de haut en bas pour choisir une réponse puis valider
      Ce serait bien que chaque option ait une lettre ou un chiffre pour pouvoir répondre au clavier. Il y avait autrefois un service de formulaires qui faisait ça assez bien, je crois que c’était Typeform. J’ai voulu vérifier, mais maintenant tout est noyé sous des mentions d’IA, donc j’ai perdu toute envie de confirmer
  • Au-delà des autres critiques, il y a un défaut structurel qui fait que le calcul n’est correct qu’à moitié. Selon la façon de compter, on peut même considérer qu’il est faux à 100 %
    Je suis anglophone natif, gros lecteur un peu nerd, j’ai eu un score parfait au SAT, et j’ai réussi les 100 sans aucune recherche. Pourtant, la “SCIENTIFIC ESTIMATE” m’indiquait seulement 85 000 mots connus sur 170 000, ce qui m’a laissé perplexe
    En regardant la page finale “How is this calculated”, on voit qu’elle affirme qu’il y a environ 171,476 mots actuellement en usage selon l’Oxford English Dictionary Second Edition, puis qu’elle répartit les niveaux en Core Basics 3,000, Intermediate 7,000, Advanced 10,000, Expert 25,000, The Obscure 40,000+. Le score total serait la somme de la précision dans chaque tranche × la taille de la tranche
    Mais même en additionnant toutes ces tranches, on arrive à 85,000 ; donc même avec un score parfait, on n’obtient que 50 %. En plus, ils utilisent un sous-ensemble très limité de la langue, qui n’est peut-être pas représentatif des niveaux de difficulté. C’est mignon, mais faux à plusieurs niveaux

    • Exactement le même retour. J’ai eu les 100/100 et le même résultat
      Comme souvent dans les tests de vocabulaire anglais, connaître le grec aide pour les mots difficiles
    • La sélection des “mots avancés” est un peu étrange. obscure n’est pas si obscure que ça
      Il y a bien quelques termes spécialisés, mais la plupart sont des mots qu’on pourrait entendre dans une conversation ordinaire sur Radio 4
    • Pour un bon nombre, trois des quatre choix sont manifestement absurdes, donc on peut trouver la bonne réponse comme ça. Si le but est une vraie estimation, j’aurais préféré un bouton « je ne sais pas » plutôt que de forcer à choisir la bonne réponse
    • On dirait clairement que ça a été fait avec de l’IA
    • J’en ai eu environ 80 et ça m’a donné 57k
  • J’ai eu 78,000, ce qui est plutôt bien pour une deuxième langue. La valeur maximale de ce test semble être 85,000
    Les choix de réponse donnent l’impression d’avoir été générés par un LLM ; il y a quelques motifs récurrents, comme “now” et “forever” qui reviennent souvent
    Il y a quelques années, j’avais joué à un jeu similaire où on pouvait continuer indéfiniment : si on répondait correctement assez de fois d’affilée, on montait de niveau, et si on se trompait une fois, on redescendait. Aux niveaux très élevés, c’était même plus facile, car il y avait des mots d’ancien anglais et ils étaient pratiquement identiques à ceux de ma langue maternelle, le néerlandais. Il me semble qu’il y avait aussi une dimension caritative, et c’était probablement https://freerice.com/, mais le jeu semble avoir été simplifié depuis
    L’université de Gand en Belgique avait aussi un test intéressant, qui évaluait la maîtrise en la comparant au score moyen de certains niveaux d’études. Là-dessus, j’avais obtenu environ 41,000, ce qui correspondait, il me semble, à la moyenne d’un anglophone natif de niveau universitaire. La mise à jour en bas de https://languagehat.com/ghent-vocabulary-test/ explique où ce test est passé et propose quelques alternatives

  • C’est assez amusant
    Il vaudrait mieux supprimer le bouton de soumission : après un clic, afficher si la réponse est correcte, puis passer à la suivante au bout d’environ une seconde. Le fait de devoir cliquer deux fois casse l’immersion
    De plus, dans les mots que j’ai vus, il y avait souvent une bonne réponse, un antonyme de la bonne réponse, et deux autres choix presque aléatoires. En pratique, on peut ignorer les options où il n’y a pas d’antonyme évident

    • Avec des raccourcis clavier, répondre aux 100 mots serait beaucoup moins maladroit. 1 à 4 pour choisir une option, Entrée pour valider, et il faudrait aussi corriger les problèmes de mise en page qui sautent
    • Il m’a estimé à 74k, mais j’ai eu l’impression que c’était gonflé. Même quand je ne connaissais pas la réponse, on pouvait souvent deviner au ton des propositions, et les mauvaises réponses n’étaient pas assez plausibles
      D’abord, on pouvait écarter les réponses qui décomposaient le mot en mots anglais courants. Si un mot se décompose aussi facilement, il n’est de toute façon pas vraiment obscure
      Écrire de bons distracteurs dans un QCM est difficile. Parmi les examens que je connais, en dehors de ceux qui demandent du calcul ou du par cœur, l’examen national polonais de médecine, le LEK, le fait presque avec cruauté. Il est presque impossible pour quelqu’un hors du domaine de répondre au hasard en dépassant la probabilité pure
    • Je détesterais vraiment qu’une réponse soit comptée comme fausse non parce que j’ai mal cliqué, mais simplement parce que j’ai touché l’écran de mon téléphone par erreur
  • Il devrait y avoir une réponse « je ne sais pas ». Quand on ne sait vraiment pas, avoir 1 chance sur 4 de tomber juste est injuste, et on peut faire encore mieux avec les techniques classiques de QCM
    Il y a quelques mots pour lesquels j’aurais volontiers accepté d’être compté comme faux, mais ils ont quand même été marqués comme corrects

    • J’ai fait les 100, et ce n’est même pas du 1 sur 4. Pour les mots difficiles, quand une définition est nettement plus longue que les autres, c’est souvent la bonne. Et en plus, deux des choix sont souvent des objets, et ce type de réponse semble rarement être le bon
      Il faudrait aussi mieux mélanger les niveaux de difficulté. Les 30 derniers donnaient l’impression d’une corvée monotone. L’idée en elle-même est chouette
    • Ce serait plus simple et plus rapide de demander pour chaque mot, en oui/non, si on en connaît la définition. On pourrait alors passer rapidement en revue même 100 mots. Des raccourcis clavier pour chaque option seraient aussi bienvenus
    • Pour certains, j’ai déduit la bonne définition en comparant les choix proposés
    • Forcer les gens à deviner est peut-être plus pertinent. On peut faire des suppositions à partir des éléments du mot qu’on reconnaît
      Même dans le pire des cas, on peut corriger la probabilité de 25 % de réussite due au hasard
  • On peut résoudre pas mal de questions assez facilement avec des astuces. Beaucoup de propositions ne ressemblent pas à de vraies définitions, la structure “bonne réponse + sens opposé + 2 éléments sans rapport” revient souvent, et vers la fin, la réponse la plus longue est très souvent la bonne. La conception des distracteurs est mauvaise
    L’échantillon de mots est aussi fortement biaisé vers des concepts liés aux mots, à la parole, au locuteur et à la persuasion. On dirait qu’un LLM a reçu un prompt pour sélectionner des mots et s’est mis à choisir des termes liés au “mot” lui-même
    Pour situer le contexte, je suis locuteur non natif, passionné de linguistique, et j’utilise surtout l’anglais dans des contextes universitaires et professionnels. En combinant les astuces ci-dessus, j’ai obtenu 75,400, mais en réalité je suis peut-être plus proche de 10–15k
    Le design aussi, n’importe qui le verra, ressemble à Duolingo de façon presque douloureuse

    • J’ai dû chercher le mot anglais lumbago à cause d’une définition du genre « douleur aiguë dans le bas du dos ». En allemand, il existe l’expression beaucoup plus imagée Hexenschuss
      Je pense que la plupart des gens d’un certain âge reconnaîtront que presque toutes les langues ont un mot pour ce genre de douleur
    • Toutes les options avec un point-virgule étaient correctes
    • Dès la landing page, j’ai vu tout de suite que ça faisait Duolingo
  • J’en ai eu 88 sur 100, mais tout ce que j’ai appris, c’est que je devine plutôt bien. Pour une vingtaine de mots, j’ai pu trouver la réponse en éliminant les propositions peu plausibles ou en devinant à partir du sens d’une partie du mot
    Pour évaluer plus honnêtement le nombre de mots que je connais réellement et ceux que je peux deviner, il faudrait une option « je ne sais pas »

  • Pour trouver le niveau plus rapidement, il faudrait utiliser un classement ELO. Résoudre péniblement 100 mots de base n’a pas grand sens.

  • Le chiffre 171 476 de l’OED est utilisé de façon inexacte, avec une compréhension très erronée du dictionnaire et de la langue.
    Ce nombre désigne le total des entrées complètes définies comme étant d’« usage courant » dans la Second Edition en 20 volumes de l’Oxford English Dictionary. Il ne s’agit pas du nombre de mots. Cela n’inclut pas non plus toutes les variantes orthographiques, formes fléchies, locutions ou entrées run-on de l’OED.
    De plus, l’OED n’est absolument pas une liste exhaustive de l’anglais. En réalité, comme son rythme de mise à jour est très lent, il manque probablement des centaines de milliers de mots. En tant que rédacteur de dictionnaire et lexicographe, j’utilise l’OED tous les jours, et les personnes qui le fabriquent le savent aussi.