1 points par tantara 26 일 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Il s’agit d’un explorateur de personas coréens utilisant le dataset Nemotron-Personas-Korea publié par NVIDIA.

Ce dataset est un jeu de données synthétique à l’échelle d’un million de Coréens, comprenant l’âge, la profession, la région, les relations familiales, etc. La méthode de création du dataset ainsi que les informations statistiques sont expliquées en détail sur https://fr.news.hada.io/topic?id=28919.

Les principales fonctionnalités de l’explorateur de personas sont les suivantes.

  1. Vous pouvez rechercher un persona ou trouver des personas similaires. La similarité est comparée à l’aide du modèle d’embedding Qwen.

  2. Vous pouvez consulter la répartition démographique des personas sur une carte. Les informations de localisation présentes dans le dataset sont utilisées.

  3. Vous pouvez dialoguer avec un persona. Il peut répondre à des questions très simples.

Des embeddings de dimension 1024 ont été extraits sur l’ensemble du dataset avec le modèle d’embedding Qwen 0.6, puis publiés sous forme de dataset Hugging Face. Comme la colonne *_persona a la particularité de contenir des noms de manière répétée, les valeurs d’embedding peuvent être biaisées par les noms.

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.