J’ai créé un registre de modèles sémantiques.
(hub.rawctx.dev)Bonjour. C’est la première fois que je poste ici, alors j’ai les mains qui tremblent en écrivant ce message.
Objectif
J’ai eu l’idée de créer ce service en lisant l’article https://fr.news.hada.io/topic?id=26967 [ Data Engineering après l’IA ].
Il s’agit d’un service centré sur le format OSI, conçu pour permettre d’importer, d’exporter et de rechercher différents formats de modèles sémantiques.
Pourquoi je l’ai créé
J’ai eu l’impression que les discussions autour des modèles sémantiques se multiplient progressivement. Dans ce contexte, le format sur lequel plusieurs entreprises se sont mises d’accord est OSI (Open Semantic Interchange), et la version 1.0 est sortie récemment.
Il est encore difficile de savoir si cela deviendra réellement un standard, mais je me suis dit que je pouvais contribuer à un projet international en résolvant d’abord la chaîne d’approvisionnement avant même que la demande n’émerge. (Cela dit, sur la question du partage d’actifs sémantiques, j’ai volontairement mis un peu de côté la réflexion sur l’existence d’une demande réelle.)
Fonctionnalités
Les fonctionnalités ont été développées en trois volets — SDK Python, CLI et web — et offrent toutes les mêmes capacités.
- Je souhaite permettre d’importer des modèles sémantiques existants, comme dbt metric flow, pour les convertir au format OSI, ainsi que l’inverse.
Bien sûr, je réfléchis aussi à la manière de compenser le contexte perdu pendant le processus de conversion. - L’objectif n’est pas seulement de s’arrêter à une recherche simple : après la recherche, je prévois aussi d’ajouter des fonctions pratiques pour consulter un aperçu et vérifier facilement les measures, dimensions, etc.
- Enfin, lorsqu’une couche sémantique déjà existante sur GitHub est indexée, il existe une fonctionnalité permettant à l’auteur original de la revendiquer et de la récupérer comme sa propre publication si son identifiant GitHub correspond.
Stack
Pour la recherche, j’ai utilisé OpenSearch, pour la gestion de l’infrastructure, Terraform, et pour le backend, FastAPI.
Merci d’avance pour votre accueil.
Aucun commentaire pour le moment.