4 points par minsoo010 19 일 전 | 2 commentaires | Partager sur WhatsApp

Je développe actuellement une application avec Expo + React Native, et j’aimerais installer directement le modèle Gemma-4-E2B-it sur le téléphone pour l’exécuter en on-device.

En cherchant, j’ai l’impression qu’il existe les options suivantes, mais j’ai du mal à voir quelle approche est réellement la plus utilisée.

  • llama.rn
  • llama.cpp
  • GGUF
  • LiteRT / AI Edge
  • MLC LLM

Ce que je veux faire est le suivant :

  • téléchargement / installation du modèle depuis l’application
  • inférence locale (si possible entièrement hors ligne)
  • utilisation à l’intérieur de l’application Expo/RN

Quel est actuellement le runtime / la bibliothèque le plus utilisé ?
Si certains d’entre vous ont déjà mis cela en œuvre, je serais vraiment reconnaissant si vous pouviez partager votre architecture, des exemples de dépôts ou votre retour d’expérience.

2 commentaires

 
ysahn0 18 일 전

J’avais mené un PoC similaire avec Flutter. Pour commencer, j’avais travaillé avec LiteRT-lm et je me suis beaucoup appuyé sur ce dépôt : https://github.com/google-ai-edge/gallery.

 
minsoo010 18 일 전

Ah d’accord. J’avais aussi installé Google Edge Gallery et essayé plusieurs choses, donc je vais m’y référer. Merci !