Je me demande comment utiliser Gemma-4-E2B-it en on-device dans un environnement Expo + React Native
Je développe actuellement une application avec Expo + React Native, et j’aimerais installer directement le modèle Gemma-4-E2B-it sur le téléphone pour l’exécuter en on-device.
En cherchant, j’ai l’impression qu’il existe les options suivantes, mais j’ai du mal à voir quelle approche est réellement la plus utilisée.
- llama.rn
- llama.cpp
- GGUF
- LiteRT / AI Edge
- MLC LLM
Ce que je veux faire est le suivant :
- téléchargement / installation du modèle depuis l’application
- inférence locale (si possible entièrement hors ligne)
- utilisation à l’intérieur de l’application Expo/RN
Quel est actuellement le runtime / la bibliothèque le plus utilisé ?
Si certains d’entre vous ont déjà mis cela en œuvre, je serais vraiment reconnaissant si vous pouviez partager votre architecture, des exemples de dépôts ou votre retour d’expérience.
2 commentaires
J’avais mené un PoC similaire avec Flutter. Pour commencer, j’avais travaillé avec LiteRT-lm et je me suis beaucoup appuyé sur ce dépôt : https://github.com/google-ai-edge/gallery.
Ah d’accord. J’avais aussi installé Google Edge Gallery et essayé plusieurs choses, donc je vais m’y référer. Merci !