Ollama v0.1.33 - prise en charge de Llama 3 + Phi 3 + Qwen 110B

xguru · 2024-04-30T09:22:01+09:00

Prise en charge de nouveaux modèles Llama 3 : le nouveau modèle de Meta, et à ce jour le LLM ouvert le plus performant Phi 3 Mini : le nouveau modèle ouvert léger de Microsoft, doté de 3,8 milliards de paramètres Moondream : un petit modèle vision-langage conçu pour fonctionner efficacement sur des appareils edge Dolphin Llama 3 : un modèle non censuré entraîné par Eric Hartford sur la base de Llama 3. Inclut diverses capacités pour l’apprentissage, la conversation et le code Qwen 110B : un modèle de taille 100B paramètres ayant montré d’excellentes performances dans les évaluations (Alibaba) Corrections de bugs Correction d’un problème où l’API se bloquait parce qu’un modèle ne se terminait pas Correction d’une erreur de mémoire insuffisante sur les Mac Apple Silicon Correction d’une erreur de mémoire insuffisante lors de l’exécution de modèles avec l’architecture Mixtral Fonctionnalités expérimentales de concurrence OLLAMA_NUM_PARALLEL : traiter plusieurs requêtes simultanément pour un même modèle OLLAMA_MAX_LOADED_MODELS : charger plusieurs modèles en même temps Nécessite de définir des variables d’environnement OLLAMA_NUM_PARALLEL=4 OLLAMA_MAX_LOADED_MODELS=4 ollama serve

(github.com/ollama)

8 points par xguru 2024-04-30 | 1 commentaires | Partager sur WhatsApp

Prise en charge de nouveaux modèles
- Llama 3 : le nouveau modèle de Meta, et à ce jour le LLM ouvert le plus performant
- Phi 3 Mini : le nouveau modèle ouvert léger de Microsoft, doté de 3,8 milliards de paramètres
- Moondream : un petit modèle vision-langage conçu pour fonctionner efficacement sur des appareils edge
- Dolphin Llama 3 : un modèle non censuré entraîné par Eric Hartford sur la base de Llama 3. Inclut diverses capacités pour l’apprentissage, la conversation et le code
- Qwen 110B : un modèle de taille 100B paramètres ayant montré d’excellentes performances dans les évaluations (Alibaba)
Corrections de bugs
- Correction d’un problème où l’API se bloquait parce qu’un modèle ne se terminait pas
- Correction d’une erreur de mémoire insuffisante sur les Mac Apple Silicon
- Correction d’une erreur de mémoire insuffisante lors de l’exécution de modèles avec l’architecture Mixtral
Fonctionnalités expérimentales de concurrence
- OLLAMA_NUM_PARALLEL : traiter plusieurs requêtes simultanément pour un même modèle
- OLLAMA_MAX_LOADED_MODELS : charger plusieurs modèles en même temps
- Nécessite de définir des variables d’environnement
  - OLLAMA_NUM_PARALLEL=4 OLLAMA_MAX_LOADED_MODELS=4 ollama serve

1 commentaires

siabard 2024-04-30

J’avais besoin d’utiliser plusieurs modèles, et maintenant c’est possible. ^^=b

Ollama v0.1.33 - prise en charge de Llama 3 + Phi 3 + Qwen 110B

À lire aussi

1 commentaires