4 points par frida 2024-07-01 | 2 commentaires | Partager sur WhatsApp

2 commentaires

 
frida 2024-07-02

Pour utiliser un LLM coréen avec une longue fenêtre de contexte, voici diverses méthodes étudiées et testées pour augmenter efficacement la longueur de contexte d’un LLM

  1. LongLoRA
    Extension jusqu’à 8x grâce à la shifted sparse attention et au fine-tuning LoRA

  2. Rope-based Position Interpolation
    Applicable aux modèles utilisant des embeddings basés sur RoPE comme Llama en modifiant l’embedding RoPE, avec une extension de la longueur de contexte jusqu’à 16x via fine-tuning

  3. Dynamic NTK
    Extension de plus de 2x en appliquant la théorie NTK sans fine-tuning

  4. LongLM
    Utilise une attention modifiée pour étendre jusqu’à 4x sans fine-tuning

  5. ChunkLlama
    Décompose le texte en chunks pour étendre la longueur de contexte du modèle Llama à 4x sans fine-tuning

  6. Infini-attention
    Peut être étendu jusqu’à 2M avec peu de mémoire supplémentaire et permet une inférence rapide ; méthode appliquée à Gemini-Pro

 
superwoou 2024-07-02

C’est bien la première fois que je vois un article sans le moindre résumé.