4 points par GN⁺ 2025-01-13 | 1 commentaires | Partager sur WhatsApp
  • Présentation de Tabby

    • Tabby est une alternative à GitHub Copilot, sous la forme d’un assistant de codage IA auto-hébergeable.
    • Il repose sur une architecture autonome ne nécessitant ni DBMS ni service cloud.
    • Il peut être facilement intégré à l’infrastructure existante via une interface OpenAPI.
    • Il prend en charge les GPU grand public.
  • Nouvelles fonctionnalités

    • 6 décembre 2024 : l’intégration du déploiement Llamafile et une expérience utilisateur améliorée pour l’Answer Engine seront ajoutées à Tabby v0.21.0.
    • 10 novembre 2024 : le basculement entre différents modèles de chat backend dans l’Answer Engine est pris en charge dans Tabby v0.20.0.
    • 30 octobre 2024 : Tabby v0.19.0 ajoute les fils récents partagés à la page principale afin d’améliorer leur visibilité.
    • 9 juillet 2024 : annonce de l’intégration de Codestral.
    • 5 juillet 2024 : Tabby v0.13.0 introduit l’Answer Engine, qui intègre les données internes de l’équipe de développement pour fournir des réponses fiables.
    • 13 juin 2024 : VSCode 1.7 propose diverses expériences de chat tout au long de l’expérience de codage.
    • 10 juin 2024 : publication d’un billet de blog sur la compréhension améliorée du contexte de code par Tabby.
    • 6 juin 2024 : Tabby v0.12.0 offre une intégration fluide avec Gitlab SSO, GitHub/GitLab auto-hébergés, etc.
    • 22 mai 2024 : Tabby VSCode 1.6 propose plusieurs choix dans les complétions inline et prend en charge les messages de commit générés automatiquement.
    • 11 mai 2024 : v0.11.0 apporte d’importantes mises à niveau enterprise, dont l’intégration GitHub et GitLab, une page d’activité et la fonctionnalité Ask Tabby.
    • 22 avril 2024 : v0.10.0 introduit un nouvel onglet de rapports fournissant des analyses par équipe.
    • 19 avril 2024 : Tabby intègre des snippets locaux pertinents pour la complétion de code.
    • 17 avril 2024 : les séries de modèles CodeGemma et CodeQwen sont ajoutées au registre officiel.
    • 20 mars 2024 : v0.9 met en avant une interface d’administration complète.
    • 23 décembre 2023 : Tabby peut être déployé de façon fluide dans le cloud via SkyServe de SkyPilot.
    • 15 décembre 2023 : v0.7.0 apporte la gestion d’équipe et l’accès sécurisé.
    • 15 octobre 2023 : la complétion de code basée sur le RAG est activée dans v0.3.0.
    • 27 novembre 2023 : sortie de v0.6.0.
    • 9 novembre 2023 : v0.5.5 inclut une refonte de l’interface et des améliorations de performances.
    • 24 octobre 2023 : mise à jour majeure du plugin IDE Tabby pour VSCode/Vim/IntelliJ.
    • 4 octobre 2023 : les derniers modèles pris en charge par Tabby peuvent être consultés dans le répertoire des modèles.
    • 18 septembre 2023 : la prise en charge de l’inférence Metal sur Apple M1/M2 est ajoutée dans v0.1.1.
    • 31 août 2023 : sortie de la première version stable de Tabby, v0.0.1.
    • 28 août 2023 : prise en charge expérimentale de CodeLlama 7B.
    • 24 août 2023 : Tabby est référencé sur la JetBrains Marketplace.
  • Pour commencer

    • La documentation présente l’installation, les extensions IDE/éditeur et les méthodes de configuration.
  • Communauté

    • Il est possible d’échanger avec TabbyML via Twitter/X, LinkedIn et la newsletter.

1 commentaires

 
GN⁺ 2025-01-13
Avis Hacker News
  • Un utilisateur indique que le produit est peut-être bon, mais que le processus d’entretien a été horrible. Il dit avoir passé plusieurs entretiens, puis ne plus avoir eu aucune nouvelle après le dernier, sans la moindre explication. Il ajoute n’avoir reçu aucune réponse pendant des mois après avoir rédigé un billet de blog, et n’avoir obtenu un retour qu’après avoir insisté à plusieurs reprises. Tous les entretiens prenaient la forme d’exercices, et il dit y avoir consacré plus de 10 heures au total.

  • Il est mentionné que les alternatives présentées comme des remplaçants de GitHub Copilot ne fonctionnent pas dans VS2022. L’auteur dit vouloir un assistant IA auto-hébergé utilisable dans VS2022. Il s’interroge sur l’absence d’alternative alors que VS2022 prend en charge les plugins.

  • Il est mentionné que la démo de complétion de la fonction findMaxElement sur la page d’accueil est censée représenter un exemple actuel ou futur. Le code Python proposé en 6 lignes pourrait, selon lui, être remplacé par return max(arr). Il juge le code proposé de niveau débutant. Il craint que les personnes qui utilisent l’autocomplétion aveuglément stagnent techniquement. On peut peut-être gagner des story points, dit-il, mais il doute que les compétences réelles progressent.

  • Il est indiqué qu’il n’aurait jamais imaginé voir le projet Tabby arriver en première page de HN. Depuis son lancement, Tabby a considérablement progressé et est devenu une plateforme IA complète pour développeurs, avec complétion de code et chat sur le codebase. Un utilisateur de Tabby dit l’avoir identifié comme la seule plateforme offrant une expérience d’onboarding en self-service. Les performances seraient également comparables à celles des autres options du marché. Il recommande de l’essayer si le sujet vous intéresse.

  • Un utilisateur peu familier avec l’IA locale dit vouloir essayer Tabby. Il se demande comment « run tabby in 1 minute » se compare à la version gratuite de chatgpt 4o-mini. Il demande s’il est possible d’obtenir une IA rapide et compétente en lançant une commande Docker sur un MacBook Pro de gamme intermédiaire. Il est répondu que la puissance de calcul des M1/M2 est limitée et conviendrait probablement seulement à un usage personnel. Si une instance partagée pour une équipe est nécessaire, il est recommandé d’envisager un hébergement Docker avec CUDA ou ROCm.

  • Il est mentionné qu’il n’est pas possible de désactiver la télémétrie IDE/Extensions dans la Community Edition. L’auteur se demande quelles données sont incluses dans cette télémétrie.

  • Il est mentionné que tous les exemples sont du code qu’on peut trouver dans des bibliothèques. Une partie de ce code serait de qualité douteuse. L’auteur craint que les LLMs ne deviennent des bots spammeurs de codebase.

  • Il est dit que l’idée est bonne car elle évite d’envoyer des données aux grandes entreprises et permet de se fier aux TOS. L’efficacité d’un assistant de code serait proportionnelle à la longueur du contexte, tandis que les modèles open exécutables sur un ordinateur sont généralement plus petits. L’auteur dit vouloir voir des données quantifiant l’utilité sur des codebases plus complexes.

  • Il est mentionné qu’une personne étudie au travail des solutions IA auto-hébergées. Elle se demande comment cette entreprise génère des revenus. Il existe des options gratuites / communautaires / open source, et elle demande comment la limite de « jusqu’à 5 utilisateurs » est contrôlée. Elle se demande aussi ce qu’il se passe lorsqu’il y a plus de 5 utilisateurs.

  • Il est mentionné que Tabby ne prend en charge que l’utilisation d’un seul GPU. Pour en utiliser plusieurs, il faut lancer plusieurs instances de Tabby et définir CUDA_VISIBLE_DEVICES ou HIP_VISIBLE_DEVICES. L’auteur demande si l’utilisation de deux GPU reliés par NVLink n’est pas prise en charge, ou si la situation est différente parce que NVLink traite les deux GPU comme un seul.