LegoGPT - Génération automatique de designs LEGO réellement assemblables à partir de texte
(avalovelace1.github.io)- LegoGPT est un projet innovant qui génère des structures LEGO stables et réellement assemblables à partir d'une simple entrée textuelle
- Le jeu de données StableText2Lego a été constitué pour fournir plus de 47 000 structures LEGO physiquement stables accompagnées de descriptions détaillées
- L'algorithme applique une validation rapide ainsi qu'un rollback fondé sur la physique afin de supprimer automatiquement les structures irréalistes
- Les designs LEGO générés peuvent être réellement assemblés à la fois par des humains et des robots, tout en prenant en charge diverses couleurs et expressions de texture
- Ce système ouvre de nouvelles possibilités dans des domaines variés comme le prototypage créatif, l'éducation ou encore les applications en robotique
Présentation du projet
- LegoGPT est la première approche permettant de générer, de façon entièrement automatisée, des structures LEGO réellement assemblables et physiquement stables à partir d'un prompt textuel saisi par l'utilisateur
- Le projet a été construit avec un jeu de données LEGO à grande échelle accompagné de descriptions détaillées, et produit des résultats présentant stabilité, diversité et qualité esthétique même lors de l'assemblage réel
- Il a été vérifié expérimentalement que les structures LEGO générées peuvent être assemblées manuellement par une personne ou automatiquement par un bras robotisé
Jeu de données StableText2Lego
- Le jeu de données StableText2Lego est construit à partir de maillages 3D ShapeNetCore voxelisés, puis de différentes méthodes de placement de briques, afin de ne retenir que les structures ayant passé une vérification de stabilité physique
- Lors du processus de génération des données, chaque structure est rendue selon 24 angles de vue, sur la base desquels GPT-4o génère automatiquement des descriptions détaillées
- Le jeu de données ainsi constitué comprend plus de 47 000 structures LEGO aux formes, structures et textures variées, ainsi que plus de 28 000 objets 3D uniques
Pipeline LegoGPT
- Les structures LEGO sont tokenisées en séquences de tokens texte selon une méthode de bas en haut, en raster-scan
- En associant chaque séquence de briques à une description en langage naturel, un modèle basé sur LLaMA-3.2-Instruct-1B est affiné afin d'apprendre la correspondance entre description et séquence de briques
- À l'étape d'inférence, LegoGPT génère progressivement une structure LEGO à partir d'un prompt textuel en prédissant et en ajoutant les briques une par une
- À chaque ajout de brique, une validation est effectuée sur le format, la présence dans la bibliothèque de briques et l'absence de collision, puis la stabilité physique de l'ensemble est revérifiée une fois la structure complète générée
- Si la structure finale est instable, le système supprime la brique instable ainsi que toutes les briques ajoutées après elle, puis revient en arrière jusqu'à un état stable avant de régénérer
Exemples de génération étape par étape de structures LEGO
- "un bateau élancé avec une coque longue et étroite"
- "une bibliothèque avec des étagères horizontales"
- "un banc avec accoudoirs sans dossier"
- Chaque exemple est généré étape par étape à partir d'un prompt textuel vers une structure LEGO reflétant clairement les caractéristiques visuelles
Assemblage automatisé à l'aide de robots
- Les modèles LEGO générés ont été utilisés pour un assemblage réel à l'aide d'un bras robotisé, démontré dans une vidéo accélérée 8x
- Cela montre la faisabilité de l'assemblage robotisé réel pour des exemples comme "un bateau élancé avec une coque longue et étroite" ou une "guitare asymétrique à 6 cordes"
Modèles LEGO générés avec textures et couleurs
- Le système permet de produire des designs LEGO capables d'exprimer aussi des textures, matériaux et effets esthétiques spécifiques à partir de prompts en langage naturel comme "un banc couvert de mousse", "un matériau cyberpunk à dégradé néon" ou "une étagère de cabinet d'étude victorien"
- Des conceptions LEGO intégrant des couleurs variées et des effets métalliques, comme "Sunburst Les Paul with amber finish", peuvent également être reflétées à partir du texte seul
Citations et soutien à la recherche
- Les informations sur l'article, les auteurs et les organismes ayant soutenu la recherche (par exemple Packard Foundation, Amazon Faculty Award) sont indiquées
- Le projet a été mené avec divers soutiens académiques et industriels, dont la Microsoft Research PhD Fellowship du chercheur principal
Références du projet et template
- Le template du site s'inspire de la mise en page des projets Custom Diffusion et DreamFusion
1 commentaires
Commentaires sur Hacker News
playsinlineà la balise video https://developer.mozilla.org/en-US/docs/…. C’est dommage qu’iOS fonctionne ainsi par défaut