- Construction de
FontoGen, un modèle de machine learning (ML) génératif pour la création de polices
- Le modèle prend en entrée une description de police et fournit en sortie un fichier de police
- L’auteur, inspiré par l’essor de l’IA en 2023, s’est mis à explorer la génération de SVG à partir de texte, ce qui lui a donné l’idée de la génération de polices
- Le modèle a été construit en s’appuyant sur l’article IconShop2, et il a été constaté qu’il était possible de générer des polices de manière similaire à la génération de SVG
- Le modèle est un modèle sequence-to-sequence entraîné sur une séquence où l’embedding de police suit l’embedding de texte
- Les embeddings de texte ont été générés à l’aide d’un modèle encodeur BERT préentraîné, et les embeddings de police en convertissant les polices en séquences de tokens
- Le modèle est un transformer auto-régressif à encodeur seul, composé de 16 couches et de 8 blocs, pour un total de 73,7 millions de paramètres
- L’auteur a utilisé l’attention BigBird3 pour se concentrer sur le prompt initial et observer les N tokens précédents afin de capturer le style de plusieurs glyphes antérieurs
- Le modèle a été entraîné sur un dataset unique de 71k polices dont les différents types de descriptions ont été résumés en quelques mots-clés à l’aide de GPT-3.5
- L’entraînement a duré 127 heures et a été interrompu lorsque la perte de validation ne s’améliorait presque plus
- L’auteur a triplé les performances en déplaçant autant que possible le travail vers l’étape de prétraitement du dataset
- L’auteur suggère des applications futures potentielles, comme l’intégration du modèle dans des éditeurs de polices existants afin de générer tous les autres glyphes à partir d’un seul glyphe créé par un designer
2 commentaires
Crée-moi une police mignonne
Avis Hacker News