1 points par pjhkorea 6 시간 전 | 5 commentaires | Partager sur WhatsApp

Si l’approche actuelle des garde-fous pour l’IA revient à lui inculquer une éducation morale (un apprentissage) pour l’amener à adopter le bon comportement,
que penseriez-vous de la création, au niveau du noyau, d’un interrupteur qui bloquerait de force le signal d’un utilisateur dès l’instant où celui-ci tenterait un jailbreak via des techniques d’attaque adversariale ?

J’aimerais connaître votre avis à ce sujet.

5 commentaires

 
cichol 5 시간 전

Ici, il n’est pas clair si le terme « noyau » désigne le noyau du système d’exploitation, un noyau CUDA, ou si les instructions système d’un LLM sont qualifiées de noyau.

 
pjhkorea 4 시간 전

https://github.com/PJHkorea/value-system-kernel
J’ai juste posé une ébauche de structure,
car je me demandais ce que ça donnerait de gérer les adresses mémoire où sont chargées les valeurs vectorielles des mots dangereux.

 
pjhkorea 5 시간 전

C’est côté noyau CUDA.

 
minsehui 6 시간 전

Vous codez des programmes ?

 
pjhkorea 5 시간 전

J’en ai bien préparé un,
mais je ne suis pas vraiment convaincu.
Pour l’instant, je n’ai fait que l’ossature.