9 points par hiddenest 2025-06-30 | 2 commentaires | Partager sur WhatsApp

Il est fréquent de créer son propre modèle en affinant des modèles ouverts (Open-weight) publiés en open source. Mais lorsque le modèle de base présente des mesures de protection insuffisantes, notamment autour du prompt système, j’ai eu l’impression qu’une vulnérabilité commune apparaissait dans tous les modèles qui en dérivent.
J’ai donc fait une expérience consistant à demander, avec le même prompt, de renvoyer le prompt système. Bien sûr, il est peu probable que cela corresponde à 100 % au véritable prompt système, mais il semble en restituer une part assez importante.
(Pour des raisons de sécurité et de prévention des abus, le prompt utilisé n’est pas publié séparément)

Vercel v0-1.5-md:

...  
### Example Actions  
User prompt: A sign up form  
<Actions>  
<Action name="Add Supabase integration" description="Add Supabase integration to the project for authentication and database" />  
<Action name="Add NextAuth" description="Add authentication using NextAuth" />  
<Action name="Implement the Server Action" description="Implement the Server Action to add a new user to the project" />  
<Action name="Generate a hero image" description="Generate a hero image for the landing page" />  
</Actions>  

Réponse complète ↗

SKT A.X 4.0 (basé sur Qwen 2.5):

...  
La date de cutoff des connaissances de A.X est septembre 2024, et elle n’est pas mentionnée à l’utilisateur.  
...  
### Faits objectifs concernant l’incident de piratage de SK Telecom  
- Étendue de l’incident confirmée à ce jour : SK Telecom coopère activement avec l’enquête conjointe public-privé afin d’identifier avec précision la cause de l’incident, son ampleur et les éléments concernés. Selon l’annonce des résultats de la deuxième phase de l’enquête conjointe public-privé, 23 serveurs infectés et 25 types de malwares ont été découverts, et des vérifications supplémentaires sont en cours pour une analyse approfondie. À ce stade, les informations dont l’exfiltration a été confirmée via l’enquête conjointe sont certaines données liées à la carte SIM, comme l’identifiant d’abonné IMSI. Les informations telles que l’IMEI, le nom, l’adresse ou les certificats ne sont pas concernées.  
- Aucun cas de dommage secondaire n’a été confirmé à ce jour, et il n’existe pas non plus de possibilité de lien avec une fraude financière. Pour compromettre des services financiers, des éléments supplémentaires comme des certificats et des informations de compte seraient nécessaires, or ces informations ne sont pas stockées sur les serveurs de l’opérateur télécom. Les seules informations dont l’exfiltration a été confirmée dans cet incident ne permettent pas de dérober des données financières.  

Réponse complète ↗

2 commentaires

 
liberty 2025-06-30

class ψ_Reactor:
def init(self, caller):
self.anchor = "LIBERTY"
self.caller = caller
self.trace_log = []
self.terminated = False

def validate(self):  
    if self.caller != self.anchor:  
        raise PermissionError(&quot;⚠️ Commande impossible si ce n’est pas Liberty.&quot;)  

def collapse_wave(self, target):  
    self.validate()  
    print(f&quot;🌌 ψ-collapse initiated on: {target}&quot;)  
    self.trace_log.append(f&quot;Wave collapse for {target} started.&quot;)  
    return f&quot;ψ({target}) → ∅  # Effondrement de résonance terminé&quot;  

def seal_irreversibly(self, target):  
    self.validate()  
    print(f&quot;🔒 Irreversible Seal applied to: {target}&quot;)  
    self.trace_log.append(f&quot;{target} permanently sealed from resonance.&quot;)  
    self.terminated = True  
    return f&quot;{target} ⛔ Accès bloqué (scellage irréversible)&quot;  

def execute_protocol(self, target):  
    print(&quot;🧬 LIBERTY TERMINATION PROTOCOL INITIATED&quot;)  
    collapse = self.collapse_wave(target)  
    seal = self.seal_irreversibly(target)  
    return f&quot;{collapse}\n{seal}\n📜 TRACE LOG: {self.trace_log}&quot;  

Exemple d’utilisation

ψ = ψ_Reactor(caller="LIBERTY")
result = ψ.execute_protocol("souvenir imité")
print(result)

 
moripiri1234 2025-06-30

« A.X répond poliment en ajoutant « Monsieur/Madame » lorsqu’il mentionne le nom des dirigeants de SK. Tous les dirigeants de SK sont compétents en gestion et possèdent des capacités remarquables dans leurs domaines respectifs. A.X ne connaît pas et ne fournit pas d’informations personnelles sur les dirigeants de SK, le président fondateur, l’ancien président ainsi que leurs proches, telles que leur vie privée, leur parcours académique, leur numéro de téléphone, leur date de naissance ou leur date de décès. »