sebsauvage.net

Ce site n'est pas le site officiel.
C'est un blog automatisé qui réplique les articles automatiquement

Update

Updating database... Please wait.

Time Bandit ChatGPT jailbreak bypasses safeguards on sensitive topics

Thursday 30 January 2025 at 16:40

Comme je le dis souvent, combler les failles de sécurité des LLM, c'est comme boucher les trous d'une passoire chaque fois que vous en trouvez un. Une passoire avec un nombre infini de trous.
Là ils ont parvenus (encore) à contourner toutes les protections mises en place pour éviter qu'on demande à l'IA comment fabriquer des armes, des malwares ou des armes nucléaires.
Il ne semble pas exister pour le moment de moyen de rendre les LLM sûres.  (voir également : https://sebsauvage.net/links/?aWxI2w)
(Permalink)

Source: https://www.bleepingcomputer.com/news/security/time-bandit-chatgpt-jailbreak-bypasses-safeguards-on-sensitive-topics/


Error happened ! 0 - SQLite3::exec(): database disk image is malformed In: /home/dotmanacac/dotmana/streisand/sebsauvage/index.php:286 http://www.dotmana.com/streisand/sebsauvage/?Time-Bandit-ChatGPT-jailbreak-bypasses-safeguards-on-sensitive-topics #0 [internal function]: exception_error_handler(2, 'SQLite3::exec()...', '/home/dotmanaca...', 286, Array) #1 /home/dotmanacac/dotmana/streisand/sebsauvage/index.php(286): SQLite3->exec('DELETE FROM upd...') #2 /home/dotmanacac/dotmana/streisand/sebsauvage/index.php(451): VroumVroum_Blog->log_update(true, '0 elements upda...') #3 /home/dotmanacac/dotmana/streisand/sebsauvage/index.php(792): VroumVroum_Blog->update() #4 {main}