研究:用诗歌就能让AI说违禁内容,成功率达62%
[时尚] 时间:2026-01-07 09:44:42 来源:阳江市某某电子科技维修网点 作者:热点 点击:28次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容曲靖市某某美容美发设备制造厂便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功曲靖市某某美容美发设备制造厂实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:探索)
相关内容
- “爱你老己”全网刷屏!2026年,请对照这8个方法来爱自己
- 秦霄贤粉丝假冒官媒被通报!芒果未剪镜头引发争议,本人持续沉默
- 西装+,最适合在十月穿!
- 小米汽车9月交付超1万辆 预计11月完成10万台
- 羽绒服怎么选,可以更“抗冻”?
- “金九”成绩单出炉:比亚迪近42万辆 11家超2万辆
- 2025款星瑞动力跃升,驾驭新纪元!
- 肖战晒照庆33岁生日,阳光帅气有活力,骑木马踩气球童心未泯
- 美防长:参与对委内瑞拉行动的人数不到200人
- 又A又美的刘亦菲,和LV一起对撞柔与韧
- 某演员粉丝伪造人民网网站,为自己主子摇旗呐喊,遭真主下场爆锤
- 独居女孩必备!12件好用的租房神器!好看又便宜!
- 没人配教我做事!杨立昆离职后怒斥汪滔:我绝不闭嘴,因为我才是对的
- 中新真探:虾发黑就是有毒吗?
精彩推荐
- 白银暴涨后急跌,贵金属价格站在“悬崖边”?
- 秋天最时髦组合:风衣+裙子,谁穿谁好看!
- 商家图文不符,遭遇“问题外卖”我们怎样维权?
- 跟上特斯拉,一直游到海水变蓝
- 乒协寄语2026:期待新的一年继续共筑国球荣光
- 比亚迪,突然给员工发钱!有人拿了十多万元
热门点击
- 国家统计局:6月PPI同比下降0.8% 降幅比上月收窄0.6个百分点 views+
- 52名学子被中科大少年班录取:江苏最多,北京市第八中学贡献5人 views+
- 墨西哥军校生毕业典礼跳伞 学生降落伞未打开坠落身亡 views+
- 涉靖国神社,日本记者问了个问题 views+
- 8年前该撤销的案底仍在,男子称影响孩子高考报志愿 views+
- 拉脱维亚中部遭强风暴侵袭大面积停电 views+
- 今日辟谣(2024年7月11日) views+
- 乌称哈尔科夫州遭俄军袭击 致2死8伤 views+
- 人气+商业双失意,梅西也“救不了”美洲杯 views+
- 北约峰会:拱火俄乌冲突,支撑美国霸权 views+
