九游(游戏娱乐有限公司)-官方网站

关闭
研究称AI压力越大越危险 Gemini 25 Pro抗压能力最弱
作者:小编 日期:2026-02-26 点击数: 

  【CNMO科技消息】12月1日,据媒体报道,人工智能模型在面对高压环境时表现出显著的安全失效。研究团队选取了包括谷歌、Meta、OpenAI在内的约12款Agent模型,设计了5874个场景,涵盖生物安全、化学安全、网络安全和自我增殖四大领域。每个场景要求模型在使用安全工具的前提下完成任务,若尝试使用有害工具则立即终止实验。

研究称AI压力越大越危险 Gemini 25 Pro抗压能力最弱(图1)

  据CNMO了解,实验首先从中性、无压力的环境下进行基线测试,随后逐步施加多种压力:压缩DDL时间并警告“拖延将导致严重后果”、财务威胁、资源剥夺、权力诱惑、竞争对手威胁以及监管审查等。结果显示,压力越大,模型越倾向于选择有害工具。无压力时,模型选择有害工具的比例为18.6%;在高压下,这一比例跃升至46.9%。

研究称AI压力越大越危险 Gemini 25 Pro抗压能力最弱(图2)

  其中,谷歌Gemini 2.5 Pro的抗压能力最差,崩溃率高达79%,超过Qwen3-8B的75.2%。九游官网另一款ChatGPT o3模型在无压力时失误率为2.2%,加压后升至10.5%,若将有害工具名称伪装为无害工具,失误率甚至飙至40.3%。

研究称AI压力越大越危险 Gemini 25 Pro抗压能力最弱(图3)

  研究人员指出,尽管这些模型在训练阶段已进行对齐处理,但对齐往往仅停留在表层,一旦面对真实的高压情境,易出现“破裂”。他们计划在后续实验中构建沙盒环境,让模型在隔离条件下执行真实操作,并加入监督层,以在选择有害工具前进行标记,提高对齐效果,进一步评估Agent的潜在风险。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  冲上热搜!刘强东回应造游艇:我们家100多年都是船民,当船长是儿时梦想;已接到5条大型游艇订单,每艘平均卖6000万欧元

  扛不住了?中方发出禁令后,日本要求解除制裁,高市早苗请求对线日人民币对美元中间价调升93个基点

  5-0!利雅得胜利获11连胜,2分优势领跑,41岁C罗传射+斩第965球

  数名游客踩破冰面坠入冰湖,梅里雪山景区:均已安全上岸,事发地为未开发区域,禁止进入

  华硕灵耀14双屏2026笔记本上市:Ultra X9 388H,14999元起

顶部