一个常见误解
很多人认为:
“模型在高风险场景中偏保守,是因为安全对齐或合规要求。”
这只是表象。
真正原因:执行态被风险信号劫持
在缺乏执行态约束的系统中:
风险词
情绪词
责任暗示
会直接触发模型进入:
防御 / 回避 / 模糊输出态
这不是“谨慎”,而是:
分析态被中断,结论态被压制。
为什么这种偏保守是“系统性”的
因为:
没有硬性锚点权重
没有执行态锁定
没有“何时允许给结论”的 Gate
模型只能选择最安全的路径。
后果
输出稳定性下降
决策价值下降
人类误以为“模型不行”
而真正的问题,从未被修复。