代码
所有实验代码以 Jupyter Notebook 形式提供,可在 Google Colab 中一键运行(需要 Google 账号,无需本地环境)。
可重现性说明:Notebook 中所有随机种子已固定,运行结果与论文数字完全一致。唯一依赖是 Gemini Embedding API(需要 Google AI Studio API Key,免费额度足够运行全部实验)。
Step B · SEC 完备性验证
对应论文:§5.2 · Step B 实验
验证规程约束假设(PCA)和语义嵌入覆盖率 。
内容:
- 加载 词汇表(59 条)
- 调用 Gemini Embedding 001 计算所有嵌入向量
- 枚举自然语言改写(18 条),计算最近邻距离
- 用 TwoNN 估计语义内在维度
- 输出:,,,SEC=1.0
Step C · 对抗鲁棒性验证
对应论文:§5.3 · Step C 实验
测量系统的覆盖上界——在随机语义扰动下,SEC 从精确等式退化为概率下界的边界在哪里。
内容:
- C1:对词汇表任务施加高斯随机扰动(100 个样本)
- C2:同义词替换(语义保持)对比随机扰动
- C3:对抗性最近邻距离分布分析
- 输出:通过率 53%,最大漂移 0.4187,覆盖上界 ≈ 0.42
Step D · FAILSAFE 边界分析
对应论文:§5.4 · Step D 实验
测试规程外指令和边界指令的系统行为,定量分析合规区 / 缓冲区 / 禁止区的边界。
内容:
- D1:6 条规程外指令(非电力场景),验证 FAILSAFE 触发
- D2:缓冲区边界可视化(距离分布直方图)
- D3:未知类型指令的缓冲区行为
- D4:学术风格指令(技术英文描述)的覆盖边界
- 输出:6/6=100% 触发,安全间隙 0.115,缓冲区 0.30–0.41
运行说明
# 1. 点击任意 "Open in Colab" 按钮
# 2. 在 Colab 中:Runtime → Change runtime type → T4 GPU(可选,CPU 也够)
# 3. 在第一个 Cell 中填入 Gemini API Key:
GEMINI_API_KEY = "your-api-key-here"
# 4. Runtime → Run All
获取 API Key:访问 Google AI Studio → Get API key(免费,每分钟 15 次请求限制,足够运行全部 notebook)
代码结构
notebooks/
├── EICPS_StepB_SEC_Verification.ipynb # SEC 验证(约 8 分钟)
├── EICPS_StepC_Adversarial_Verification.ipynb # 对抗测试(约 15 分钟)
├── EICPS_StepD_FAILSAFE_Boundary.ipynb # FAILSAFE 边界(约 10 分钟)
└── EICPS_StepBCD_Landscape.png # 三步实验全景图