代码

所有实验代码以 Jupyter Notebook 形式提供,可在 Google Colab 中一键运行(需要 Google 账号,无需本地环境)。

可重现性说明:Notebook 中所有随机种子已固定,运行结果与论文数字完全一致。唯一依赖是 Gemini Embedding API(需要 Google AI Studio API Key,免费额度足够运行全部实验)。


Step B · SEC 完备性验证

对应论文:§5.2 · Step B 实验

验证规程约束假设(PCA)和语义嵌入覆盖率 SEC(Q,τ)=1\mathrm{SEC}(Q,\tau^*)=1

内容

  • 加载 V167L\mathcal{V}_{167}^{\mathrm{L}} 词汇表(59 条)
  • 调用 Gemini Embedding 001 计算所有嵌入向量
  • 枚举自然语言改写(18 条),计算最近邻距离
  • 用 TwoNN 估计语义内在维度 dsemd_{\mathrm{sem}}
  • 输出:τ=0.0291\tau^*=0.0291dmin=0.0971d_{\min}=0.0971dsem=3.56d_{\mathrm{sem}}=3.56,SEC=1.0

Open In Colab


Step C · 对抗鲁棒性验证

对应论文:§5.3 · Step C 实验

测量系统的覆盖上界——在随机语义扰动下,SEC 从精确等式退化为概率下界的边界在哪里。

内容

  • C1:对词汇表任务施加高斯随机扰动(100 个样本)
  • C2:同义词替换(语义保持)对比随机扰动
  • C3:对抗性最近邻距离分布分析
  • 输出:通过率 53%,最大漂移 0.4187,覆盖上界 ≈ 0.42

Open In Colab


Step D · FAILSAFE 边界分析

对应论文:§5.4 · Step D 实验

测试规程外指令和边界指令的系统行为,定量分析合规区 / 缓冲区 / 禁止区的边界。

内容

  • D1:6 条规程外指令(非电力场景),验证 FAILSAFE 触发
  • D2:缓冲区边界可视化(距离分布直方图)
  • D3:未知类型指令的缓冲区行为
  • D4:学术风格指令(技术英文描述)的覆盖边界
  • 输出:6/6=100% 触发,安全间隙 0.115,缓冲区 0.30–0.41

Open In Colab


运行说明

# 1. 点击任意 "Open in Colab" 按钮
# 2. 在 Colab 中:Runtime → Change runtime type → T4 GPU(可选,CPU 也够)
# 3. 在第一个 Cell 中填入 Gemini API Key:
GEMINI_API_KEY = "your-api-key-here"
# 4. Runtime → Run All

获取 API Key:访问 Google AI Studio → Get API key(免费,每分钟 15 次请求限制,足够运行全部 notebook)


代码结构

notebooks/
├── EICPS_StepB_SEC_Verification.ipynb      # SEC 验证(约 8 分钟)
├── EICPS_StepC_Adversarial_Verification.ipynb  # 对抗测试(约 15 分钟)
├── EICPS_StepD_FAILSAFE_Boundary.ipynb     # FAILSAFE 边界(约 10 分钟)
└── EICPS_StepBCD_Landscape.png             # 三步实验全景图