代码

所有实验代码以 Jupyter Notebook 形式提供，可在 Google Colab 中一键运行（需要 Google 账号，无需本地环境）。

可重现性说明：Notebook 中所有随机种子已固定，运行结果与论文数字完全一致。唯一依赖是 Gemini Embedding API（需要 Google AI Studio API Key，免费额度足够运行全部实验）。

Step B · SEC 完备性验证

对应论文：§5.2 · Step B 实验

验证规程约束假设（PCA）和语义嵌入覆盖率 $\mathrm{SEC}(Q,\tau^*)=1$ 。

内容：

加载 $\mathcal{V}_{167}^{\mathrm{L}}$ 词汇表（59 条）
调用 Gemini Embedding 001 计算所有嵌入向量
枚举自然语言改写（18 条），计算最近邻距离
用 TwoNN 估计语义内在维度 $d_{\mathrm{sem}}$
输出： $\tau^*=0.0291$ ， $d_{\min}=0.0971$ ， $d_{\mathrm{sem}}=3.56$ ，SEC=1.0

Step C · 对抗鲁棒性验证

对应论文：§5.3 · Step C 实验

测量系统的覆盖上界——在随机语义扰动下，SEC 从精确等式退化为概率下界的边界在哪里。

内容：

C1：对词汇表任务施加高斯随机扰动（100 个样本）
C2：同义词替换（语义保持）对比随机扰动
C3：对抗性最近邻距离分布分析
输出：通过率 53%，最大漂移 0.4187，覆盖上界 ≈ 0.42

Step D · FAILSAFE 边界分析

对应论文：§5.4 · Step D 实验

测试规程外指令和边界指令的系统行为，定量分析合规区 / 缓冲区 / 禁止区的边界。

内容：

D1：6 条规程外指令（非电力场景），验证 FAILSAFE 触发
D2：缓冲区边界可视化（距离分布直方图）
D3：未知类型指令的缓冲区行为
D4：学术风格指令（技术英文描述）的覆盖边界
输出：6/6=100% 触发，安全间隙 0.115，缓冲区 0.30–0.41

运行说明

# 1. 点击任意 "Open in Colab" 按钮
# 2. 在 Colab 中：Runtime → Change runtime type → T4 GPU（可选，CPU 也够）
# 3. 在第一个 Cell 中填入 Gemini API Key：
GEMINI_API_KEY = "your-api-key-here"
# 4. Runtime → Run All

获取 API Key：访问 Google AI Studio → Get API key（免费，每分钟 15 次请求限制，足够运行全部 notebook）

代码结构

notebooks/
├── EICPS_StepB_SEC_Verification.ipynb      # SEC 验证（约 8 分钟）
├── EICPS_StepC_Adversarial_Verification.ipynb  # 对抗测试（约 15 分钟）
├── EICPS_StepD_FAILSAFE_Boundary.ipynb     # FAILSAFE 边界（约 10 分钟）
└── EICPS_StepBCD_Landscape.png             # 三步实验全景图