目录 / 文档-技术白皮书 / 56-报告级方法附录 Template v1.0
I. 章节目标与范围(强制)
- 固定报告级数据与实验设计的可复现口径,覆盖:数据集@版本、抽样与对照、变量与批次控制、观察窗口与随机化、合规与许可、最小复现实例。
- 与第3章机读结构、第7章计量与校准、第8章评测协议、第11章实现绑定对齐。
II. 数据资产清单(强制)
- 数据集标识:name@version;来源、许可与可用性窗口(UTC 时区)。
- 分区与切分:train/valid/test 或等价;跨环境保持同一哈希与行序。
- 伴随元数据:采集口径、时间覆盖、地理范围、脱敏策略、缺失值与异常处理。
III. 抽样框架与随机化(强制)
- 抽样方式:分层/整群/系统/简单随机;给出层次变量与比例。
- 观察窗口:[t0, t1];滚动实验注明步长/重叠。
- 随机化:设随机种子与复现实例;跨批次防泄漏策略(如按主体或地理划分)。
IV. 对照与变量控制(强制)
- 对照组/基线:Option Base 明确;列出受控变量与允许漂移变量。
- 协变量与混杂:列出include/exclude清单;给出消融与敏感性计划接口(见第10章)。
- 批次与地区:batch、region 作为分组键;报告批次效应校正方法。
V. 度量、单位与计量一致性(强制)
- 对涉及方程的观测量给出单位与量纲:unit/dim;在机读层 check_dim=true。
- 若实验涉及到达时判据,统一:
- 常量外提:T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell )
- 一般口径:T_arr = ( ∫ ( n_eff / c_ref ) d ell )
并同段声明路径 gamma(ell) 与测度 d ell。
VI. 合规、伦理与安全(强制)
- 许可与限制:列出许可证、PII/PHI 去标识策略、再分发限制。
- 安全:访问分级、审计轨与留存期;数据销毁与再生成流程。
- 偏倚与公平:采样/评测阶段的偏倚监测指标与门禁。
VII. 最小复现实例(强制)
- 容器镜像、数据挂载、脚本与命令;输出工件(yaml/json/pdf)与哈希。
- 复现通过线:数据行数/哈希校验、分区一致性、统计摘要一致性(均值/方差/分位数)。
VIII. 人读 × 机读字段(强制)
人读项 | 机读字段 | 校核要点 |
|---|---|---|
数据集清单 | data.datasets[] | name@version 与许可/哈希齐备 |
抽样与窗口 | data.sampling, data.window | 分层变量、时间窗明确 |
对照与变量控制 | data.controls, data.baseline | 受控/漂移变量分明 |
计量一致性 | metrology.*, math.check_dim | 单位/量纲/CI 完整 |
到达时口径 | math.statements[], math.path/measure | gamma(ell)、d ell 显式 |
复现实例 | reproducibility.* | 容器/脚本/命令/哈希可回放 |
合规与安全 | compliance.*, security.* | 许可/访问分级/留存期 |
IX. 字段与约束清单(可直接拷贝)
字段路径 | 类型 | 必填 | 约束 |
|---|---|---|---|
data.datasets[].name | string | 是 | 唯一 |
data.datasets[].version | string | 是 | 语义或日期 |
data.datasets[].hash | string | 建议 | sha256: 前缀 |
data.datasets[].license | string | 是 | SPDX 或文本 |
data.partition | obj | 是 | {train,valid,test} 比例 |
data.window.{t0,t1,timezone} | obj | 是 | ISO8601/UTC |
data.sampling.method | enum | 是 | `stratified |
data.sampling.variables[] | list | 否 | 分层键 |
data.controls.controlled[] | list | 否 | 受控变量 |
data.controls.drifting[] | list | 否 | 允许漂移 |
data.baseline | string | 是 | Option Base |
metrology.units[] | list | 是 | 如 ["s","m","kg"] |
metrology.dimensions[] | list | 是 | 如 ["T","L","L T^-1"] |
math.statements[] | list | 否 | 含主方程 |
math.path/measure | string | 若含 T_arr 必填 | gamma(ell) / d ell |
math.check_dim | bool | 是 | true |
compliance.license_terms | text | 是 | 复用限制 |
security.access_tiers[] | list | 是 | owner/contrib/read |
reproducibility.container | string | 是 | image@sha256:… |
reproducibility.scripts[] | list | 是 | script@commit |
reproducibility.repro_cmd | string | 是 | 最小复现命令 |
X. 机读 Schema(YAML;JSON 等价,强制)
data:
datasets:
- { name: "cmb_set_v3", version: "v3", hash: "sha256:…", license: "CC-BY-4.0" }
- { name: "lens_v1", version: "v1", hash: "sha256:…", license: "CC-BY-4.0" }
partition: { train: 0.7, valid: 0.15, test: 0.15 }
window: { t0: "2025-01-01T00:00:00Z", t1: "2025-06-30T23:59:59Z", timezone: "UTC" }
sampling:
method: "stratified"
variables: ["region","band"]
controls:
controlled: ["instrument","pipeline_version"]
drifting: ["weather","solar_activity"]
baseline: "Option Base"
metrology:
units: ["s","m","kg"]
dimensions: ["T","L","L T^-1"]
calibration: ["Mx-*"]
math:
statements:
- "T_arr = ( ∫ ( n_eff / c_ref ) d ell )"
path: "gamma(ell)"
measure: "d ell"
symbols:
- { name: "n_eff", unit: "1", dim: "1" }
- { name: "c_ref", unit: "m·s^-1", dim: "L T^-1" }
check_dim: true
compliance:
license_terms: "No re-identification; redistribution restricted to partners."
pii_policy: "de-identified; k-anonymity>=10"
security:
access_tiers: ["owner","contrib","read"]
retention_days: 365
audit_log: true
reproducibility:
container: "registry/replay:2025.09@sha256:…"
scripts: ["prep_data.py@a1b2c3","split_partitions.py@9f8e7d"]
repro_cmd: "docker run … prep_data.py --in /mnt/raw --out /mnt/curated && split_partitions.py --seed 20250927"
artifacts: ["yaml","json","pdf"]
XI. 最小样稿(人读摘要 × 机读片段,强制)
- 人读摘要:
- 采用分层抽样(region×band);观察窗口 2025-01-01 至 2025-06-30(UTC)。基线 Option Base。
- 到达时采用一般口径:T_arr = ( ∫ ( n_eff / c_ref ) d ell );路径 gamma(ell) 与测度 d ell 同段声明;check_dim=true。
- 机读片段:
data:
sampling: { method: "stratified", variables: ["region","band"] }
math:
statements: ["T_arr = ( ∫ ( n_eff / c_ref ) d ell )"]
path: "gamma(ell)"
measure: "d ell"
check_dim: true
XII. 校验规则(正则/一致性,强制)
- 数据集标识:^[A-Za-z0-9_\-]+@v?\d+(\.\d+)*$;哈希:^sha256:[0-9a-f]{64}$。
- 时间窗:t0 ≤ t1 且时区为 UTC。
- 抽样方法:method ∈ {stratified,cluster,systematic,srs}。
- 到达时:若出现 T_arr,则 math.path 与 math.measure 必填;math.check_dim=true。
- 分区:train+valid+test=1.0(误差≤1e-6)。
XIII. 引用与交叉引用体例(强制)
;EFT.WP.* 引用需显式版本与锚点,并在 references.see[] 提供机读清单。“见《<卷名> vX.Y》Ch.x S/P/M/I…”固定写法:版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/