目录文档-技术白皮书56-报告级方法附录 Template v1.0

第5章 数据与实验设计


I. 章节目标与范围(强制)


II. 数据资产清单(强制)


III. 抽样框架与随机化(强制)


IV. 对照与变量控制(强制)


V. 度量、单位与计量一致性(强制)

  1. 对涉及方程的观测量给出单位与量纲:unit/dim;在机读层 check_dim=true。
  2. 若实验涉及到达时判据,统一:
    • 常量外提:T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell )
    • 一般口径:T_arr = ( ∫ ( n_eff / c_ref ) d ell )
      同段声明路径 gamma(ell) 与测度 d ell。

VI. 合规、伦理与安全(强制)


VII. 最小复现实例(强制)


VIII. 人读 × 机读字段(强制)

人读项

机读字段

校核要点

数据集清单

data.datasets[]

name@version 与许可/哈希齐备

抽样与窗口

data.sampling, data.window

分层变量、时间窗明确

对照与变量控制

data.controls, data.baseline

受控/漂移变量分明

计量一致性

metrology.*, math.check_dim

单位/量纲/CI 完整

到达时口径

math.statements[], math.path/measure

gamma(ell)、d ell 显式

复现实例

reproducibility.*

容器/脚本/命令/哈希可回放

合规与安全

compliance.*, security.*

许可/访问分级/留存期


IX. 字段与约束清单(可直接拷贝)

字段路径

类型

必填

约束

data.datasets[].name

string

唯一

data.datasets[].version

string

语义或日期

data.datasets[].hash

string

建议

sha256: 前缀

data.datasets[].license

string

SPDX 或文本

data.partition

obj

{train,valid,test} 比例

data.window.{t0,t1,timezone}

obj

ISO8601/UTC

data.sampling.method

enum

`stratified

data.sampling.variables[]

list

分层键

data.controls.controlled[]

list

受控变量

data.controls.drifting[]

list

允许漂移

data.baseline

string

Option Base

metrology.units[]

list

如 ["s","m","kg"]

metrology.dimensions[]

list

如 ["T","L","L T^-1"]

math.statements[]

list

含主方程

math.path/measure

string

若含 T_arr 必填

gamma(ell) / d ell

math.check_dim

bool

true

compliance.license_terms

text

复用限制

security.access_tiers[]

list

owner/contrib/read

reproducibility.container

string

image@sha256:…

reproducibility.scripts[]

list

script@commit

reproducibility.repro_cmd

string

最小复现命令


X. 机读 Schema(YAML;JSON 等价,强制)

data:

datasets:

- { name: "cmb_set_v3", version: "v3", hash: "sha256:…", license: "CC-BY-4.0" }

- { name: "lens_v1", version: "v1", hash: "sha256:…", license: "CC-BY-4.0" }

partition: { train: 0.7, valid: 0.15, test: 0.15 }

window: { t0: "2025-01-01T00:00:00Z", t1: "2025-06-30T23:59:59Z", timezone: "UTC" }

sampling:

method: "stratified"

variables: ["region","band"]

controls:

controlled: ["instrument","pipeline_version"]

drifting: ["weather","solar_activity"]

baseline: "Option Base"

metrology:

units: ["s","m","kg"]

dimensions: ["T","L","L T^-1"]

calibration: ["Mx-*"]

math:

statements:

- "T_arr = ( ∫ ( n_eff / c_ref ) d ell )"

path: "gamma(ell)"

measure: "d ell"

symbols:

- { name: "n_eff", unit: "1", dim: "1" }

- { name: "c_ref", unit: "m·s^-1", dim: "L T^-1" }

check_dim: true

compliance:

license_terms: "No re-identification; redistribution restricted to partners."

pii_policy: "de-identified; k-anonymity>=10"

security:

access_tiers: ["owner","contrib","read"]

retention_days: 365

audit_log: true

reproducibility:

container: "registry/replay:2025.09@sha256:…"

scripts: ["prep_data.py@a1b2c3","split_partitions.py@9f8e7d"]

repro_cmd: "docker run … prep_data.py --in /mnt/raw --out /mnt/curated && split_partitions.py --seed 20250927"

artifacts: ["yaml","json","pdf"]


XI. 最小样稿(人读摘要 × 机读片段,强制)

  1. 人读摘要:
    • 采用分层抽样(region×band);观察窗口 2025-01-01 至 2025-06-30(UTC)。基线 Option Base。
    • 到达时采用一般口径:T_arr = ( ∫ ( n_eff / c_ref ) d ell );路径 gamma(ell) 与测度 d ell 同段声明;check_dim=true。
  2. 机读片段:

data:

sampling: { method: "stratified", variables: ["region","band"] }

math:

statements: ["T_arr = ( ∫ ( n_eff / c_ref ) d ell )"]

path: "gamma(ell)"

measure: "d ell"

check_dim: true


XII. 校验规则(正则/一致性,强制)


XIII. 引用与交叉引用体例(强制)

;EFT.WP.* 引用需显式版本与锚点,并在 references.see[] 提供机读清单。“见《<卷名> vX.Y》Ch.x S/P/M/I…”固定写法:

版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/