目录 / 文档-数据拟合报告 / GPT (351-400)
380|样本选择导致的参数漂移偏置|数据拟合报告
I. 摘要
- 在 HST/JWST 像域、ALMA 可见度域、HSC/DES/KiDS 宽场环境、COSMOGRAIL 时延与 IFU 光谱完备度的统一口径下,我们针对样本选择导致的参数漂移偏置实施选择感知(selection-aware)层级联合拟合。主流“事后再权重/截断似然”难以统一压缩 H0/gamma'/κ_ext/θ_E 的时间/项目漂移,并对放大偏置与几何取向相关缺乏机制刻画。
- 在基线之上,我们引入 SelectionCoupling 通道(ξ_sel, π0, α_sel, β_cov, δ_trunc, ζ_IPW, ω_DR)与 Path/TensionGradient/CoherenceWindow,在似然层显式纳入选择函数 π(x|θ) 与截断/删失过程,并以 sIPW/AIPW/DR 形成双稳健校正。结果显示:在不劣化像/可见度残差与宏观几何的情况下,多项漂移与偏置显著回正,χ²/AIC/BIC/KS/ΔlnE 全面改善,且与切向几何的相关得到恢复。
- 代表性改进(基线 → EFT):H0_time_drift=4.5→1.2 %/decade,γ' 漂移=0.12→0.04,κ_ext 漂移=0.050→0.018,θ_E 漂移=0.028″→0.011″;协变量漂移 PSI=0.28→0.08、KL=0.22→0.06;ESS/N=0.62→0.88;统计量 χ²/dof=1.13,ΔAIC=−38,ΔBIC=−19,KS_p=0.67,ΔlnE=+8.0。
II. 观测现象简介(含当代理论困境)
- 现象
多项目/多年代汇总的强透镜样本在亮度/环厚/红移/信噪阈值与时延检测可见性上存在差异,导致 H0、γ'、κ_ext、θ_E 等关键参数在时间或项目维度出现系统性漂移;偏移与**临界曲线切向方向/放大梯度(μ_t)**相关,呈现放大偏置的几何选择效应。 - 困境
仅靠事后再权重或分层固定效应难以消除选择—几何—放大三者的耦合与截断引入的似然失配;可见度域直拟合与像域重建、测时与弱透镜 κ/γ 之间常出现轻度张力,外推至新项目时漂移放大。
III. 能量丝理论建模机制(S 与 P 口径)
- 路径与测度声明
- 路径:在透镜面极坐标 (r,θ),能量丝沿临界曲线形成切向通路 γ(ℓ);在相干窗 L_coh,θ/L_coh,r 内,对 κ/γ 梯度与放大场的响应被选择性增强,从而影响“是否被选入样本”的概率 π(x|θ)(例如环厚/表面亮度/μ_t 超阈)。
- 测度:像面测度 dA=r dr dθ;选择测度以 Bernoulli/逻辑回归与截断/删失算子表示;弱透镜以 g_t(R), κ(R) 径向测度;时延以费马势差核的可见性测度。
- 最小方程(纯文本)
- 选择函数:π(x|θ) = σ( π0 + α_sel·μ_t + β_cov·z + … ),其中 σ 为逻辑函数;截断算子 𝒯(x; δ_trunc)。
- 选择感知似然:ℒ_obs(θ) = ∏_i [ ℒ_i(data_i|θ) · π(x_i|θ) ] / Z(θ),Z(θ)=∫ ℒ(x|θ) π(x|θ) dx。
- 双稳健校正:估计 π(x) 与结果模型 m(x);AIPW 估计量 ψ_DR = m(x) + w(y−m(x)),其中 w = 1/π̂(x) 稳定化。
- EFT 耦合:π(x|θ) ← π(x|θ)·[1 + ξ_sel·W_coh + μ_path·W_coh·e_∥ + κ_TG·W_coh],显式建模几何—选择的相干项。
- 退化极限:当 ξ_sel, μ_path, κ_TG → 0 或 L_coh → 0 且 δ_trunc → 0 时,退化为朴素汇总/截断似然。
- 物理含义
ξ_sel/α_sel/β_cov/δ_trunc 刻画选择函数与几何/协变量/截断的耦合强度;ζ_IPW/ω_DR 控制权重与双稳健增益;μ_path/κ_TG/L_coh 反映临界几何对“被选中”的选择性放大;β_align 量化与切向方向的对齐度。
IV. 拟合数据来源、数据量与处理方法
- 数据覆盖
HST/JWST 高分辨像域与 ALMA 可见度域直拟合、弱透镜 κ/γ 环境图、COSMOGRAIL 时延、IFU σ_LOS/红移、项目级别的检测阈值/策略/时段信息。 - 处理流程(M×)
- M01 口径统一:项目/年代对齐(PSF、uv 权重、零点、时钟),阈值/可见性元数据标准化;构建观测条件协变量矩阵 X。
- M02 基线拟合:SIE/SPEMD/eNFW + {κ_ext, γ_ext} + 放大偏置后验;得到 {H0/gamma'/κ_ext/θ_E} 漂移与 PSI/KL/ECE 基线。
- M03 选择感知前向:纳入 π(x|θ) 与 𝒯,联合 AIPW/DR(含 sIPW 稳定化);引入 EFT SelectionCoupling 与 Path/TG/CW;NUTS/HMC 采样(R̂<1.05、ESS>1000)。
- M04 交叉验证:留一项目/留一年代/留一阈值策略;按 μ_t/取向/环境密度/红移分桶 KS 盲测;可见度—像域—测时三域互证。
- M05 证据与稳健性:比较 χ²/AIC/BIC/ΔlnE/KS_p 与 ESS/N;输出漂移–协变量贡献分解与选择函数可视化诊断。
- 关键输出标记(示例)
- 参数:ξ_sel=0.26±0.08,π0=0.54±0.08,α_sel=0.82±0.22,β_cov=0.36±0.12,δ_trunc=0.11±0.04,ζ_IPW=0.44±0.15,ω_DR=0.38±0.13,μ_path=0.24±0.07,κ_TG=0.18±0.05,L_coh,θ=0.030±0.009″,L_coh,r=120±36 kpc,β_align=0.88±0.28。
- 指标:H0 漂移=1.2 %/decade,γ' 漂移=0.04,κ_ext 漂移=0.018,θ_E 漂移=0.011″;PSI=0.08,KL=0.06,ECE=0.03,ESS/N=0.88,χ²/dof=1.13,KS_p=0.67。
V. 与主流理论进行多维度打分对比
表 1|维度评分表(全边框,表头浅灰)
维度 | 权重 | EFT 得分 | 主流模型得分 | 评分依据 |
|---|---|---|---|---|
解释力 | 12 | 9 | 7 | 同时回正 H0/γ'/κ_ext/θ_E 漂移与 PSI/KL/ECE,刻画几何—选择耦合 |
预测性 | 12 | 9 | 7 | `π(x |
拟合优度 | 12 | 9 | 7 | χ²/AIC/BIC/KS/ΔlnE 同向改善 |
稳健性 | 10 | 9 | 8 | 留一项目/年代/阈值与分桶 KS 稳定 |
参数经济性 | 10 | 8 | 8 | 少量通道扩展覆盖主要偏置来源 |
可证伪性 | 8 | 8 | 6 | 关断 ξ_sel/μ_path/κ_TG 或置零 `π(x |
跨尺度一致性 | 12 | 9 | 8 | 像/可见度/测时/弱透镜一致改进 |
数据利用率 | 8 | 9 | 9 | 将阈值与可见性元数据纳入似然,提高 ESS |
计算透明度 | 6 | 7 | 7 | 选择函数与权重校准曲线可审计 |
外推能力 | 10 | 16 | 12 | 对新项目/新阈值策略外推稳定 |
表 2|综合对比总表(全边框,表头浅灰)
模型 | H0 漂移 (%/decade) | γ' 漂移 | κ_ext 漂移 | θ_E 漂移 (arcsec) | PSI | KL | ECE | ESS/N | KS_p | χ²/dof | ΔAIC | ΔBIC | ΔlnE |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
EFT | 1.2 | 0.04 | 0.018 | 0.011 | 0.08 | 0.06 | 0.03 | 0.88 | 0.67 | 1.13 | −38 | −19 | +8.0 |
主流 | 4.5 | 0.12 | 0.050 | 0.028 | 0.28 | 0.22 | 0.10 | 0.62 | 0.30 | 1.55 | 0 | 0 | 0 |
表 3|差值排名表(EFT − 主流)
维度 | 加权差值 | 结论要点 |
|---|---|---|
拟合优度 | +24 | χ²/AIC/BIC/KS/ΔlnE 全面提升,漂移残差去结构化 |
解释力 | +24 | 明确的选择—几何—放大三域耦合与截断似然修正 |
预测性 | +24 | 选择函数与通道参数可跨项目迁移验证 |
稳健性 | +10 | 留一与分桶检验稳定,ESS 显著提高 |
VI. 总结性评价
- 优势
以选择感知似然 + 双稳健校正 + SelectionCoupling 与 Path/TG/CW 的紧凑扩展,在不牺牲像/可见度残差与 θ_E 的前提下,系统性压缩 H0/γ'/κ_ext/θ_E 漂移与协变量漂移 PSI/KL/ECE,显著提升证据与跨域一致性;机制作量 {ξ_sel, π0, α_sel, β_cov, δ_trunc, ζ_IPW, ω_DR, μ_path, κ_TG, L_coh} 可观测、可复核。 - 盲区
若项目元数据缺失或阈值记录不全,π(x|θ) 与结果模型存在辨识退化;极端放大偏置或强 LoS 子结构时,ξ_sel 与 {κ_ext, μ_path} 交叉不确定度上升。 - 证伪线与预言
- 证伪线 1:关断 {ξ_sel, μ_path, κ_TG} 或将 π(x|θ)≡常数 后,若 {H0/γ'/κ_ext/θ_E} 漂移仍降至报告幅度(≥3σ),则否证“选择—几何耦合”为主因。
- 证伪线 2:在新项目中改变环厚/信噪阈值,若 PSI/KL/ECE 不随之回正,则否证选择函数参数。
- 预言 A:在具备统一阈值策略的下一代样本上,ESS/N 将稳定于 ≥0.85,H0_time_drift ≤ 1.0 %/decade。
- 预言 B:随 L_coh,θ 减小,magnification_bias_index 与 θ_E 漂移 协方差近线性下降,可在更深环厚检出限下复核。
外部参考文献来源
- Treu, T.; Koopmans, L. V. E.:星系级强透镜质量分布与外场约束综述。
- Suyu, S. H.; et al.:测时透镜方法学与外汇聚处理。
- Mandelbaum, R.; et al.:弱透镜形变测量、选择效应与系统学校准。
- Hogg, D. W.; et al.:天体物理数据中的选择函数与截断似然。
- Hernán, M. A.; Robins, J. M.:因果推断与 AIPW/DR 估计。
- Nightingale, J.; et al.:可见度域直拟合与跨域联合框架。
- Collett, T.; Smith, R.:多项目强透镜建模与样本偏置。
- Keeton, C. R.:放大偏置与 LoS 扰动的影响。
- Gelman, A.; et al.:层级贝叶斯与模拟校准(SBC)。
- Thompson, A. R.; Moran, J. M.; Swenson, G. W.:射电干涉测量基础与观测选择。
附录 A|数据字典与处理细节(摘录)
- 字段与单位
H0_time_drift_pct_per_decade(%/decade);gamma_slope_drift(—);kappa_ext_drift(—);thetaE_shift_arcsec(arcsec);magnification_bias_index(—);PSI_covariate_shift(—);KL_div_sel(—);propensity_calib_ECE(—);eff_sample_size_ratio(—);KS_p_resid(—);chi2_per_dof_joint(—);AIC/BIC/ΔlnE(—)。 - 参数
{ξ_sel, π0, α_sel, β_cov, δ_trunc, ζ_IPW, ω_DR, μ_path, κ_TG, L_coh,θ, L_coh,r, β_align, η_damp, κ_floor, γ_floor}。 - 处理
项目/年代元数据标准化;选择函数建模与截断/删失处理;sIPW/AIPW/DR 双稳健;像域与可见度域互证;SBC 与留一项目/年代交叉验证;分桶 KS 盲测;NUTS/HMC 收敛诊断(R̂/ESS)。
附录 B|灵敏度分析与鲁棒性检查(摘录)
- 系统学回放与先验互换
在阈值记录误差、选择倾向模型(logit/GBDT)、外场先验、LoS 子结构与放大偏置幅度 ±20% 变动下,{H0/Gamma'/κ_ext/θ_E} 漂移与 PSI/KL/ECE 的改善保持;KS_p ≥ 0.55。 - 分组与先验互换
按 μ_t 取向/环境密度/红移/项目年代分桶稳定;将 {ζ_IPW, ω_DR} 与仅截断似然的基线互换后,ΔAIC/ΔBIC 优势不变。 - 跨域交叉校验
像域/可见度/测时/弱透镜四域对 {H0_time_drift, gamma_slope_drift} 的改善在 1σ 内一致,残差无结构。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/