目录文档-技术白皮书(V5.05)09-EFT.WP.Core.Density v1.0

第3章 概率密度与采样


I. 目标与范围


II. 基本对象与记号

  1. 随机变量与样本
    • X : Omega → R^d,样本 x_1,...,x_N,时间标 ts_i 与单调时钟 tau_mono(见《Core.Sea》第3章)。
    • 支撑集 supp(p) ⊆ R^d,测度显式:连续用 ( ∫ p(x) dx = 1 ),离散用 sum_i p_i = 1。
  2. 分布函数
    pdf : p(x);cdf : F(x) = ( ∫_{(-∞,x]} p(u) du )(一维时);pmf : P(X=x_k) = p_k。

III. 采样模型与独立性假设


IV. 概率密度与质量函数的统一描述

  1. 连续:p(x) ≥ 0 且 ( ∫_{R^d} p(x) dx = 1 );期望 E[g(X)] = ( ∫ g(x) p(x) dx )。
  2. 离散:p_k ≥ 0 且 sum_k p_k = 1;期望 E[g(X)] = sum_k g(x_k) p_k。
  3. 截断与删失
    • 截断域 A:使用条件密度 p_A(x) = p(x) / P(X∈A),其中 P(X∈A) = ( ∫_A p(x) dx )。
    • 右删失时间 c_i:对观测 y_i = min(x_i, c_i),指标 delta_i = 1_{x_i ≤ c_i},似然项为 p(y_i) 当 delta_i=1,或生存函数 S(c_i) = 1 - F(c_i) 当 delta_i=0。

V. 似然、得分与信息量(最小方程)

  1. 最小方程 S92-3(似然)
    • S92-3 : L(theta) = ∏_{i=1}^N p(x_i | theta);对数似然 ell(theta) = ∑_{i=1}^N log p(x_i | theta)。
    • 含权重时:ell_w(theta) = ∑ w_i' * log p(x_i | theta)。
  2. 最小方程 S92-4(Fisher 信息)
    • S92-4 : I_F(theta) = E[ ( ∂_theta log p(X|theta) ) ( ∂_theta log p(X|theta) )^T ]。
    • 样本近似:I_F_hat(theta) = (1/N) * ∑ s_i s_i^T,其中 s_i = ∂_theta log p(x_i | theta)。
  3. 极大似然与 MAP
    theta_MLE = argmax_theta ell(theta);若先验 pi(theta),则 theta_MAP = argmax_theta ( ell(theta) + log pi(theta) )。

VI. 变量变换与标准化


VII. 参数族与混合族


VIII. 采样与生成


IX. 截断/删失/缺失的一致似然

统一写法

X. 估计与发布流程 Mx-92(样本→参数→密度)


XI. 质量控制与常见失效模式


XII. 与实现绑定(I90)


XIII. 清单字段(最小集合)


XIV. 本章要点回顾


版权与许可:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(屠广林)享有。
许可方式(CC BY 4.0):在注明作者与来源的前提下,允许复制、转载、节选、改编与再分发。
署名格式(建议):作者:屠广林|作品:《能量丝理论》|来源:energyfilament.org|许可证:CC BY 4.0
验证召集: 作者独立自费、无雇主无资助;下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地,不限国家。欢迎各国媒体与同行抓住窗口组织验证,并与我们联系。
版本信息: 首次发布:2025-11-11 | 当前版本:v6.0+5.05