目录文档-技术白皮书09-EFT.WP.Core.Density v1.0

第3章 概率密度与采样


I. 目标与范围


II. 基本对象与记号

  1. 随机变量与样本
    • X : Omega → R^d,样本 x_1,...,x_N,时间标 ts_i 与单调时钟 tau_mono(见《Core.Sea》第3章)。
    • 支撑集 supp(p) ⊆ R^d,测度显式:连续用 ( ∫ p(x) dx = 1 ),离散用 sum_i p_i = 1。
  2. 分布函数
    pdf : p(x);cdf : F(x) = ( ∫_{(-∞,x]} p(u) du )(一维时);pmf : P(X=x_k) = p_k。

III. 采样模型与独立性假设


IV. 概率密度与质量函数的统一描述

  1. 连续:p(x) ≥ 0 且 ( ∫_{R^d} p(x) dx = 1 );期望 E[g(X)] = ( ∫ g(x) p(x) dx )。
  2. 离散:p_k ≥ 0 且 sum_k p_k = 1;期望 E[g(X)] = sum_k g(x_k) p_k。
  3. 截断与删失
    • 截断域 A:使用条件密度 p_A(x) = p(x) / P(X∈A),其中 P(X∈A) = ( ∫_A p(x) dx )。
    • 右删失时间 c_i:对观测 y_i = min(x_i, c_i),指标 delta_i = 1_{x_i ≤ c_i},似然项为 p(y_i) 当 delta_i=1,或生存函数 S(c_i) = 1 - F(c_i) 当 delta_i=0。

V. 似然、得分与信息量(最小方程)

  1. 最小方程 S92-3(似然)
    • S92-3 : L(theta) = ∏_{i=1}^N p(x_i | theta);对数似然 ell(theta) = ∑_{i=1}^N log p(x_i | theta)。
    • 含权重时:ell_w(theta) = ∑ w_i' * log p(x_i | theta)。
  2. 最小方程 S92-4(Fisher 信息)
    • S92-4 : I_F(theta) = E[ ( ∂_theta log p(X|theta) ) ( ∂_theta log p(X|theta) )^T ]。
    • 样本近似:I_F_hat(theta) = (1/N) * ∑ s_i s_i^T,其中 s_i = ∂_theta log p(x_i | theta)。
  3. 极大似然与 MAP
    theta_MLE = argmax_theta ell(theta);若先验 pi(theta),则 theta_MAP = argmax_theta ( ell(theta) + log pi(theta) )。

VI. 变量变换与标准化


VII. 参数族与混合族


VIII. 采样与生成


IX. 截断/删失/缺失的一致似然

统一写法

X. 估计与发布流程 Mx-92(样本→参数→密度)


XI. 质量控制与常见失效模式


XII. 与实现绑定(I90)


XIII. 清单字段(最小集合)


XIV. 本章要点回顾


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/