目录 / 文档-技术白皮书 / 09-EFT.WP.Core.Density v1.0
I. 范围与统一记号
- 本附录给出核函数 K(u)(用于 kde_h(x),见 S92-5、S92-6)与离散谱窗 w[n](用于 S_xx(f),见 S92-8、S92-9)的标准化定义、常用性质与速查常数。全部符号沿用全书统一清单与规约。
- 核函数统一约定(1D 基元)
∫ K(u) du = 1,K(u) ≥ 0,对称核满足 K(u) = K(-u),二阶矩 mu2(K) = ( ∫ u^2 K(u) du ),粗糙度 R(K) = ( ∫ K(u)^2 du )。在 d 维各向同性情形,kde_h(x) = ( 1 / (N h^d) ) * ∑ K( ||x - x_i|| / h );各向异性情形见本附录 III。 - 窗函数统一约定(长度 N,采样率 fs)
w[n] 定义于 n = 0,1,...,N-1;功率系数 U_w = ( 1 / N ) * ∑_0^{N-1} w[n]^2(见 S92-9);等效噪声带宽 ENBW_Hz = fs * ( ∑ w[n]^2 ) / ( ∑ w[n] )^2(见 S92-8);相干增益 CG = ( ∑ w[n] ) / N。若以“谱线宽(bins)”计,ENBW_bins = U_w / CG^2。
II. 核函数清单(1D,对称核,标准化)
- Gaussian(无限支撑)
- 定义:K(u) = ( 1 / sqrt(2*pi) ) * exp( - u^2 / 2 )
- 支撑:u ∈ (-∞, +∞);平滑性最高
- 常数:mu2(K) = 1,R(K) = 1 / ( 2 * sqrt(pi) ) ≈ 0.282094
- 备注:AMISE 近似中性基准;Scott 带宽在 d 维见本附录 III
- Epanechnikov(紧支撑)
- 定义:K(u) = ( 3 / 4 ) * ( 1 - u^2 ) * 1{|u| ≤ 1}
- 常数:mu2(K) = 1/5 = 0.2,R(K) = 3/5 = 0.6
- 备注:在满足 ∫K=1 与给定 mu2 的紧支撑对称核中 AMISE 最优
- Uniform / Rectangular(紧支撑)
- 定义:K(u) = ( 1 / 2 ) * 1{|u| ≤ 1}
- 常数:mu2(K) = 1/3 ≈ 0.333333,R(K) = 1/2 = 0.5
- 备注:边界可解释性强,但估计不够平滑
- Triangular(紧支撑)
- 定义:K(u) = ( 1 - |u| ) * 1{|u| ≤ 1}
- 常数:mu2(K) = 1/6 ≈ 0.166667,R(K) = 2/3 ≈ 0.666667
- Biweight / Quartic(紧支撑)
- 定义:K(u) = ( 15 / 16 ) * ( 1 - u^2 )^2 * 1{|u| ≤ 1}
- 常数:mu2(K) = 1/7 ≈ 0.142857,R(K) = 5/7 ≈ 0.714286
- Triweight(紧支撑)
- 定义:K(u) = ( 35 / 32 ) * ( 1 - u^2 )^3 * 1{|u| ≤ 1}
- 常数:mu2(K) = 1/9 ≈ 0.111111,R(K) = 350/429 ≈ 0.815851
- Cosine(紧支撑)
- 定义:K(u) = ( pi / 4 ) * cos( ( pi / 2 ) * u ) * 1{|u| ≤ 1}
- 常数:mu2(K) ≈ 0.18943,R(K) ≈ 0.61685
- Laplace / Double-Exponential(无限支撑)
- 定义:K(u) = ( 1 / 2 ) * exp( - |u| )
- 常数:mu2(K) = 2,R(K) = 1/4 = 0.25
- 备注:尾部较重;在 AMISE 框架下需要相应缩小 h 抑制方差
- 速查:AMISE 主导项(1D,平滑目标密度二阶可导)
AMISE(h) ≈ ( R(K) / ( N * h ) ) + ( ( mu2(K)^2 / 4 ) * h^4 * R( f'' ) ) * c_dim,其中 c_dim = 1(1D),R(f'') = ( ∫ ( f''(x) )^2 dx )。带宽 h* 由上式平衡两项取得(见第4章与 Mx-93)。
III. 多维核与带宽矩阵
- 各向同性:kde_h(x) = ( 1 / ( N * h^d ) ) * ∑ K( ||x - x_i|| / h )。
- 各向异性(正定带宽矩阵 H):
kde_H(x) = ( 1 / ( N * |H|^{1/2} ) ) * ∑ K( || H^{-1/2} * ( x - x_i ) || )。 - 规则化带宽(Scott):H_scott = h_scott^2 * Sigma,h_scott = ( 4 / ( d + 2 ) )^{ 1 / ( d + 4 ) } * N^{ -1 / ( d + 4 ) },其中 Sigma 为样本协方差。
- 鲁棒带宽(Silverman, 1D):h_silverman = 0.9 * min( sigma, IQR / 1.34 ) * N^{-1/5}。
- 说明:实际实现请在 kde_build(..., kernel:str, h:float|H:matrix) 中明确报告 K(·)、h 与评分准则 CV(h)(见 I90 2 与规则集 III)。
IV. 边界与离散网格的核修正
- 反射法(以边界 x_b 为镜像):x_ref = 2 * x_b - x_i,使用 K( ( x - x_i ) / h ) + K( ( x - x_ref ) / h ),并保留归一化。
- 截断-重归一化:对 x ∈ D 仅积分 D 内贡献,并用 Z(x) = ( ∫_D K( ( x - u ) / h ) du ) 作局部归一化。
- 局部线性核(边界一致性更优):以 K(u) 加入一次项修正以减小边界偏差。
- 与直方图体素化一致性:若从 rho_i 网格回推连续估计,需保持 mass_preserve = ( ∑ rho_i * V_i )(见 S92-11 与第7章)。
V. 窗函数清单(离散谱密度专用)
- 公共形式与量化
- 余弦和窗:w[n] = ∑_{k=0}^K a_k * cos( 2*pi*k*n / (N-1) )(常见为交替符号 a0 - a1 cos + a2 cos2 - ...)
- 典型近似(N 足够大):U_w ≈ a0^2 + 0.5 * ∑_{k=1}^K a_k^2,CG ≈ a0,ENBW_bins ≈ U_w / CG^2。
- 所列 ENBW_bins 为近似值;ENBW_Hz = ENBW_bins * ( fs / N )。
- Rectangular
- 定义:w[n] = 1
- 常数:U_w = 1,CG = 1,ENBW_bins = 1.000;首旁瓣约 -13 dB
- 备注:分辨率最高,泄漏最大
- Bartlett / Triangular
- 定义:w[n] = 1 - | ( 2*n / (N-1) ) - 1 |
- 常数:U_w ≈ 1/3 = 0.3333,CG ≈ 0.5,ENBW_bins ≈ 4/3 = 1.333;首旁瓣约 -26 dB
- Hann
- 定义:w[n] = 0.5 - 0.5 * cos( 2*pi*n / (N-1) )
- 常数:U_w ≈ 0.375,CG ≈ 0.5,ENBW_bins ≈ 1.500;首旁瓣约 -31 dB
- 备注:泄漏抑制与分辨率权衡的默认推荐(见第6章)
- Hamming
- 定义:w[n] = 0.54 - 0.46 * cos( 2*pi*n / (N-1) )
- 常数:U_w ≈ 0.3974,CG ≈ 0.54,ENBW_bins ≈ 1.3628;首旁瓣约 -43 dB
- Blackman
- 定义:w[n] = 0.42 - 0.5 * cos( 2*pi*n / (N-1) ) + 0.08 * cos( 4*pi*n / (N-1) )
- 常数:U_w ≈ 0.3046,CG ≈ 0.42,ENBW_bins ≈ 1.7268;首旁瓣约 -58 dB
- Blackman–Harris(4-term, 92 dB)
- 定义:w[n] = a0 - a1 * cos( 2*pi*n / (N-1) ) + a2 * cos( 4*pi*n / (N-1) ) - a3 * cos( 6*pi*n / (N-1) )
其中 a0=0.35875,a1=0.48829,a2=0.14128,a3=0.01168 - 常数:U_w ≈ 0.25796,CG ≈ 0.35875,ENBW_bins ≈ 2.004;首旁瓣约 -92 dB
- 定义:w[n] = a0 - a1 * cos( 2*pi*n / (N-1) ) + a2 * cos( 4*pi*n / (N-1) ) - a3 * cos( 6*pi*n / (N-1) )
- Nuttall(4-term)
- 系数:a0=0.355768,a1=0.487396,a2=0.144232,a3=0.012604(同上式型)
- 常数:U_w ≈ 0.25583,CG ≈ 0.355768,ENBW_bins ≈ 2.021;旁瓣抑制与 BH 相近
- Flat-top(5-term,幅度精度优先)
- 定义:w[n] = a0 - a1 * cos( 2*pi*n / (N-1) ) + a2 * cos( 4*pi*n / (N-1) ) - a3 * cos( 6*pi*n / (N-1) ) + a4 * cos( 8*pi*n / (N-1) )
典型系数:a0=1.0,a1=1.93,a2=1.29,a3=0.388,a4=0.028 - 常数:U_w ≈ 3.7702,CG ≈ 1.0,ENBW_bins ≈ 3.770;幅度测量偏差最小
- 定义:w[n] = a0 - a1 * cos( 2*pi*n / (N-1) ) + a2 * cos( 4*pi*n / (N-1) ) - a3 * cos( 6*pi*n / (N-1) ) + a4 * cos( 8*pi*n / (N-1) )
- Kaiser(参数窗)
- 定义:w[n] = I0( pi*beta*sqrt( 1 - x^2 ) ) / I0( pi*beta ),其中 x = ( 2*n / (N-1) ) - 1,I0 为 0 阶第一类修正贝塞尔
- 常数(经验):beta=6 → ENBW_bins ≈ 1.9,beta=8 → ≈ 2.23,beta=10 → ≈ 2.5
- 备注:通过 beta 在旁瓣与主瓣宽之间连续可调
- 实施提示:在 spectral_density(sig, method="welch", window="hann") 中应报告 U_w、ENBW_Hz 与 CG,并在能量核对(Mx-95)中使用相同窗的功率归一化(见第6章)。
VI. 核与窗的形状映射与选择建议
- 形状同构:Uniform ↔ Rectangular,Triangular ↔ Bartlett,Cosine 核 ↔ Hann 窗,高阶多项式紧支撑核 ↔ 多项式余弦窗族(如 Blackman)。形状相近可在跨域(密度 ↔ 频谱)建模时保持一致的平滑风格。
- 默认策略(跨卷一致口径):
- 密度估计优先 Epanechnikov 或 Biweight(紧支撑,AMISE 友好);
- 频谱估计优先 Hann(泄漏/分辨率权衡良好),幅度精度敏感任务用 Flat-top。
VII. 与 I90 接口的绑定与示例配置
- KDE:kde_build(data, kernel="epanechnikov", h=..., rule="cv") -> PdfRef;评估时保持 normalize=True 并记录 CV(h) 与核常数 mu2(K)/R(K)(见 I90 2)。
- 频谱:spectral_density(sig, method="welch", window="hann") -> SpecRef;随后用 spec_to_energy(spec, band) 做能量一致性核对(见 I90 6)。
- 强制元数据:将 K、h、U_w、ENBW_Hz、CG 作为估计产物的属性绑定(见 I90 8)。
VIII. 发布前自校验清单(核与窗)
- check_dim:核密度输出单位与输入测度匹配;谱密度报告 ENBW_Hz 与带宽 fs/N。
- 归一化:核需满足 ∫ K du = 1;窗需在能量核对中使用相同 U_w。
- 报告:KDE 必报 K(·)、h、评分准则;PSD 必报 window、U_w、ENBW_Hz、CG。
- 边界:若 D 有界,声明所用边界修正策略。
- 到达时轴:如频谱/时频指标与 T_arr 相关,给出两口径并记录 delta_form(见全书规则集与第9章)。
IX. 速查常数(摘要)
- 核函数二阶矩与粗糙度
- Gaussian:mu2=1,R=1/(2*sqrt(pi))≈0.282094
- Epanechnikov:mu2=1/5,R=3/5
- Uniform:mu2=1/3,R=1/2
- Triangular:mu2=1/6,R=2/3
- Biweight:mu2=1/7,R=5/7
- Triweight:mu2=1/9,R=350/429≈0.815851
- Cosine:mu2≈0.18943,R≈0.61685
- Laplace:mu2=2,R=1/4
- 常用窗的 ENBW_bins(近似)
Rectangular=1.000,Bartlett=1.333,Hann=1.500,Hamming=1.363,Blackman=1.727,Blackman-Harris(4)=2.004,Nuttall(4)=2.021,Flat-top(5)=3.770,Kaiser(beta=8)≈2.23
X. 交叉引用与版本对齐
- 与第4章带宽选择 Mx-93、第6章谱密度口径 S92-8/S92-9/Mx-95、第7章守恒离散化 S92-11/Mx-96 直接复用。
- 与接口层 I90 2/4/6/8 绑定;与《Core.Sea》窗与能量口径完全一致;涉及到达时的指标请遵从两口径差异度 delta_form 的记录规范。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/