EFT
理论
视频
新闻
下载
关于
语言
46-EFT.WP.Data.Benchmarks v1.0
目录
/
文档-技术白皮书
46-EFT.WP.Data.Benchmarks v1.0
第1章 概述与范围
第2章 术语与依赖
第3章 套件分层与总览
第4章 任务定义与场景建模
第5章 数据来源、采样与冻结切分
第6章 指标体系与单位
第7章 评测协议(离线/在线/流式/交互)
第8章 评分、归一化与排名
第9章 显著性与不确定度
第10章 运行环境与计量负载
第11章 基线与上限
第12章 鲁棒性、偏移与对抗
第13章 公平性、伦理与安全应激
第14章 隐私、安全与合规(基准侧)
第15章 机器可读 Schema 与 Lint
第16章 实现绑定与评测 API
第17章 提交、复现与排行榜治理
第18章 附录:Benchmark 模板