模型版本active
筛选:active
这里按模型版本、时间窗口、联赛和玩法查看 Log Loss、Brier Score、校准误差、错误类型和模型对比。 该页面用于复盘概率质量,不把单场结果作为唯一判断依据。
筛选:active
Walk-forward / as-of-time 口径预留
不只展示命中率,优先看概率评分
摘要已生成
越低表示概率分布对实际赛果惩罚越小。
越低表示分类概率误差越小。
预测概率与实际频率的平均偏差。
当前筛选窗口内的赛后评估样本。
对比预测概率与实际频率;对角线附近表示校准更好。
Brier Score 越低越好;MVP 使用当前摘要生成稳定趋势占位。
完整 Brier trend 将由 backtest run 时间序列驱动。
Log Loss 对高置信错误更敏感;MVP 趋势用于观察方向,不替代正式回测。
正式 Log Loss trend 将按评估窗口和模型版本读取历史评估表。
按市场拆分概率评分,便于发现某类规则结算的偏差。
| 玩法 | Log Loss | Brier | ECE | 样本 |
|---|---|---|---|---|
| 胜平负 1X2 | 1.007 | 0.599 | 16.5% | 3 |
低样本联赛需要单独观察,避免整体指标掩盖漂移。
| 联赛 | Log Loss | Brier | ECE | 样本 |
|---|---|---|---|---|
| Premier League | 0.987 | 0.580 | 15.8% | 2 |
| J1 League | 1.048 | 0.638 | 18.0% | 1 |
按预测概率区间对比模型均值与实际频率。
赛后评估将偏差归入可追踪标签,供后续校准与训练复盘使用。
晋级记录以回测与校准证据为准,当前仅展示候选评估存根。