Deeplight笔记

1772945879607.png

发表流程

Received 2 September 2025;revised 2 January 2026;Accepted 7 February 2026;Available online 9 February 2026

目前预测困难点

闪电的高度局部性、瞬时性和随机性(相同气象条件下,闪电可能发生或者不发生,且位置、时间存在差异)

  1. 现有模型难以捕捉动态空间上下文与随机性

  2. 未能充分利用雷达反射率、云属性等数据

  3. 高度依赖天气预报(NWP)系统。

核心创新点

  1. 提出DeepLight双编码器架构,仅使用真实多源观测数据(雷达反射率、云属性、历史雷电),消除对NWP的依赖。

  2. 设计多分支卷积技术,动态捕捉不同尺度空间相关性

  3. 引入Hazy Loss 邻域感知损失函数,通过高斯模糊显示建模时空不确定性,按接近真实事件距离进行平滑惩罚

,提升模型在随机性下的学习能力。在Equitable Threat Score)ETS上较SOTA提升18%-30%。

                    1772947478012.png

代码阅读部分的理解

数据加载部分

                                                                

使用21年和22年的数据作为训练集。通过idx判断属于哪一年,最终输出的张量为:

                1773197901418.png

不仅预测雷电,还预测雷达反射率

测试集和验证集同理。

                        1773198104713.png

训练部分

高斯模糊标签平滑

1773218374532.png

后续可借鉴,HazyLoss 的配套设计。

指出,使用基于NWP的方法(PR92)需要大量计算资源,难以捕捉细尺度空间模式,模型泛化性差。

Nowcasting thunderstorm hazards using machine learning: the impact of data sources on performance这篇论文后续看看,讲解各个数据源对天气的影响。

A dataset for machine learning model to convective initiation detection and nowcasting over southeastern China这篇论文有开源的数据。