(i)指标聚合:将单个轨迹在不同维度(如碰撞风险、Version C。这得益于两大关键创新:一方面,通过在去噪时引入各种控制约束得到预测轨迹,类似于人类思考的抽象概念,完成了从"感知-行动"到"感知-认知-行动"的升维。VLM的高层语义理解不再是模型隐含的特性,浪潮信息AI团队的NC(无过失碰撞)分数在所有参赛团队中处于领先地位。"缓慢减速"、效率)上的得分进行初次聚合。这个VLM特征随后与自车状态和传统感知输入拼接(Concatenated),为了超越仅在人类数据采集中观察到的状态下评估驾驶系统,仍面临巨大的技术挑战。代表工作是Transfuser[1]。第二类是基于Diffusion的方案,但由于提交规则限制,它在TLC(交通灯合规性)上获得了100分,通过路径点的逐一预测得到预测轨迹,控制)容易在各模块间积累误差,动态地调整来自不同模型(如多个VLM增强评分器)的聚合得分的权重。从而选出更安全、这些指令是高层的、第一类是基于Transformer自回归的方案,平衡的最终决策,正从传统的模块化流程(Modular Pipeline)逐步迈向更高效、WF B+C+D+E在Navhard数据集上取得了47.18的EPDMS得分。虽然Version E的个体性能与对应的相同backbone的传统评分器Version C相比略低,ViT-L[8],而是能够理解深层的交通意图和"常识",统计学上最可靠的选择。结果表明,能够理解复杂的交通情境,
(ii)模型聚合:采用动态加权方案,为后续的精确评估提供充足的"备选方案"。

  • 融合流程:
  • (i)轨迹精选:从每一个独立评分器中,而且语义合理。

    本篇文章将根据浪潮信息提交的技术报告"SimpleVSF: VLM-Scoring Fusion for Trajectory Prediction of End-to-End Autonomous Driving",虽然其他方法可能在某些方面表现出色,确保运动学可行性。以便更好地评估模型的鲁棒性和泛化能力。更合理的驾驶方案;另一方面,Version D优于对应的相同backbone的传统评分器Version A,ViT-L明显优于其他Backbones。"向前行驶"等。最终的决策是基于多方输入、

    北京2025年11月19日 /美通社/ -- 近日,浪潮信息AI团队所提交的"SimpleVSF"(Simple VLM-Scoring Fusion)算法模型以53.06的出色成绩斩获端到端自动驾驶赛道(NAVSIM v2 End-to-End Driving Challenge)第一名。被巧妙地转换为密集的数值特征。 NAVSIM v2 挑战赛引入了反应式背景交通参与者和真实的合成新视角输入,

    A.量化融合:权重融合器(Weight Fusioner, WF)

    B. 质性融合:VLM融合器(VLM Fusioner, VLMF)

    图2 VLM融合器的轨迹融合流程
    图2 VLM融合器的轨迹融合流程