林峰的表情没有丝毫变化。
他甚至在孙浩发言时,目光平静地扫过对方,那眼神像是在看一个跳梁小丑。
等孙浩说完,林峰才缓缓站起身,走到台前,直面孙浩,也面向所有评审和观众。
他的气场瞬间变得无比强大,如同出鞘的利剑。
“孙浩同学的问题,很有‘价值’。”林峰开口,声音依旧平稳,却带着冰冷的锋芒,“现在,我逐一解答。”
“第一,关于依赖历史战例。模仿学习引入专家策略,是初始化模型认知,避免冷启动灾难。核心在于‘稀疏强化学习’!它通过设定关键目标(如保存己方力量、摧毁高价值目标)作为稀疏奖励信号,驱动系统在陌生战场环境中自主探索最优解!历史是参考,探索才是引擎。我们的系统在全新设计的、从未在历史数据中出现的‘蓝军’战术模拟中,依然能快速适应并生成有效策略。测试数据已附在材料附录三,第17页。” 他语速不快,但每个字都像重锤敲在孙浩的质疑上。
“第二,关于‘预判’。”林峰嘴角勾起一丝极淡、极冷的弧度,那眼神锐利得仿佛能洞穿人心,“这不是科幻,是计算。基于GNN动态更新的实体关系图谱,结合实时环境感知(电磁、气象、地形),系统能推演敌方在特定约束下的最优行动路径集合,并依据其历史行为模式(如果有)或通用军事原则进行概率加权。演示中的‘预判’,是对敌方在信息遮蔽下最可能采取的隐蔽机动路线进行的概率最大路径推演。理论基础是博弈论、运筹学和复杂系统建模。可重复性?所有推演逻辑和参数在系统日志中完整记录,可回溯验证。附录四,仿真推演复现报告。”
他顿了顿,目光如冰锥般刺向脸色开始发白的孙浩:“第三,关于陈默同学的分享和‘借鉴’。”
林峰的语气陡然变得更加冰冷。
“陈默同学分享的,是基于贝叶斯网络的静态威胁评估模型,是一种经典的概率推断方法。而‘星链’系统决策核心采用的,是基于深度强化学习的动态策略生成模型,两者在数学基础、模型架构、学习目标上存在本质区别!贝叶斯网络是工具之一,用于决策模型中某个子模块的概率更新辅助,而非核心!”
林峰向前一步,气势逼人:
“孙浩同学,如果你对技术细节的理解还停留在‘内核相似’这种模糊层面,我建议你回去重修《机器学习导论》和《强化学习基础》。至于你所谓的‘高度相似之处’…”
他冷冷一笑,目光扫过孙浩团队的方向。
“不如请孙浩同学解释一下,你们‘战隼’系统最新版本中,那个新增的‘动态威胁权重调整模块’,其设计思路为何与陈默同学在技术沙龙上提出的‘贝叶斯网络结合环境因子动态修正权重’的概念,在结构上如此神似?甚至连部分特征因子的选择都…惊人的一致?这份‘巧合’,是否需要大赛组委会介入调查?”
轰——!全场炸开了锅!
林峰的反击太狠、太准、太致命!
他不仅彻底驳斥了对方的污蔑,更反手一剑,直指对方可能存在的剽窃行为。
而且证据链清晰(贝叶斯网络是公开技术,但具体结合方式和因子选择具有独创性)。
孙浩的脸瞬间涨成了猪肝色,额头上冷汗涔涔,嘴唇哆嗦着,一句话也说不出来。
他团队的其他成员也纷纷低头,不敢与林峰对视。