第196章 数据收集完成(2 / 2)

为了进一步提升模型的泛化能力,陈曦还对样本集进行了重新划分:“我们将 1500 组样本分为训练集(1200 组,占 80%)和验证集(300 组,占 20%),其中验证集全部采用增强后的样本,而且确保验证集中各等级样本的分布与训练集一致。这样在训练过程中,模型就能不断通过验证集进行自我修正,避免过度依赖训练数据。”

一切准备就绪后,陈曦启动了第二轮模型训练。这次他还在模型中加入了 L2 正则化层,进一步防止过拟合。“正则化层能给模型的权重参数加上约束,避免某些参数过大,从而防止模型过度拟合训练数据的细节特征。” 陈曦解释道。

团队成员们没有离开车间,而是守在电脑旁,实时关注着训练进度。随着迭代次数的增加,训练集和验证集的识别准确率都在稳步提升,而且两者之间的差距越来越小 —— 这意味着过拟合问题正在得到缓解。

“你们看,训练到 50 次迭代时,训练集准确率 92%,验证集准确率 91%,差距只有 1%!” 李萌萌兴奋地喊道,“这比第一次训练时的差距小多了,说明数据增强和正则化起到了作用!”

苏晚则重点关注临界样本的识别情况。她从验证集中抽取了 50 组临界样本,跟踪模型的识别准确率。当训练进行到 80 次迭代时,临界样本的识别准确率已经从之前的 30% 提升到了 75%,有了质的飞跃。

“太好了!临界样本的识别精度提升很明显!” 苏晚激动地说道,“这说明我们的样本增强和均衡化处理是有效的,模型已经开始学会区分那些细微的临界差异了。”

林默看着屏幕上不断攀升的准确率曲线,心中十分欣慰:“这就是团队协作的力量!遇到问题不可怕,只要我们团结一心,积极寻找解决方案,就没有克服不了的困难。”

6 小时后,第二轮模型训练结束。最终结果显示:训练集识别准确率 94%,验证集识别准确率 93%,两者差距仅 1%,过拟合问题得到了有效解决。

“现在我们用之前的 20 组测试样本再验证一次!” 小王迫不及待地说道。

陈曦将 20 组测试样本输入模型,点击 “预测”。这一次,屏幕上显示的识别准确率达到了 88%,其中临界样本的识别准确率提升至 80%,只有 1 组 “略过度” 样本被误判为合格,没有出现严重的误判情况。

“成功了!我们成功解决了过拟合问题!” 团队成员们欢呼雀跃,疲惫的脸上洋溢着胜利的笑容。

苏晚在分析测试结果时,突然发现了一个重要的现象:“你们看,模型对测试样本的识别结果中,湿度数据与图片识别结果的匹配度达到了 85%。比如所有湿度在 62%-68% 之间的样本,模型都正确识别为合格或略不足;湿度低于 60% 的样本,都被正确识别为略过度或过度。”

这个发现让苏晚眼前一亮,她再次想到了之前的双检测方案:“如果我们将湿度数据作为模型识别的辅助特征,与图片特征结合起来,形成‘视觉识别 + 湿度检测’的双检测模型,识别精度肯定能进一步提升!比如当模型对某个临界样本的识别结果不确定时,就可以参考湿度数据进行二次判断,从而降低误判率。”

“这个想法非常好!” 林默立刻表示支持,“湿度数据是发酵程度的直接物理指标,与视觉特征结合起来,能让模型的判断更全面、更精准。接下来我们可以尝试将湿度数据融入模型,进一步优化识别精度。”

陈曦也点点头:“将湿度数据作为输入特征之一,重新训练模型,应该能让识别准确率再提升几个百分点。而且这也能解决一些极端情况下的误判问题,比如某些面团外观特征不明显,但湿度数据差异很大,模型就能通过湿度数据做出正确判断。”

小王则已经开始思考具体的实现方案:“我们可以修改模型的输入层,将湿度数据与图片的像素数据结合起来,作为模型的输入特征。这样模型在训练时,就能同时学习视觉特征和物理指标特征,形成多维度的判断逻辑。”

团队的热情再次被点燃。虽然第二轮训练已经取得了不错的成果,但他们并没有满足,而是朝着更高的目标迈进。

当天晚上,陈曦开始修改模型的输入层结构,将湿度数据融入模型;苏晚则整理了所有样本的湿度数据,确保数据格式符合模型输入要求;小王编写了数据融合的程序,将图片数据和湿度数据关联起来;林默则制定了第三轮训练的计划,目标是将模型识别准确率提升至 95% 以上。

远在盐城的老周听说模型训练取得了重大突破,特意给林默打来了电话:“林总,恭喜你们!我就知道你们一定能成功。等设备量产了,我们一定要第一时间去现场看看,亲眼见证我们种的糯米,通过智能设备变成美味的糕点。”

“一定!” 林默笑着回应,“周叔,这也离不开你们提供的优质糯米。等‘糕小默 2.0’量产成功,我们第一时间给你们寄样品,让你们尝尝自己种的糯米做出来的糕点。”

夜色渐深,车间里的灯光依然明亮。团队成员们还在忙碌地准备第三轮模型训练,他们的脸上虽然带着疲惫,但眼神中却充满了坚定和期待。

苏晚看着那份记录着传统手测评分的样本表,心中感慨万千。从最初的样本收集难题,到现在的过拟合问题解决,团队一路走来,遇到了无数挑战,但每一次都能凭借团结协作和创新思维攻克难关。而 “视觉识别 + 湿度检测” 的双检测方案,也在这个过程中逐渐清晰,即将成为 “糕小默 2.0” 的核心技术亮点。

她相信,只要坚持将传统工艺经验与现代科技相结合,不断优化模型,“糕小默 2.0” 一定能达到甚至超过人工识别的精度,成为林记传承非遗手艺、实现规模化生产的重要支撑。而陈曦之前提出的光线补偿算法,也将在后续的优化中与双检测方案相结合,让 “糕小默 2.0” 的视觉识别系统更加完善,适应各种复杂的生产环境。