通过这种方法,临界样本的合格率大幅提升。当天下午,团队就成功制作了 15 组 “略不足” 和 12 组 “略过度” 样本,而且数据都非常精准。“现在临界样本的特征很明显,气孔直径、湿度都在我们设定的范围内,这样模型就能更好地学习这些特征了。” 苏晚拿着放大镜观察着面团的气孔,满意地说道。
林默每天都会检查数据收集进度,他用 Excel 制作了 “样本完成率折线图”,实时跟踪每天的样本完成数量、不同等级样本的占比情况。从图表上可以清晰地看到,随着流水线流程的不断优化,团队的效率越来越高,第三天完成了 45 组样本,第四天完成了 50 组样本,第五天更是完成了 55 组样本,远远超过了预期目标。
在数据收集的过程中,陈曦也发现了一个新的问题。“你们看,这两组同样是合格等级的面团,在早上的自然光下拍摄的照片,颜色偏浅;在下午的灯光下拍摄的照片,颜色偏深。” 陈曦指着电脑屏幕上的两张照片,对团队说道,“不同光线条件下,面团的颜色识别会有差异,这可能会影响模型的判断精度。”
“这个问题确实需要重视。” 林默说道,“实际生产中,车间的光线会随着时间、天气变化,如果模型不能适应这种变化,就可能出现误判。”
“我有一个想法。” 陈曦说道,“我们可以在后续的模型训练中,加入‘光线补偿算法’。通过采集不同光线条件下的样本数据,让模型学习光线变化对颜色特征的影响,自动调整识别参数,抵消光线干扰。现在我们可以先记录每组样本的拍摄光线条件,为后续的算法优化提供数据支持。”
团队采纳了陈曦的建议,在数据收集表中新增了 “拍摄光线条件” 列,详细记录每组样本是在自然光、灯光还是混合光下拍摄的。这个小小的调整,为后续解决环境干扰问题埋下了重要伏笔。
时间一天天过去,数据收集工作有条不紊地推进。苏晚的揉面技术越来越熟练,能精准控制面团的重量和软硬;李萌萌对发酵时间的把握也越来越精准,临界样本的合格率稳定在 90% 以上;小王编写的数据采集程序不断优化,实现了样本数据的自动分类、筛选,大大减少了人工工作量;陈曦则每天检查拍摄的照片质量,确保每个角度的特征都清晰可见。
远在盐城的老周也时刻关注着数据收集的进展,他每天都会给林默发微信询问情况:“林总,数据收集还顺利吗?需要我们再寄点糯米粉过去吗?”
“周叔,一切都很顺利,谢谢你的关心!” 林默每次都会耐心回复,“你们寄来的糯米粉品质很好,制作出来的样本数据很稳定,为我们的模型训练提供了很大的帮助。”
到了第十天,团队终于完成了 500 组样本的数据收集工作。林默打开样本统计数据库,屏幕上的数据令人振奋。
“完美!” 林默激动地说道,“临界样本(略不足 + 略过度)的占比达到了 40%,远超我们设定的 20% 目标,而且数据合格率平均在 97% 以上,样本分布均衡,数据质量很高。有了这些样本,我们的深度学习模型训练就能顺利推进了!”
陈曦看着这些数据,心中充满了信心:“这些样本涵盖了不同发酵等级、不同环境温度、不同批次糯米粉的特征,而且临界样本的数量充足,模型一定能精准学习到不同状态下的特征差异,尤其是那些细微的临界差异。”
苏晚也露出了欣慰的笑容:“这十天虽然很累,但看到这些成果,觉得一切都值了。通过这次数据收集,我也深刻体会到,传统工艺的经验可以转化为可量化的标准,再结合现代科技,就能实现精准控制,这也是我们‘糕小默 2.0’的核心竞争力。”
小王则迫不及待地说道:“现在数据已经收集完毕,我们可以马上开始模型训练了!我已经做好了数据预处理的准备,明天就能将数据输入模型,进行迭代训练。”
林默看着团队成员们疲惫却充满斗志的脸庞,心中十分感动:“这十天大家都辛苦了!但这只是模型训练的开始,接下来我们还要投入更多的精力,确保模型的识别精度稳定在 90% 以上。我相信,凭借我们收集的高质量样本和团队的努力,一定能攻克算法难关,让‘糕小默 2.0’早日量产。”
当天晚上,团队没有举行庆祝活动,而是简单收拾了车间,整理好了所有样本数据。陈曦将 500 组样本数据进行了预处理,包括图像归一化、数据增强、特征提取等,为第二天的模型训练做好了充分准备。
苏晚在整理数据收集表时,看着那列预留的 “传统手测评分”,心中有了一个新的想法:“等模型训练完成后,我们可以将机器识别结果与传统手测评分进行对比,看看模型的识别精度是否能达到甚至超过人工水平。如果可以,我们就能真正实现‘机器替代人工’的目标,为后续的规模化生产打下基础。”
林默点点头:“这个想法很好。传统手艺的经验是无价的,我们的目标不是抛弃传统,而是让传统与现代科技完美结合,让非遗手艺在新时代焕发新的生机。”
夜色渐深,车间里的灯光渐渐熄灭,但团队成员们心中的希望之火却越燃越旺。他们知道,接下来的模型训练将是一场硬仗,但有了这些高质量的样本数据,有了团队的团结协作,他们一定能取得成功。而陈曦提出的 “光线补偿算法”,也将在后续的模型优化中发挥重要作用,让 “糕小默 2.0” 的视觉识别系统能够适应不同的环境条件,实现更精准、更稳定的识别。