第145章草台班子的第一次会议-天才之上

请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能，避免出现内容无法显示或者段落错乱。

“大家好，我叫陈耀宗，目前工作主要是研究概率论。骆教授跟我提了乔源博士的这个想法后，我就开始思考能否將概率图模型，比如高斯过程应用到这个问题上。

但思考过后从理论上来说，这是个很蠢的办法。首先我们需要建立一个带有优质跟劣质標籤的大规模论文数据集，然后將之转化为监督分类问题。

显然光是建立这么一个论文数据集就是个极大的工程。而且要辨別论文是优质还是劣质，或者水论文本身需要一个標准………”

.…从优化的角度看，我们的目標是要为一个高度非凸且可能存在平坦区域的损失曲面，找到一个能通向全局最优的路径。

在我看来，一篇高质量的论文，其证明路径在抽象的逻辑空间中所形成的几何轨跡应该是迂迴的，但最终能收敛……”

“……我认为可以尝试將一篇论文的论证过程建模为一个离散动力系统。其稳定性和收敛性可以类比为论证的严谨和有效………”

.……基於以上论证，所以我的想法是，我们也许可以从更基础的特徵工程开始做起。

传统ai做文本分类，特徵无非是词袋、tf-idf、主题模型如lda。我们可以尝试构建一个多模態模型，同时处理文本、公式和图表……”

.……直接从知识图谱的补全角度切入。具体来说，训练一个模型，当输入一篇新论文p时，它能判断出p是否填补了图谱中一个关键的空洞。

我们可以借鑑图神经网络，比如graphsage或gat，来预测这篇论文在目前知识网络中的重要程度……“我觉得刚刚各位老师都说得很好，我是学数据挖掘的，之所以希望加入这个课题，主要还是希望能提升自我。

如果一定要说想法，我觉得就是可以利用无监督学习，对大量论文的嵌入向量做一个聚类。我觉得学术审美的差异或许会映射在不同聚类中心之间的距离和形状上。

这样就可以计算一个轮廓係数的变种，並依此来衡量一篇论文相对於已有知识的位置。

这其中有些是我之前的想法，有些是我刚听鲁教授的发言想到的。

不管如何我的主要目的还是学习和提高，会尽力完成布置给我的任……”

乔源坐在骆余馨旁边，默默听著这个临时组建的兴趣小组成员们的发言。

然后发现他似乎小看了燕北大学的底蕴。

虽然说人都是骆余馨一天找到的，但从发言上看，这些人都是有想法的。

甚至已经从各自的研究层面论证了他这个想法的可行性。

他本以为如此仓促组成的小组肯定是个草台班子。

但现在他不这么看了。

只能说燕北大学的底蕴有些可怕。隨便拉几个人都是能人。

有想法，有见地，有经验，甚至还很有执行力………

当然这也是乔源的错觉了。

虽然燕北大学的確很强，但还没强到这种程度，更关键的原因还在於现在还是寒假。

而且跟骆余馨拉的人，大都是她比较了解的那一批。本身就把一批打算混文凭的淘汰了。

此时所有人都已经將目光集中到了他身上。

毕竟大家都发过言了，只剩乔源了。

“嗯，首先感谢大家刚刚提出的宝贵意见。接下来我简单谈谈我的想法。

其实我想要做这个项目也不是一拍脑子的决定，而是在帮助有为集团解决雅典娜的凝视这一问题后进发出的想法。”

乔源说到这里下意识的顿了顿。

因为他发现当提到雅典娜的凝视时，好几个人的表情突然变得有些古怪。

甚至有人明显是在憋笑……

乔源感觉有些奇怪，不过这种场合他还是压下了情绪，继续开口说道。

“刚刚几位老师从动力系统、概率图模型以及图神经网络等等角度给出了不同的技术路径。都很有建设性，但也反应出了传统ai技术跟我们所希望实现目標的根本性矛盾。

也就是我们希望用ai去定义优质，但所有建议用於训练ai的数据跟標籤依然是產生这一问题的评价体系。

就比如陈博士刚才提到了高斯过程。我知道这个想法很好，能给出不確定性，但其核心无非就是先验的协方差函数。

如果预设的协方差结构本身是平庸的，那么得到的结果在最乐观的情况下，也就是一个更精確的平庸度量仪。

事实上这一类的智能產品已经有了。谷歌、微软都有类似的智能体，而且还被广泛应用。我之前英语不过关的时候也用过。

但我所想实现的学术审美並不是简单的归纳、总结，而是希望ai本身具备一定和判断能力。正如刚才我所说的那样，我的想法来源於帮助有为集团解决的优化算法问题。

现在请大家思考一下。难道你们不觉得雅典娜张量伺服器的算法问题和我们想要解决的问题很像吗我说得更明確些，其张量伺服器配套的联合算法所需要优化的性能本身就是极为复杂、多维且难以用简单指標衡量的。

这迫使算法不能仅仅追求一个预设的、可能很平庸的高分，而必须学会在探索中动態地理解什么是真正的优质。

所以我在解决其数学基础问题的同时，也开始考虑，为什么我们构建一个类似，可以动態演进的学术审美函数呢

我预想中的智能体和诸如谷歌、微软提供的智能体不一样。它关注的不是文献中有什么，公式也好，数据也好，都不重要。

它需要去理解这篇文献做了什么，包括论证的逻辑流，提出的假设是否有足够的理论支撑，以及结论对整个体系的贡献。

所以我想要的不是一个总结性工具，而是在理解当下数学体系发展进程的前提下，能对於文献做一个综合判断的智能体！

这从底层逻辑上就跟大家的构想不太一致。而且这段时间我也查了一下，目前还没有人工智慧能够做到这一点。

所以理论上来说，我们需要从头开始设计。之前的方案没有什么太多可供我们借鑑的。

不过有一点，要让这一智能体能理解当下的数学进程，首先需要餵给它足够多的文献数据。所以我就直接说接下来的工作安排了。首先我们要为当下主流的数学研究方向做分类，並以此为依据构建一个目录……”

第145章 草台班子的第一次会议（1 / 2）

第145章草台班子的第一次会议（1 / 2）