人工智能已经开始解决越来越没有被人类解决的问题,并取得了良好的结果。
但是,在过去的几年中,人工智能领域的科学研究数量增加了,使科学家和从业者很难在时间上跟踪这些进展。
数据表明,机器学习领域的研究论文数量将每23个月翻一番。原因之一是人工智能用于不同学科,例如数学,统计,物理,医学和生物化学。
通过从科学文献中获得见解,提出新的个性化研究方向和思想的工具可以显着加速科学的进步。在越过人工智能和其他领域的过程中,人们如何判断哪些方向有意义且值得做?
为此,由Max Planck光学研究所(MPL)人工智能科学家Mario Krenn领导的国际团队发布了一项研究“高质量链接预测 - 索引级别的增长知识网络”。相关研究论文发表在预先印刷的网站Arxiv上,“通过AI:AI:高质量的链接预测在成倍增长的知识网络中预测”。
(来源:arxiv)
这项研究工作的目的是设计一个可以“阅读,理解然后采取行动”的程序,以便为预测和建议交叉 - 域研究思想打开大门。研究小组认为,从长远来看,这将提高人工智能研究人员的生产率,开放新的研究渠道并指导该领域的进步。
先前的实践证明,通常通过在看似无关紧要的主题/领域之间建立新的联系而产生的新研究思想。
这促使研究团队将人工智能文献的演变构成了时间网络建模任务,并创建了一个语义网络,可以描述自1994年以来人工智能文献的内容和演变。
同时,研究团队还讨论了一个包含64,000个概念(也称为节点)和1800万个节点的网络,并将语义网络用作10种不同统计学和机器学习方法的输入。
最基本的任务之一 - 构建语义网络-HELP以从网络中提取知识,然后使用计算机算法进行处理。
图|在这项工作中,研究团队使用了1992 - 2020年在Arxiv上发表的143,000篇论文,并使用Rake和其他NLP工具来构建概念列表。这些概念构成语义网络的节点。当两个概念同时出现在纸张的标题或抽象中时,绘制了边界(边缘)。通过这种方式,他们建立了一个恒定的语义网络,随着时间的流逝,更多的概念被一起研究。最终的任务是预测未转化的节点,也就是说,在几年内将不在科学文献中一起研究的概念。 (来源:arxiv)
最初,研究团队考虑使用大型语言模型,例如GPT-3和Palm来创建这样的网络。但是,主要的挑战是这些模型仍然很难推理,很难识别或提出新的概念组合。
因此,他们转向了生物化学方法,也就是说,从出现在普通论文中的概念中创建知识网络。单个生物分子代表一个节点。当纸张引用两个相应的生物分子时,两个节点只是两个节点。连接它们。这种方法最初是由芝加哥大学教授,人类遗传学教授安德烈·里兹斯基(Andrey Rzhetsky)提出的。
研究团队使用这种方法来捕获人工智能的历史,并使用超级计算机模拟了有关科学家集体行为的重要陈述。基于大量论文,此过程继续重复此过程,从而形成了捕获操作内容的网络。
基于此,研究团队开发了一种名为Science4cast的新基准测试,并提供了十种解决此基准测试的不同方法。研究小组认为,他们的工作将有助于建立一种新工具来预测人工智能研究趋势。
过去,每当您打开任何人工智能和机器学习与论坛时,人们都会发现“跟上人工智能的进步”是第一个讨论的主题。
也许这项研究可以减轻人们的压力。
论文链接:
https://arxiv.org/pdf/2210.00881.pdf
原始标题:“带有AI的谓词AI,它的未来将是什么?”