人类颤抖吧!会抬扛的机器辩手来啦

原文作者:Chris Reed

研究人员开发出了一个全自主的计算系统,该系统能与人类进行现场辩论(www.jiurou.net)。研究结果勾勒出一个人工智能帮助人类提出并理解复杂论点的未来。

就在不到十年之前,即使是最先进的AI技术,也绝对没有办法通过分析人类的话语,摸索出有哪些用证据支持结论的方式—— 这个过程现在被称为论辩挖掘(argument mining)[2]。自那以后,AI技术的进步以及论辩技术工程的成熟,加上巨大的商业需求,使得该领域快速发展。目前,全球共有50多个实验室正在钻研这个问题,包括所有大型软件公司的团队。

争论和辩论是人类智能的基本能力。在本期《自然》中,Noam Slonim和同事描述了人工智能系统——Project Debater(意为辩手项目)与人类进行竞技辩论的结果。该系统能通过扫描浏览一个存有4亿篇新闻报道的档案库,自己组织开场白和反驳论点。研究人员用一系列辩题测试了该系统,并将其与人类专业辩手和各种基线系统的表现进行了比较。虽然人类专业辩手仍然更胜一筹,但Project Debater的辩论在虚拟的人类观众这里拿到了高分。研究团队认为该结果证明了人工智能具有参与复杂人类活动的潜力。丨Yijia Xie

首先, Project Debater无疑是工程学上的巨大成就。它融合了从文本中搜集并解读论辩相关材料的技术以及句法修复技术( 这能让该系统在提出论点时,对提取的句段进行重新组织;作者稍许低估了他们的句法修复技术的重要作用)。Project Debater的这些成分会与人类事先准备的信息相结合,再根据关键主题进行分类,从而就一系列话题提供知识、论点和反驳论点。这个知识库会使用“罐装”文本加以补充,这些文本是人类事先写好的句子片段,可以用来在辩论中引入和组织演讲词。

无论是作为一个AI系统还是面向整个AI领域的大挑战,Project Debater的野心都不是一般的大。和把目标定得很高的几乎所有AI研究一样,一个关键的瓶颈是如何获得足够多的数据,为设定好的挑战[4]计算出有效的解决办法。 Project Debater利用一种双管齐下的方法克服了这个障碍:首先将目标缩小到100个左右的辩题;再从很大的数据集中搜寻原材料——即使用现代语言处理系统的标准来看,这些数据集也绝不算小。

在2018年和2019年的几次公开亮相中, Project Debater挑战了很多优秀的著名人类辩手图1),并由观众对其表现进行非正式打分。在这次的辩论中,该系统基于自身的论辩技巧和已经处理过的数据集,自创了一个4分钟的演讲,从它自己的指令系统中开了一个新的辩题,并得到了人类对手的回应。 该系统随后对对手的论点进行了反驳,做了第二个4分钟的演讲。对手也做了4分钟的反驳,最后以双方各做2分钟总结陈词结束。

Project Debater挑战人类辩手。Project Debater是Slonim等人[1]开发的一个AI系统,可以与人类进行辩论比赛。丨Jason Henry/NYT/Redux/eyevine

Project Debater的最大弱点可能在于它很难模仿人类辩手的连贯性和节奏——该问题关系到其在选择、概括和设计论点方面的最高处理水平,但这种局限性非Project Debater独有。虽然经过了两千年的研究, 我们对论辩结构的理解依然有限。取决于论辩研究的焦点是在语言使用、认识论( 知识的哲学理论)、认知过程还是逻辑正确性,研究人员提出的对论辩和推理的连贯模型至关重要的特征可以千差万别[5]。

正因为此,决定出色论点应该包含哪些因素的模型极其多样[6],但决定优秀辩论应该包含哪些因素的模型基本上就一种形式化的直觉( 将辩论精华编纂成册的学科在这方面已经领先一步,比如法律或是某种程度上的政治科学)。所以,也就不奇怪研究人员会让人类观众来简单评价Project Debater的表现是否 “属于一次出色的表现”了。 人类观众在近三分之二的辩题上都给予Project Debater正面的评价

此外, 在真实世界中,论点没有清晰的边界:辩论之外的言语不是离散的,而是连着了一张集中了交叉引用、类比、例证、泛化的网络。如何让AI来处理这样的论辩网已经有了理论[9],并用软件得以实现——比如一个叫作DebateGraph( 见go.nature.com/30g2ym4)的系统,这个互联网平台可以提供对复杂互联的思维网络进行可视化和共享的计算工具。然而,与这些实现相关的理论挑战和社会技术问题也不容小觑:设计出吸引大量观众关注这类系统的有效方法,与设计出能让他们与这些复杂论辩网互动的直接机制一样难。

Project Debater 是论辩技术开发的重要一步,也是将论点作为局部现象处理的重要一步。其所取得的成功让我们得以一窥AI系统可以如何处理人类“轻而易举”就能理解的论辩网。考虑到当前假新闻遍地,公众观点极端化,演绎推理的普遍缺乏,这种“轻而易举”或许很难让人相信其实人类在创作、处理、 分享复杂论点方面亟需支持——而AI或能提供这种支持。因此,即使Project Debater攻克了一个本意是用来激励更多研究的大挑战,它同时也代表了我们更接近能帮助人类进行推理的AI了,这正如Slonim等人所说的, 把目前AI技术的舒适区又向外拓展了很多

参考文献

[1]Slonim, N. et al. Nature 591, 379–384 (2021).

[2]Lawrence, J. & Reed, C. Comput. Linguist. 45, 765–818 (2020).

[3]]Devlin, J., Chang, M.-W., Lee, K. & Toutanova, K. Preprint at https://arxiv.org/abs/1810.04805 (2018).

[4]Feigenbaum, E. A. Proc. 5th Int. Joint Conf. Artif. Intell. 1014–1029 (Morgan Kauffman, 1977).

[5]van Eemeren, F. H. et al. Handbook of Argumentation Theory (Springer, 2014).

[6]Hahn, U. Trends Cogn. Sci. 24, 363–374 (2020).

[7]Levy, R., Yonatan, B., Hershcovich, D., Aharoni, E. & Slonim, N. Proc. COLING 2014, 25th Int. Conf. Comput. Linguist. Tech. Pap. 1489–1500 (2014).

[8]Trautmann, D., Daxenberger, J., Stab, C., Schütze, H. & Gurevych, I. Proc. AAAI Conf. Artif. Intell. 34, 9048–9056 (2020).

[9]Rahwan, I., Zablith, F. & Reed, C. Artif. Intell. 171, 897–921 (2007).

原文以Argument technology for debating with humans标题发表在 2021年3月17日的《自然》的新闻与观点版块上

版权声明:

本文由施普林格·自然上海办公室负责翻译。中文内容仅供参考,一切内容以英文原版为准。欢迎转发至朋友圈,如需转载,请邮件China@nature.com。未经授权的翻译是侵权行为,版权方将保留追究法律责任的权利。

© 2021 Springer Nature Limited. All Rights Reserved

本文经授权转载自 Nature Portfolio(ID: nature-portfolio),如需二次转载请联系原作者

欢迎转发到朋友圈。

公司名称:长沙硕博电子科技股份有限公司
主营产品:工程机械控制器,环卫车电控系统,工程机械显示屏,智能分布式IO,操作面板