创建具有多种对话技能的聊天机器人

发布时间:2020-05-23 12:00    来源:科技报告与资讯
 

关键词:聊天机器人

摘要:近年来,聊天机器人已经变得越来越普遍,它们在各种在线平台上为人类提供基本的帮助。到目前为止,聊天机器人通常被设计成擅长于某一种单独的对话技能或风格,例如,提供客户帮助或就某一主题提供基本信息。

  近年来,聊天机器人已经变得越来越普遍,它们在各种在线平台上为人类提供基本的帮助。到目前为止,聊天机器人通常被设计成擅长于某一种单独的对话技能或风格,例如,提供客户帮助或就某一主题提供基本信息。

  最近,Facebook AI Research的研究人员进行了一项研究,调查了将不同对话的技能结合起来,以增强其整体能力的可能性。他们的论文预发表在arXiv上,并定于在2020年ACL大会上发表,该论文提出了不同的技术,将不同模型的技能合二为一,同时还引入了一个数据集,可用于分析孤立训练的单个会话技能在单个代理中的适合程度。

  "在这个项目之前,我们的团队已经制作了一些AI模型,这些模型在与人类对话时各自都非常擅长以某种方式与人类对话:我们有一个能够将知识融入对话中的模型,一个擅长同理心回应的模型,还有一个擅长在对话时保持一致的模型,"进行这项研究的研究人员之一Eric Smith说。"我们在这项研究中的目标是产生一个能够在这三种沟通方式之间平稳切换和融合的单一模型。"

  人类能够根据自己所处的情况,自动切换到不同的对话风格。例如,人类能够在谈论自己、倾听他人的意见并安慰他人、交流有关某件事情的知识或信息等之间交替进性。Smith和他的同事们希望在对话代理中重现这种能力,创建了一个能够以多种不同方式与人类交流的模型。

  "一开始,我们在三组不同的对话中训练了一个模型,每一组对话都有不同的语境,并被设计成展示不同的技能:谈论自己,用同理心倾听,以及提供知识,"Smith说。"这使得我们的模型能够在这些技能基准中的每一项单独的技能上都做得很好。"

  最初,研究人员并不确定如何能教他们的模型以类似于人类的方式在不同的对话技能之间无缝切换。因此,他们决定收集一个新的数据集,被称为BlendedSkillTalk,现在可以在ParlAI在线平台上下载。这个数据集包括了大约5000个人类对话,在这些对话中,说话者在三种对话风格之间切换,即谈论自己,对他人分享的故事做出共鸣式的反应,以及分享知识,所有这些都是在一次对话中进行的。

  "我们的一种方法是,在每次对话中随机抽取两位演讲者中的一位,并在每次轮到他们发言时,给这位演讲者三个不同的建议,让他们说些什么。"Smith解释说。"这三个建议中的每一个都会显示出我们希望演讲者在三个技能中的一个技能,让他们在这三个技能之间切换。演讲者可以选择是否利用其中的任何一个建议,但结果是,我们发现几乎所有的参与者的对话都显示出这三种对话技巧中的至少两种。"

  当Smith和他的同事们在他们编制的数据集上训练他们的模型时,他们发现模型模仿其中包含的混合对话的能力有了明显的提高。此外,BlendedSkillTalk数据集中包含的对话特别强调多种对话技能的混合,这使得它非常适合评估一个模型在杂耍不同技能方面的表现。

  "我们的数据集的特点是从一种会话技能切换到另一种会话技能的例子,所以它提供了一个比在多个单独的单一目的数据集上评估模型更全面的测试环境,"Smith说。"我们的研究显示了如何利用专注于每种技能的现有数据集,以训练一个能够在对话中无缝融合这些技能的模型。"

  这个研究团队所进行的研究可能会对对话代理的发展产生一些有趣的影响。首先,Smith和他的同事们介绍了将对话技能融合到一个计算模型中的技术,这可能最终会使人们能够开发出更多功能和性能更好的聊天机器人。此外,他们编译的新数据集可以被其他研究团队用来训练、评估和比较其他自然语言处理模型。

  "我们现在希望通过进一步增加模型可以训练出的技能来扩展这项工作:比如说幽默、对图像进行评论、通过对话来完成特定的定向任务等。"Smith说。

(责编:)

全国人大代表许燕妮:经济下行期应继续加大对制造企业的税费支持力度

 2020年全国两会召开在即,不少人大代表和委员将为此发声。全国人大代表,广西玉柴机器股份有限公司(以下简称玉柴股份)新品试制装配工段工段长、内燃机装试工种技能大师许燕妮就是其中之一。“2019年,玉柴股份国六产品累计订单达到3万台,2020年我们的目标是挑战10万台,但是在经济下行压力加大的情况下,制造业企业面临的资金压力和经营压力巨大。”许燕妮说,因此她今年建议之一就是针对制造业减税降负而提的。