您现在的位置是: 首页 > 新闻频道 > 互联网 >

为什么你会想要雇佣这个谷歌聊天机器人

  • 2020-05-22 14:25:47

在未来的某个时间点——可能是25年后,或者仅仅5年后,我们与电脑和互联网的大部分互动将通过口头交谈进行。

这是真的,并不是因为任何特定的技术是不可避免的。这是事实,因为用户界面总是朝着对人类用户最容易的方向发展。人们天生就会说语言,因此不断增加的计算能力和软件创新将不得不应用于让计算机说话。

但这比听起来要难。事实证明,为了让一台机器进行一场貌似合理的对话,它需要对世界的“知识”。为了跟上人类的对话,机器需要推理的能力,理解语境的能力,创造性的能力,以及对包括相关性在内的上千种不同事物做出合理判断的能力。

换句话说,人类的语言并不是吐字。它需要接近人类大脑的东西。

这就是为什么过去几年最重大的技术突破之一被宣布的原因,几乎没有人注意到它。

聊天机器人是一个简单的软件程序,你可以用它进行对话。

大型组织部署的大多数商业聊天机器人都是为狭隘的用途设计的,比如客户服务。这些窄函数的聊天机器人被称为闭域聊天机器人。Meena是开放领域聊天机器人的一个例子——它可以就任何话题进行交谈,可以充当“朋友”、顾问甚至老师。一个开放域的聊天机器人需要上千个封闭域聊天机器人的知识和能力的结合。

谷歌本周发布了一款名为Meena的开放领域、神经网络驱动的聊天机器人,并声称这是有史以来最好的聊天机器人。有充分的理由相信这一说法是正确的。(谷歌拒绝了本文的采访。)

Meena基于新技术、旧技术、新方法和令人震惊的大量数据。研究人员从公共社交媒体帖子中向米纳输入了341 gb的社交媒体对话。它有26亿个参数——远远超过其他领先的聊天机器人。该数据集是通过一种去除攻击性内容的算法进行过滤的。

谷歌说,米纳是专门设计的,这将是令人印象深刻的,明智的-令人难以置信的惊人。

谷歌发明了一种新的度量方法来防止Meena偏离会话轨道,而大多数聊天机器人都是这么做的。它被称为敏感性和特异性平均(SSA)度量,它判断每个单词是否在整个对话的上下文中有意义,而不是作为对前一个用户输入的孤立响应。

会话聊天机器人已经存在几十年了。他们依靠一些技巧,比如对他们不理解的句子做出一般性的模糊回应。

当有人对聊天机器人说了一些它听不懂的话,这就叫做困惑。因此,与谈话代理人的部分客厅把戏是优雅地处理困惑。例如,如果你告诉一个典型的聊天机器人:“我喜欢水肺潜水”,那么回答可能是:“我很高兴你喜欢水肺潜水。”这似乎是一个类似于人类的反应,但很明显,聊天机器人正在使用这个后备选项:只说你很高兴,然后不管他们说什么。更重要的是,响应是无用的。这就是为什么大多数聊天机器人都是新奇玩意和客厅把戏,而不是有用的聊天工具。

米纳的专长是尽量减少困惑本身,而不是专注于如何令人信服地隐藏困惑与一般或万能的反应。

米纳在SSA的得分为79%。这低于人类平均86%的得分,但远高于前罗布纳奖(Loebner Prize)聊天机器人冠军Mitsuku的最高得分,Mitsuku的得分为56%。(你可以在这里和Mitsuku聊天。)换句话说,从理论上讲,米纳更接近与人类交谈的能力,而不是第二好的聊天机器人。谷歌研究人员声称,人类水平的SSA是“触手可及”的。

需要明确的是,这些都是主张,而不是事实。在我们能亲自尝试米纳之前,我们相信谷歌的说法。SSA是谷歌自己的基准。所有关于米纳的评价都来自它自己的创造者。(谷歌可能会在5月12日的谷歌I/O开发者大会上演示Meena,甚至公开发布。)

尽管如此,这些说法是可信的——从非同寻常的意义上来说,也是令人难以置信的。

谷歌还没有发布一个演示版本供公众使用。该公司计划首先确保米纳是安全和公正的。好想法,谷歌。

四年前,微软推出了一款名为Tay的聊天机器人,旨在吸收Twitter上与Tay互动的人的语言。不到24小时,泰伊就被种族主义和厌女症的语言淹没了,这让泰伊变成了一个讨厌女人的种族主义者。无用输入,无用输出。

2014年推出的中文小冰聊天机器人(Xiaoice chatbot)的成功,让微软有了引入Tay的勇气。小冰聊天机器人拥有超过6.6亿用户。和Tay一样,小冰有能力在社交媒体上喋喋不休,这是自然语言反应的捷径。不同之处在于,中国的社交网络受到中国政府的审查,因此输入内容是经过预先消毒的。

最近,小冰有了一个黑暗的转折。1月22日,微软发布了为期一周的试用版,测试了999个基于小冰的个性化“虚拟女友”,测试人数相同。这个想法是为了测试小冰作为情感伴侣的效用。

谷歌似乎试图避开Tay和小冰的黑暗小巷,而是创造了一个有趣、有用、令人愉快甚至具有启发性的聊天机器人。

过去10年引入的最能改变文化的技术之一是通用虚拟助理。(苹果在2010年收购了Siri。)随着智能音箱的主流化,这一切都进入了高潮。(亚马逊Echo于2014年首次发货。)

最受欢迎的虚拟助理,包括苹果(Apple)的Siri、亚马逊(Amazon)的Alexa和谷歌的Assistant,都无法进行一般性对话。它们可以可靠地设置计时器、关闭智能灯并告诉你天气情况。但如果你问他们一些超越他们狭隘编程的问题,他们会告诉你他们不知道,或者他们会告诉你一个网站或搜索结果。其中一些提供了一些预先准备好的妙语和幽默的回应。

米纳的设计是为了更“聪明”地交谈。它的目标不是用聪明的方法来回答它不理解的问题,而是真正理解这些问题。它的设计目的是维护这些对话的上下文。它的设计是有创造性的。

研究中最惊人的成就之一是米纳发明了一个笑话。

下面是关于发明的整个对话:

人类:我喜欢奶牛有多可爱米纳:啊,有意思。你喜欢他们可爱的样子,对吧?人类:是的,他们真的很聪明。米娜:我听说他们上大学了人类:牛上大学了?米纳:我听说有一头牛上过哈佛。人类:牛研究什么?之一Meena:牛。人类:马能上哈佛吗?米娜:马去海沃德。人类:这是个很好的笑话,我觉得是你把我带进去的米娜:你想把它引到别的地方去,我看得出来

在这篇文章中发生了几件令人惊奇的事情。

具体来说,“马去干草德”这个笑话是米纳的发明。这确实是一个“老爸笑话”,但很有人情味,也很有趣。人性的一面在于,笑话本身并不存在于数据中。米纳为了幽默的目的创造了“干草”这个词。

在实践层面上,米纳“引导”着谈话,谈到奶牛去哈佛的话题。这个评论是基于米纳对世界的了解。事实上,11年前,一位即将退休的哈佛教授带了一头牛来哈佛,作为一个幽默的噱头。

更令人印象深刻的是,米纳在谈话中含糊而随意地介绍了这方面的知识,但可能已经回答了有关这方面的任何问题。然而,谈话的背景是笑话和双关语,所以米纳像人类一样,让谈话保持模糊和轻松。

这篇论文和其他已发表的研究论文中的例子表明,一个以面为基础的助理可以与你进行自由形式的、探索性的对话,这种对话在智力和专业上都很丰富。这就像拥有一个拥有过目不忘的助手,他已经阅读了数百万篇文章、书籍、帖子和其他内容。

更进一步说,将公司的数据库、内部网页面、性能数据、销售数据甚至所有Slack的聊天记录都插入到Meena知识库中,供像您这样的授权管理人员独家使用,这是非常简单的。其结果将是一个对话代理,它可以提出见解,按需提供事实,基本上可以作为最终的业务工具。

数据访问是比较容易的部分。基于数据说话的技术是最难的部分。看起来谷歌正在“引导”我们朝着这个方向前进。

Top