“聊天机器人现在互相交谈了”

现在,两个聊天机器人正在互相交谈

莲娜·安德森并不是一个足球迷,但她确实花了很多时间在接送孩子们去足球训练和比赛。

“我可能不会拿出一个泡沫手指和涂着颜色的脸,但足球在我的生活中确实有一席之地,”这位足球妈妈说道,她也是一个完全虚构的角色。安德森是由像ChatGPT这样的人工智能软件扮演的虚构人物。

立即注册

订阅ENBLE的快讯Will Knight

尽管安德森的虚构身份不会妨碍她的观点,但她确实有一个详细的背景故事。在与一个真人交流的广泛对话中,这个机器人表示,它有一个7岁的儿子,他是新英格兰革命队的粉丝,喜欢去马萨诸塞州的吉利特体育场观看主场比赛。安德森声称,她认为足球是孩子们保持活力和结交新朋友的一种美妙方式。

在另一场对话中,另外两个AI人物杰森·史密斯和阿什利·汤普森彼此讨论了美国职业足球大联盟(MLS)如何吸引新受众的方法。史密斯建议开发一个移动应用程序,具备增强现实功能,显示比赛的不同视角。汤普森补充说,该应用程序可以包括“游戏化”,让玩家在观看比赛时获得积分。

这三个机器人是由纽约公司Fantasy开发的众多AI角色之一,该公司帮助LG、福特、Spotify和谷歌等企业构思和测试新的产品创意。Fantasy称其机器人为“合成人类”,并表示它们可以帮助客户了解受众,思考产品概念,甚至生成新的创意,比如足球应用程序。

MLS的数字体验副总裁科尔·斯莱顿表示:“这项技术真是令人难以置信,我们已经看到了巨大的价值,而这只是一个开始。”

视频:Fantasy

Fantasy使用像OpenAI的ChatGPT和谷歌的Bard这样的聊天机器人所采用的机器学习技术来创建它的合成人类。该公司从人类族群研究中提取了每个特工数十个特征,并将它们输入商业大型语言模型,如OpenAI的GPT和Anthropic的Claude。它的特工也可以被设定为了解现有产品线或业务,以便能与客户的产品进行对话。

视频:Fantasy

Fantasy随后创建了由合成人类和真实人类组成的焦点小组。参与者被给予一个主题或产品创意进行讨论,然后Fantasy和其客户观察讨论情况。石油和天然气公司BP要求50个Fantasy的合成人类讨论智能城市项目的创意。“我们获得了一批非常好的创意,”BP全球设计总监罗杰·罗哈特吉说。“相比之下,一个人可能会厌烦回答问题或不愿意以多种方式回答,而一个合成人类可以持续进行下去。”他说。

Fantasy的首席体验官彼得·斯玛特表示,合成人类为客户提供了新颖的创意,并促使参与对话的真实人类变得更具创造力。“看到新奇——真正的新奇——从这个方程的两个方面涌现出来,真是令人着迷,”他说。

视频:Fantasy

大型语言模型在模仿人类行为方面表现出了令人惊讶的优秀。它们的算法是通过从书籍、文章、Reddit等网站以及其他来源抓取大量文本进行训练的,使其具备模仿多种社交互动的能力。

当这些机器人采用人类形象时,情况就会变得很奇怪。

专家警告称,持有AI拟人化的观点既具有潜在的力量,也有问题,但这并没有阻止企业尝试。例如,Character.AI允许用户构建聊天机器人,假扮成真实或虚构的个体。据报道,该公司已寻求给其估值约为50亿美元的募资。

语言模型似乎反映了人类行为,这也引起了一些学者的关注。例如,麻省理工学院的经济学家约翰·霍顿(John Horton)看到了使用这些模拟人类(他称之为Homo silicus)来模拟市场行为的潜力。

你不必是麻省理工学院的教授或跨国公司,就可以让一些聊天机器人相互之间对话。在过去的几天里,ENBLE一直在模拟一个由25个AI代理组成的社会,这些代理在一个名为Smallville的村庄中过着日常生活,包括大学、商店和公园等设施。这些角色互相交谈,移动在一个看起来很像游戏Stardew Valley的地图上。ENBLE模拟中的角色包括珍妮弗·摩尔(Jennifer Moore),一个每天大部分时间都在家里涂鸦画的68岁的水彩画家;梅·林(Mei Lin),一位经常在帮助孩子做作业的教授;以及汤姆·莫雷诺(Tom Moreno),一个脾气暴躁的店主。

这个模拟世界中的角色由OpenAI的GPT-4语言模型驱动,但是创建和维持它们所需的软件是由斯坦福大学的一个团队开源的。这项研究显示了语言模型如何用于产生一些引人入胜且逼真(尽管有些简单)的社会行为。看到他们开始与客户交谈、小睡和有一个决定开设播客的情况非常有趣。

Stanford的Michael Bernstein教授说,大型语言模型“通过丰富的训练数据学到了关于人类行为的许多知识”,他希望以语言模型驱动的代理能够在真正的人类使用之前自主测试涉及社会联系的软件。他说,游戏开发商对该项目也表现出了很大的兴趣。

视频:幻想

斯坦福的软件包括一种让聊天机器人驱动的角色记住他们的个性、他们所做的事情,并反思下一步该做什么的方式。Bernstein说:“我们开始构建一个反思架构,在定期间隔内,代理会着手整理一些他们更重要的记忆,并对其提出问题。”“你这样做多次,就会构建起越来越高层次反思的树。”

Bernstein说,任何希望用人工智能模拟真实人类的人,都应该质疑语言模型实际上是否真实反映了真实行为。通过这种方式生成的角色与真实人类相比,不如复杂或智能,并且可能倾向于更加刻板和少样化,而不如从真实人群中采样的信息。他说,如何使模型更真实地反映现实仍然是一个“开放的研究问题”。

Smallville仍然令人着迷和迷人。在研究小组关于该项目的一篇论文中,他们描述了一个实例,在这个实验中,实验者告诉一个角色应该举办一个情人节派对。然后团队看着代理们自主地传播邀请,互相约会参加派对,并计划在正确的时间一起出现。

然而,ENBLE无法重新创造出自己的令人愉悦的现象,但他们设法保持忙碌。不过,需要注意的是,运行Smallville的实例会以惊人的速度消耗OpenAI的GPT-4的API配额。Bernstein说,运行模拟一天或更长时间的成本超过一千美元。就像真实的人类一样,合成的人并不是免费工作的。