这些囚犯正在训练人工智能

囚犯训练人工智能

在一个无窗的房间里,我坐在一张无菌的白色桌子前,介绍了一个四十多岁的女人。她有一个方形下巴和金色的头发,用一个淡蓝色的发饰把头发束起来。“女孩们叫我果酱,”她说,邀请我使用她的监狱绰号。在一个星期三的早上,果酱在这里,身处芬兰的一所监狱,展示一种新型的监狱劳动。

桌上除了一个小塑料瓶装的水和一台惠普笔记本电脑外,什么都没有。在每个三小时的班次中,她会得到1.54欧元(约合1.67美元)的报酬,这台笔记本电脑会显示给果酱一些关于房地产的短文,并询问她刚刚阅读的内容是否是关于房地产决策而不是应用程序的问题。

“有点无聊,”果酱耸了耸肩。她也不完全确定这个练习的目的是什么。她猜想也许她是在帮助创建一个客户服务的聊天机器人。

实际上,她正在训练一款由芬兰初创公司Metroc拥有的大型语言模型,该公司创建了一个搜索引擎,旨在帮助建筑公司找到新获批的建筑项目。为此,Metroc需要数据标注员帮助其模型理解新闻文章和市政文件中关于即将进行的建筑项目的线索。人工智能必须能够区分已经委托建筑师或窗户安装工的医院项目和可能仍在招聘的项目等。

在全球范围内,数百万所谓的“点击工作者”训练人工智能模型,教机器区分行人和棕榈树,或者描述暴力或性虐待的词语组合。通常这些工作者驻扎在工资低廉的全球南方地区。例如,OpenAI使用一家在肯尼亚、乌干达和印度雇佣点击工作者的外包公司。这种安排适用于在全球最广泛使用的语言英语中运营的美国公司。但在全球南方没有很多会说芬兰语的人。

这就是为什么Metroc转向监狱劳工的原因。该公司得到了廉价的会说芬兰语的工人,而监狱系统则可以为囚犯提供就业机会,据称为他们在释放后进入数字化工作世界做好准备。利用囚犯来训练人工智能会引发人们对技术下游常常存在的低薪和有时剥削性劳动的不安。但在芬兰,这个项目得到了广泛的支持。

“有一个关于数据劳动的全球观念。然后在芬兰,如果你仔细看,它是非常不同的,”赫尔辛基大学的研究员图卡·莱蒂克尼米(Tuukka Lehtiniemi)说,他一直在研究芬兰监狱的数据劳动。

果酱已经在哈梅恩林纳监狱住了四个月。这座建筑物现代化,有大窗户。色彩缤纷的艺术品试图给空荡的走廊带来快乐的感觉。如果不是每个出入口都有沉重的灰色安全门阻挡,这些房间很容易被误认为是一所特别冷漠的学校或大学综合楼。

芬兰可能以其开放式监狱而闻名,囚犯可以在附近的城镇工作或学习,但这不是其中之一。相反,哈梅恩林纳是该国最高安全的监狱,专门收容女性囚犯。果酱被判处六年监禁。根据监狱制定的隐私规定,ENBLE无法发表果酱的真实姓名、确切年龄或任何可能用于识别她的其他信息。但在一个囚犯在服刑12年后可以申请获释的国家,六年是一个重判。和其他住在这里的100名囚犯一样,她不能离开。

哈梅恩林纳监狱RISE提供的图片

当果酱刚到的时候,她会看其他女人每天早上起床去工作:她们可以自愿打扫卫生、洗衣服或缝制自己的衣服。六个小时的工作,她们将获得大约6欧元(约合6.50美元)的报酬。但果酱无法忍受参与其中。“我会觉得非常累。”她说。相反,她在自己的牢房里度过了很长一段时间。当一个监狱顾问建议她尝试“人工智能工作”时,这种短暂的三小时班次吸引了她,而且这笔钱比没有好。“虽然不多,但比呆在牢房里要好。”她说。她只做了三次班,但已经感到一种成就感。

这是三个芬兰监狱之一,囚犯可以自愿通过数据劳动赚钱。每个监狱都设置了三台笔记本电脑供囚犯参与这项人工智能工作。没有目标要求。囚犯的报酬是按小时计算的,而不是按工作速度或质量计算。哈梅林纳的一位监狱工作指导员名叫米娜·因基宁,她留着修剪整齐的红发,坐在我们谈话的同时与Marmalade坐在一起。“有些人确实比其他人更喜欢这个。”当我在一个星期三的早晨到达监狱时,缝纫室已经很忙碌了。囚犯们正聚在缝纫机上,或者两个人一起商量着一堆织物。但是进行人工智能工作的小房间在Marmalade到来之前是完全空的。Inkinen说,只有三名囚犯定期自愿参加AI班次,解释说其他两人目前正在法庭上。“我更喜欢集体做。” Marmalade说,并补充说她开着门,这样她可以在回答问题的同时和隔壁缝纫的人聊天。

这些问题是在距离监狱100公里南部的赫尔辛基一个时尚的共享办公空间手动编写的。在这里,我见到了Metroc的高个子、童颜鹤发的创始人兼首席执行官朱西·维尔纳拉。他带我走进一个闷热的电话亭,经过一排室内秋千、一个台球桌和一系列穿着西装的男人。他笑着说,这是一个令人兴奋的一周。公司刚刚宣布了一轮200万欧元(210万美元)的融资,他计划用于在北欧地区扩张。他说,他与投资者的对话都对公司与芬兰监狱的联系感到好奇和兴奋。“每个人都对这种创新的方式感到兴趣和激动。”维尔纳拉说,“我认为这在产品方面确实非常有价值。”

将监狱作为劳动力来源是维尔纳拉的想法。公司需要母语为芬兰语的人帮助改进其大型语言模型对建筑特定语言的理解。但在像芬兰这样的高工资经济体中,很难找到这些数据劳动者。芬兰福利系统慷慨的失业救济金几乎没有让芬兰人有动力注册亚马逊的Mechanical Turk等低工资点击工作平台。“Mechanical Turk没有太多芬兰语工作者。”维尔纳拉说。与此同时,他补充说,自动翻译工具对芬兰语仍然不够好,芬兰语只有500万母语使用者。

当维尔纳拉在2022年向芬兰监狱和缓刑机构的智能监狱项目负责人皮娅·普拉卡提出他的建议时,她立即表示兴趣。在疫情爆发之前,另一家叫做Vainu的芬兰科技公司曾经利用囚犯进行数据劳动。但是在两位联合创始人之间发生争执后,Vainu突然退出,导致负责该项目的Tuomas Rasila离开了该公司。

到维尔纳拉在2022年向她提出提案时,普拉卡渴望恢复人工智能工作。她的工作是让芬兰监狱与互联网的关系更加接近日益数字化的外部世界。到目前为止,她一直在囚犯的个人牢房里安装笔记本电脑,以便囚犯可以浏览受限制的网站并申请视频通话许可。她认为数据劳动只是这一使命的一部分。

目标不是取代传统的监狱劳动,如制作路标或园艺。而是给囚犯更多的选择。数据标注只能进行三小时的轮班。“一天做八小时,只做这种类型的工作可能会很累。”她说,并补充说,如果囚犯能够在其他类型的监狱劳动中进行数据标注,那将是很好的。“这种工作是未来,如果我们想要让囚犯为出狱后的生活做准备,过上没有犯罪的生活,这些技能可能至少和监狱提供的传统工种一样重要。”她说。

然而,数据标注能否为囚犯提供可转换为出狱后工作的技能尚不清楚。Tuomas Rasila,Vainu的前联合创始人,曾在该公司负责监狱项目一年,他承认自己没有证据证明这一点;他说,项目运行时间不够长,无法收集证据。“我认为要求那些可能感到被排除在社会之外的人来培训现代社会最高科技的方面是一种赋权的想法。”

然而,其他人认为这种新形式的监狱劳动是支持人工智能革命的廉价劳动的一部分,存在问题。“我们正在向一个更加便利和高效的全自动化社会发展的叙述往往掩盖了这样一个事实,即这些系统背后实际上是有人类在工作,”人权观察组织人工智能高级研究员阿莫斯·托表示。

对于Toh来说,对所谓的点击工作者的加速搜索已经形成了一种趋势,公司越来越多地转向那些别无选择的人群:难民、处于经济危机中的国家的人口,以及现在的囚犯。“这种动态是非常熟悉的,”Toh说。“我们在这里看到的是一个更广泛的现象的一部分,科技建设背后的劳动力被外包给在潜在剥削性工作环境中劳动的工人。”Toh对于数据劳动是否能帮助囚犯建立数字技能持怀疑态度。“在监狱里,人们有很多方式可以提升自己,比如获得证书和参加高等教育,”他说。“但我对于每小时一欧元为一家公司进行数据标注是否会带来有意义的进步持怀疑态度。” Hämeenlinna监狱确实为囚犯提供在线人工智能课程,但Marmalade面无表情地坐在那里,工作人员试图解释其好处。

当我见到来自赫尔辛基大学的研究员Lehtiniemi时,我对监狱项目的优点感到矛盾。从监狱直接前往Metroc的办公室,那里正在庆祝2000万欧元的融资轮,感觉很不协调。在赫尔辛基大教堂的大型圆顶对面的一家咖啡馆里,Lehtiniemi耐心地听我描述那种感觉。

但Lehtiniemi与囚犯的访谈给他带来了不同的观点,他对这个项目普遍持积极态度。在我提到薪酬差距的观点上,他认为这不是主流社会中的普通劳动力。这些人在监狱里。“比较我作为研究员得到的钱和囚犯为他们的监狱劳动所得到的钱,这没有意义,”他说。“我听到的唯一负面的事情是这项工作不够。只有少数人可以做到,”他指的是每个监狱限制为三台笔记本电脑。

“当我们思考数据劳动时,我们倾向于思考Mechanical Turk,在全球南方或美国农村的人们,”他说。但对他来说,这是一种独特的本地版本的数据劳动,它带来了一个有利于社会的转折。它为囚犯提供了认知刺激性的工作,相比其他监狱劳动选择,同时也代表了芬兰语在人工智能革命中的地位。

如果没有这种倡议,Lehtiniemi担心非英语语言将被排除在下一代技术之外。智能音箱仍然难以理解芬兰方言。“并不是所有的芬兰人英语都说得很好,所以也需要这些本地形式的数据标注,”Lehtiniemi说。Metroc并不是唯一一个被迫寻找芬兰数据劳动的公司。2011年,国家图书馆创建了一个游戏,以激励志愿者帮助数字化其档案。2020年,广播公司YLE与赫尔辛基大学和国家发展公司VAKE合作,要求志愿者捐赠他们说芬兰语的录音。

在芬兰,有一种感觉认为监狱项目只是一个开始。有些人担心,这可能会开创先例,引入更多有争议的数据标注类型,比如审查暴力内容,进入监狱。“即使目前在芬兰进行标注的数据不具有争议,我们也必须考虑它所树立的先例,”Toh说。“如果公司将这视为一个未被开发的劳动力资源,那么是什么阻止他们将创伤性和令人不悦的内容的数据标注外包给囚犯呢?”

芬兰监狱的劳动条件是否能在其他对待正义持较保守态度的国家复制,目前还不清楚。根据民权组织ACLU的数据,美国有76%的囚犯报告称监狱劳动是强制性的。“美国的监狱系统与我们在芬兰或北欧国家拥有的系统非常不同。这是完全不同的理念,”Rasila说。“在芬兰,对于这个项目有一个完全积极的感觉,因为每个人都知道这是非常自愿的。”

人工智能公司只会需要更多的数据劳动,迫使他们不断寻找越来越不寻常的劳动力来保持步伐。当Metroc计划在北欧及其他非芬兰语言地区扩大业务时,Virnala正在考虑是否将监狱劳动项目扩展到其他国家。“这是我们需要探索的事情,”他说。