为人工智能打标签的人,时薪只得2美元?

本文来自微信民众号:大数据文摘(ID:BigDataDigest),作者:Caleb,原文题目:《今日人为到账8美元?!AI行业克扣严重,ImageNet仅4%数据符号工人收入过最低线》,头图来自:视觉中国

只管随着AI的普及,我们在生涯中越来越依赖于人工智能,但“人工智障”的相关讥讽也从来没有消逝过。

信赖人人都知道,若是我们想要让AI准确识别出图中的鸟,我们需要在数据集中手动将这些照片符号为鸟,然后让算法和图像之间发生关联性的判断识别。

为人工智能打标签的人,时薪只得2美元?

要是小规模的实验性数据还好,一旦遇到那种规模多达数百万个的符号需求,其中消耗的时间真是难以想象。

俗话说,那里有需求,那里就有市场。

凭据普林斯顿大学、康奈尔大学、蒙特利尔大学和统计科学研究所的团结观察,研究者们发现,这项符号事情大部分是由欧美国家以外的来自全世界各地的工人共同完成的

论文中指出,类似数字经济公司Samasource等会大量雇佣来自撒哈拉以南非洲和东南亚的廉价工人,让他们完成这些死板的事情,天天给他们支付8美元的薪水,同时这些公司每年能够收入上千万美元。

为人工智能打标签的人,时薪只得2美元?

论文链接:https://arxiv.org/pdf/2102.01265.pdf

为ImageNet事情的工人只能拿到2美元时薪

由于许多深度学习手艺需要大量的数据来训练模子,数据标签的需求也日渐增添,跨越80%的机械学习开发历程包罗数据的网络、洗濯和标签等事情。

对于Uber和Alphabet等大型科技公司而言,这些服务显得更为重要。

然则,当我们换个角度,只管这些工人正在为当前最热的人工智能行业做出孝敬,这些系统最终可能并不会直接惠及到他们所在的社区,更令人唏嘘的是,不少系统可能会对他们的种族或性别等发生带有私见的判断。

好比ImageNet,这个大型公然的图像数据集可以说是人工智能历史上影响力最大的数据集之一了。

研究者指出,为ImageNet符号的工人只能拿到2美元的时薪,只有4%的工人时薪跨越了美国联邦最低人为尺度的7.25美元。

同时,由于ImageNet是使用WordNet举行注释的,凭据一项名为“ImageNet Roulette”的实验指出,若是人们将照片提交给由ImageNet训练出来的神经网络,该神经网络将使用数据集中的标签来形貌这些图片。

但当人们在系统中输入的是他们最感兴趣的照片:自拍时,软件会输出一些种族主义和冒犯性的标签来举行形貌

为人工智能打标签的人,时薪只得2美元?

虽然数据标签不像传统工厂劳动那样破费体力,但不少工人们讲述示意,他们的义务速率和数目是“令人疲劳”和“单调”的,由于他们必须严酷根据客户的规格要求来符号图像、视频和音频。

“幽灵工人”无谈判态度,基本权益也难以获得保障

近几年,在全球南部,不少本土科技公司大量涌现,好比肯尼亚的Fastagger、南非的Sebenz.ai和马来西亚的Supahands。随着人工智能生长不断扩大规模,这些公司的扩张也为低技术劳动者进入劳动力市场打开了大门,但相关的劳动克扣行为也仍然在发生着。

研究者们将这些数据符号工人称为“幽灵工人(ghost worker),由于外界往往看到的只是一个系统的高识别率,而忽略了这些工人为训练数据集做出的劳力事情。

为人工智能打标签的人,时薪只得2美元?

研究者们提出,在美国,这种低人为结构很大程度上是由于花在没有抵偿的流动上的时间,好比从事一项最终会被拒绝的义务。

这就引出了Amazon Mechanical Turk这样的平台在权力动态上的另一个问题。我们就以该平台为例,在这个平台上,所有的权力都集中在义务的请求者那里,请求者有权力设定他们预计的价钱,这个价钱可以低至0.01美元,同时请求者还可以谢绝工人已经完成的事情,并声称该项义务所需的时间远远少于工人们破费的时间。

在美国,处于这种事情中的符号工人往往被认为是自力承包商而非雇员,因此《公正劳动尺度法》所保障的珍爱措施并不能在他们身上适用。

讨论美国的相关情形只是由于这些数据是最容易获取的,在全球范围内,更糟糕的劳工征象只会更多。

“流水线”工人正在成为企业的竞争力

2018年,BBC记者Dave Lee走访了生涯在肯尼亚贫民窟的符号工人,也发现了相同的问题。

凭据报道,生涯在Kibera的独身母亲Brenda天天的事情内容就是把大多数的图像数据处理成计算机能够明白的形式。

好比说,在一张上传的照片上,Brenda需要用鼠标跟踪泛起的物体,包罗人、车辆、路牌、车道、天空,还要稀奇说明是晴朗的照样阴霾的天空。把数百万张这样的图片输入到人工智能系统中,对于自动驾驶汽车这类产物而言,就能够提高系统的识别准确率。

Brenda的事情环境也绝称不上友好。她和所有的同事都挤在狭窄的办公室里,整个事情她必须紧盯显示屏、放大图像,防止标错哪怕是一个像素。

为人工智能打标签的人,时薪只得2美元?

上级职员会检查他们的事情,若是没有到达要求,还需要返工

固然奖励也是有的,速率最快、准确率最高的符号员的名字会泛起在办公室多台电视机屏幕上,以兹激励。固然他们最喜欢的,照样阛阓的购物券。

Samasource是他们最大的雇主,凭据首席执行官Leila Janah示意,公司能够与谷歌等科技巨头确立合作关系,除了准确性和安全性之外,另有一个原因是他们拥有全球最廉价的劳动力,而且当地人迫切需要稳固的事情。

那时,Samasource给出的日薪是9美元,他们希望借此辅助到那些日薪低于2美元、还需要从事地下事情的人。

“确实,它有很高的成本效益”,Janah说,“但我们事情中的一个要害点在于,我们不会提供可能损坏当地劳动市场的薪酬水平。若是我们给出的薪酬过高,我们会给整个社会带来贫苦。好比,可能会对我们员工所生涯的社区的住房成本、另有食物成本等带来潜在负面影响”。

在论文中被提及的另一组织Masakhane,该组织致力于通过AI珍爱非洲语言。值得注意的是,Masakhane不会为AI研究者们符号数据,而是确立了一个为非洲大陆符号、研究和构建算法的社区。

官网上写道:“我们建议将AI开发视为经济生长的前进之路”,“此开发流动不应专注于低生产率流动,例如数据符号,而应专注于高生产率流动,例如模子开发/部署和研究”。

最后,论文指出,对于这种征象,潜在的解决方案是将这些数据符号器简朴地集成到AI开发历程中,而不是让他们作为流水线工人为每个图像举行符号来赚钱。云云,工人会获得公正的薪水,况且得益于他们的生涯经验和专业知识,数据网络历程中的差异也能被很好的发现并解决,系统的整体准确率也将获得提升。

本文来自微信民众号:大数据文摘(ID:BigDataDigest),作者:文摘菌

原创文章,作者:28rg新闻网,如若转载,请注明出处:https://www.28rg.com/archives/54725.html