科技魔方

IBM遭质疑:未经许可用网络相册照片训练AI

人工智能

2019年03月13日

94216750500.jpg

  在过去一年中,科技公司侵犯消费者个人隐私成为舆论关注焦点,而老牌科技巨头IBM似乎和这样的丑闻并无关联。不过据外媒最新消息,IBM最近也陷入了一个争议中,被指未经个人用户批准擅自利用海量个人照片对图像识别系统进行训练。

  据国外媒体报道,IBM从网络相册Flickr上拍摄了近100万张个人照片,用它们来研究如何训练面部识别训练程序,并与外部研究人员分享照片。

  但是据美国全国广播公司(NBC)爆料称,在Flickr上传照片的用户并不同意把他们的照片用来开发面部识别系统,要知道考虑到这些系统最终可能会被用来监视和识别他们,他们自然不愿意轻易批准。

  虽然摄影师可能已经获得了为这些人拍照的许可,但一些人告诉NBC,被拍照的人不知道他们的照片上有面部识别注释,可以用来训练识别算法。

  一位摄影师告诉NBC:“我拍摄的人中没有一个人知道他们的照片是以这种方式使用的。”

  顺便说一句,这些照片最初不是由IBM汇编的-它们是被称为YFCC100M的更大的9920万张照片库的一部分,YFCC100M是Flickr之前的东家雅虎公司最初为进行研究而收集的。所有照片都是在CreativeCommonsLicense版权协议下共享的,这种版权协议表明照片可以自由使用,但存在一些限制。

295.jpg

  但事实上,他们可能被用来训练面部识别系统,以按种族划分,或是作为一个人脸案例。

  值得一提的是,IBM公司过去开发了一款视频分析产品,它使用人体摄像头来了解人们的种族。对于此次拍摄网络相册的人脸照片,IBM否认将“参与涉及种族相貌识别的工作”。

  同样值得注意的是,IBM的初衷可能是为了防止人工智能对某些群体产生偏见。今年1月,当IBM宣布收集数据时,该公司解释称,它需要一个如此庞大的数据库,以帮助进行“公平”和准确的图像识别培训。

  无论如何,对于一般人来说,很难检查他们的照片是否被用于人工智能训练,并请求删除他们的照片,因为IBM对任何和学术或公司研究无关的人都不会公开数据库。

  NBC从不同的来源获得了数据集,并在其文章中为摄影师制作了一个工具,用于检查他们的Flickr账户名是否包含在IBM的数据库中。

  IBM在一份声明中告诉媒体称,“我们非常重视个人隐私,并非常小心地遵守隐私原则。”它指出,照片数据库只能由经过验证的研究人员访问,而且只能包括网络上可公开获取的图像。它补充说,“用户个人可以选择退出这个数据库。”

  IBM只是探索面部识别领域的几家公司之一,它并不是唯一家使用普通人照片而不明确征求民众同意的公司。例如,Facebook有80万张脸部照片可供其他研究人员下载。

+1

来源:腾讯科技 作者:审校/承曦

推荐文章