人工智能识别率的准确度高吗?80%人都不知道的背后真实情况

2022-09-08 14:28 · 小编
A+ A-

最近不少人工智能和计算机视觉的学者,带着自己的机器学习技术投身于心理学研究。出发点很好:用更新的技术探究问题。但是他们的成果让人担心。前有用人工智能分析潜在罪犯,后有用人工智能分辨性取向。这些论文都引发了轩然大波。不少人抨击之点就是伦理问题。其这些文章的科研问题也存在。相比于安防领域的面孔身份识别广受赞誉,那一类分析潜在罪犯潜在性格的机器学习研究其实都有值得推敲指出。

简单粗暴一句话:前「用 AI 识别 xxx 」一类研究,没想象中靠谱,不要轻信。

就让我们从斯坦福大学学者训练人工智能识别性取向说起吧这篇文章无论从伦理角度,还是科研本身的角度都有问题,可能唯一没有问题的就是作者的专长机器学习了吧。让我们先说伦理部分,再说统计部分,最后就是致命的研究基础的缺陷。

之前我已经在华沙:斯坦福大学「识别同性恋 AI」是怎么办到的?可能引起哪些伦理争议?下吐槽过,这一次详细谈一谈。

回顾下这篇研究(论文:Deep neural networks are more accurate than humans at detecting sexual orientation from facial images.链接:https://osf.io/zn79k/)两位作者收集到大量社交网络上的图片,以及图片所有者的性取向,训练出一个识别性取向的‘机器’。尽管动用了 DNN 神经网络等计算机技术,但是整套系统的基础却是基于认知心理学与生物学的。作者也承认,他们训练出来的分类器的原理是区分一下两个与性取向相关的特征点,我们可以总结为:1. 荷尔蒙(雄、雌性激素)影响下面孔特征(面孔比例,比如宽高比,下巴长度等),2. 不同性取向者喜欢的发型、胡型、以及妆容、甚至眼镜等配饰。

尽管在机器学习方面,这篇文章做得很好,但是其余领域暴露出不少遗憾。这我可以归结为认知心理学与计算机科学的差异,至少在认知心理学方面伦理是极其需要看重的,所以我们先从伦理出发。

首先让人担心的就是选择图片的伦理问题。文章说近三十万张图片来自于一个美国婚恋网站。很难让人相信这三十万张面孔,以及性取向信息都获得了主人的允许。这些头像虽然出现在婚恋网站上,被允许以约会目的来互相看,但并不等于被允许基于试验用途。认知心理学的实验,既需要学校伦理委员会的认可,也需要被实验者(或者图片提供者)的许可;不当使用他人图片难免有泄漏和其他的风险。科研伦理可能不是所有专业的必修课,但是至少在心理学科研领域是重中之重。图片选择过程让人觉得遗憾。

诚然人工智能对于生活与科研都有极大帮助。但是如此的结果不由得让人不安:我们的大量数据都在科技大鳄手中,通过分析,是不是他们能掌握我们所有的特点,然后精确的投放广告,或者用二级价格歧视榨取我们身上钱财。你看,这个能分辨性取向,明儿也能分辨爱不爱花钱,分辨你爱不爱买特定品牌,甚至分析你什么时候最捂不住钱包,什么时候耳根子最软,滥用起来就是能榨干消费者。

其实,技术本身应该是中性的,但是解读和利用是我们需要认真讨论的。没准在未来,到处都是针对每个人(从面孔,消费记录,个人经历分析而来)的量身打造消费陷阱了。所以说这项研究,在没有扎实的理论支持下(我们之后谈理论问题),很有可能被误解被误读。

不容小觑的误读,正是基于统计层面的。有时候单纯的统计数据并不能直接反应效用。作者声称,他们的分类器相比真人更准确分辨性取向:对男性正确率为 81% (真人只能达到 61% ),对于女性能达到 61% 正确率(真人准确率仅为 54% )。看似此项分类器效果显著。但是由于在实际生活中,异性恋的比例超过 95% 。;考虑到很有可能的基本比率谬误,所以把此项分类器用在真实生活中,正确率并不会有那么高。作者也承认,这么高准确性仅会出现在:明确知道有两张性取向不同者照片时。但是真实生活中哪有这么良好的判断环境。

其次此项研究还有一个要命的问题,既是实验的不足,也是许多人误读的来源。让我们用统计角度。如果简化整篇文章,作者做了三步:1. 寻找训练集中不同性取向者的面部特征;2. 训练机器识别这些特征;3. 在测试集面孔上此类特征,并预测性取向。不过,男异性恋者有 x 类胡型的概率,并不等于有 x 类胡型为男异性恋者的概率。所以说,不少人看到论文给出的图片,就用图上特征推断性取向会是极大地误读。

最大的遗憾来自于理论基础和实验。

文章作者也承认,训练集是来自于网上图片。特点是多样,生活化。但是缺点就是控制性。相比计算机视觉学者更喜欢这样自然、通用的数据。我们认知心理学、神经科学工作者更倾向于控制的数据。看似前者更有用,但是别忘了,大千世界中,互相影响的因素众多。倘若不加以控制就难以得出清晰的结论。

虽然有人说不能按照心理学严格标准去要求此类基于大数据的研究。但是我得说一句,不仔细要求就会错误百出!

此项研究中使用了大量自己上传的图片。所以图片的光源,面孔朝向均无控制。然后作者用我们国家自主研发的 Face++ (给国产点个赞!)对五官进行了标记。就这简单两步可能错误百出。因为图片是二维的,所以光源朝向都可能会 「扭曲」五官相对位置,从而干扰结果。 Kramer (2014)的论文中就提到,同一个摆出不同的表情以及转动脑袋都会影响二维图形上的面孔比例。所以此项研究没有控制面孔图片,会给分析带来不少的未知干扰因素,削弱结论的强度。

我们再举几个例子。英国的科学家 Burton 和 Jenkins 曾经长期研究过一个人面孔在不同环境下差异。

这是 Bruce 与同事们在 1999 年的论文中的一个例子,这一堆面孔披头盖脸的忽闪上来,真心不太好判断左边那张面孔属于右边十个人里面的谁。原因之一就是不同环境。光源,甚至拍摄角度都会影响面孔的形态。别忘记了:头像照是你的三维面孔向二维图像的投影。你面孔上的宽高信息会随着光线和面孔朝向变化。


3fa8782f3b788d9fda4913d34d668b2.jpg


不同的镜头有不同的光学特性,同样的面孔在不同焦距下也不一样。面孔的「两性异性」也会变化。难道镜头变化,所以你的性取向就变了么?


真知拙见KnowledgeHot知识星球案例图


再比如小李子。随着年纪增长,他的脸颊见宽,胡子见多,下巴见方。倘若按照本文的理论基础去分析,难道奥斯卡影帝的性取向随着年纪在那变化么?

作者也承认,他们分类器对于男性面孔结果更清晰。一个原因就是胡须在男性面孔上的鲜明:材质特殊,高对比度,占据面积大。因此不同性取向者不一样的蓄胡须方式,会在此项判断上占据主导地位。所以说,此项分类器,倘若训练时依靠发型、胡型、以及妆容、配饰,而面孔特征;那么照片本身会极大影响此分类器的效用。

让我们回到实验里。左边两个为异性恋,右边两个为同性恋。男性的两张明显可见胡须的差异。明显可以看到男性的面孔有眼镜。所以说,只针对白人的研究可能没有控制教育水平这个因素。

仔细看一看,是不是左边的男性更仰头,右边的男性更低头。仰头和低头本身就会在拍摄过程中改变图像上面孔比例,因此结果需要打一个问号。

再说荷尔蒙。虽然说有不少学者认为在胎儿期的荷尔蒙水平会影响性取向。的确有很多学者承认荷尔蒙水平会影响面孔的特征,所谓两性异性。比如雄激素更多的男性,胡须旺盛,下巴坚毅宽阔;和此研究的数据结果吻合。但是,此项研究应该说用机器:1. 发现了荷尔蒙对于面孔形状的改变,2. 然后借用一个理论‘荷尔蒙和性取向相关’,3.最后推论说能够发现性取向。仔细想想看,第2步是整个实验的逻辑核心;但也是解读时容易犯错之处。

另一个角度看,别忘记这个荷尔蒙水平还会影响食指和无名指长度比值。也就是说,这个实验的原理,在某种程度上可以说是与 ‘通过看手指长度判断性取向’ 类似。更要命的是,之前有不少论文抨击过「荷尔蒙与面孔比例」的关系。比如 Bird 和同事们( 2016 )发现,分析大样本数据后,面孔宽高比与荷尔蒙没啥关系。因此,假如面孔比例不能预测荷尔蒙分泌,难么此研究基于的荷尔蒙-性取向假说不可能在面孔上被反映出来。总之,这篇文章的基础值得怀疑。(虽然以荷尔蒙-面孔比例的文章不少,而且有些也有让人满意的结果,但是不代表他的理论基础完全夯实)。

倘若这些研究是利用在分析面孔探究皮肤病我会双手赞成。但是如果分析人的特征,性格,我觉得计算机视觉的学者还是要找一个心理学工作者一起研究。机器学习用途广大,但是不加以分辨的使用会带来误解和谬误。只有理论基础扎实的研究,只有伦理方面无忧的研究,才能给我们的生活给以帮助!

 


本文来自由几十位各行业专业人士、知乎优秀答主共同成立的社群真知拙见KnowledgeHot」知识星球,「华沙」老师,更多精彩内容可以加入星球查看。


点赞(0)
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1545685@qq.com举报,一经查实,本站将立刻删除。
猜您喜欢

网上挣钱最快的方法有哪些,通过数据挖掘赚钱需求

#案例分享#看到一个网站,是做 mac 软件下载的,不过他是付费网站,付费后你可以免费下载全站的mac软件。如下图这是个新站,不到3个月,据站长透露,网站已经开始盈利。其实网上这类免费的网站很多,但是这个站却有人付费,奇怪不?细看了下这个网站,做的比较美观,而且话术也很好,付费会员的权益:1、本站所有软件无限制下载2、...

0 736 09-07 17:55

新教师如何上好第一堂课,新老师第一节课快速征服学生的6个方法

01开学第一课新教师会遇到哪些常见问题?对于怎样上好开学第一课,老教师们可谓驾轻就熟。但新教师初次步上讲台,面对几十个陌生的学生,难免容易出现各种问题。那么,新教师通常会遇到哪些问题呢?1.紧张心理:有些新教师虽然课前做了精心的准备,但一走进教室面对学生时,还是会不免紧张,从而出现脑子空白、语速加快、语言重复、时间不当...

0 643 10-01 16:54

手机如何拍好人像摄影技巧,简单实用的人像摄影教程分享

虚化不要厚。站开更通透。花朵放在后。瑕疵不要露。侧身更显瘦。在春天怎么拍出好看的人像摄影照片?这是我为你总结的,5句人像摄影口诀,其中包含了5个人像摄影技巧,下面用相关的例子,为大家详细解说用法。帮你在春天拍出漂亮照片!一、虚化不要厚。拍人像照片的时候,可以拍出前景虚化,拍前景虚化的方法很简单,就是用树叶或者花瓣,或者...

0 834 10-05 17:45

戴尔一体机哪款性价比高,戴尔办公电脑新款评测分享

电脑对大多数人来说是工具,而非玩具,相信应该绝大多数打工人都不会想要耗费时间在调试和维修电脑上,只希望它最好即插即用、永远不要更新、永远不要出问题。想要做到这一点,肯定优先选择成熟的品牌经过完善设计和测试过的商用电脑。OptiPlex 7400 一体机而同时兼顾高性能、易用性、稳定性的电脑首先要考虑的就是AIO一体机,...

0 645 10-14 14:28

不回消息的女生是什么心态还要追吗?情感专家分享的5个技巧

提问精选:她消息都不回了,该怎么继续,还可以追到吗? 星友提问:娟姐,对于喜欢的女生只有过一次见面,和几次聊天。 后来因为她是银行的让我买理财,收益率太低拒绝了。 再后来我发给她消息都不回了。(真想把她微信删了) 该怎么继续,还可以追到吗?星主 Juan 的回答:持续买她的理财产品,可能追到(并非鼓励你这么做,只是叙述...

0 938 09-08 19:45

网站seo优化诊断方法有哪些,价值连城的网站优化诊断技巧

seo优化诊断是在对网站进行优化推广前,对网站整体情况的分析和总结,是网站优化推广的基础,它的终目的是服务于网站目标用户,实现网站的正常运营,为今后要网站在建站的过程中节约了大量的成本。一、着眼于整体  seo优化诊断主要是针对网站的整体优化,过度的关注细枝末节,却反而会影响整体的优化效果,不利于网站的推广和运营。首先...

0 674 10-07 17:25
关注我们
在线咨询
返回顶部