人工智能识别率的准确度高吗?80%人都不知道的背后真实情况

2022-09-08 14:28 · 小编
A+ A-

最近不少人工智能和计算机视觉的学者,带着自己的机器学习技术投身于心理学研究。出发点很好:用更新的技术探究问题。但是他们的成果让人担心。前有用人工智能分析潜在罪犯,后有用人工智能分辨性取向。这些论文都引发了轩然大波。不少人抨击之点就是伦理问题。其这些文章的科研问题也存在。相比于安防领域的面孔身份识别广受赞誉,那一类分析潜在罪犯潜在性格的机器学习研究其实都有值得推敲指出。

简单粗暴一句话:前「用 AI 识别 xxx 」一类研究,没想象中靠谱,不要轻信。

就让我们从斯坦福大学学者训练人工智能识别性取向说起吧这篇文章无论从伦理角度,还是科研本身的角度都有问题,可能唯一没有问题的就是作者的专长机器学习了吧。让我们先说伦理部分,再说统计部分,最后就是致命的研究基础的缺陷。

之前我已经在华沙:斯坦福大学「识别同性恋 AI」是怎么办到的?可能引起哪些伦理争议?下吐槽过,这一次详细谈一谈。

回顾下这篇研究(论文:Deep neural networks are more accurate than humans at detecting sexual orientation from facial images.链接:https://osf.io/zn79k/)两位作者收集到大量社交网络上的图片,以及图片所有者的性取向,训练出一个识别性取向的‘机器’。尽管动用了 DNN 神经网络等计算机技术,但是整套系统的基础却是基于认知心理学与生物学的。作者也承认,他们训练出来的分类器的原理是区分一下两个与性取向相关的特征点,我们可以总结为:1. 荷尔蒙(雄、雌性激素)影响下面孔特征(面孔比例,比如宽高比,下巴长度等),2. 不同性取向者喜欢的发型、胡型、以及妆容、甚至眼镜等配饰。

尽管在机器学习方面,这篇文章做得很好,但是其余领域暴露出不少遗憾。这我可以归结为认知心理学与计算机科学的差异,至少在认知心理学方面伦理是极其需要看重的,所以我们先从伦理出发。

首先让人担心的就是选择图片的伦理问题。文章说近三十万张图片来自于一个美国婚恋网站。很难让人相信这三十万张面孔,以及性取向信息都获得了主人的允许。这些头像虽然出现在婚恋网站上,被允许以约会目的来互相看,但并不等于被允许基于试验用途。认知心理学的实验,既需要学校伦理委员会的认可,也需要被实验者(或者图片提供者)的许可;不当使用他人图片难免有泄漏和其他的风险。科研伦理可能不是所有专业的必修课,但是至少在心理学科研领域是重中之重。图片选择过程让人觉得遗憾。

诚然人工智能对于生活与科研都有极大帮助。但是如此的结果不由得让人不安:我们的大量数据都在科技大鳄手中,通过分析,是不是他们能掌握我们所有的特点,然后精确的投放广告,或者用二级价格歧视榨取我们身上钱财。你看,这个能分辨性取向,明儿也能分辨爱不爱花钱,分辨你爱不爱买特定品牌,甚至分析你什么时候最捂不住钱包,什么时候耳根子最软,滥用起来就是能榨干消费者。

其实,技术本身应该是中性的,但是解读和利用是我们需要认真讨论的。没准在未来,到处都是针对每个人(从面孔,消费记录,个人经历分析而来)的量身打造消费陷阱了。所以说这项研究,在没有扎实的理论支持下(我们之后谈理论问题),很有可能被误解被误读。

不容小觑的误读,正是基于统计层面的。有时候单纯的统计数据并不能直接反应效用。作者声称,他们的分类器相比真人更准确分辨性取向:对男性正确率为 81% (真人只能达到 61% ),对于女性能达到 61% 正确率(真人准确率仅为 54% )。看似此项分类器效果显著。但是由于在实际生活中,异性恋的比例超过 95% 。;考虑到很有可能的基本比率谬误,所以把此项分类器用在真实生活中,正确率并不会有那么高。作者也承认,这么高准确性仅会出现在:明确知道有两张性取向不同者照片时。但是真实生活中哪有这么良好的判断环境。

其次此项研究还有一个要命的问题,既是实验的不足,也是许多人误读的来源。让我们用统计角度。如果简化整篇文章,作者做了三步:1. 寻找训练集中不同性取向者的面部特征;2. 训练机器识别这些特征;3. 在测试集面孔上此类特征,并预测性取向。不过,男异性恋者有 x 类胡型的概率,并不等于有 x 类胡型为男异性恋者的概率。所以说,不少人看到论文给出的图片,就用图上特征推断性取向会是极大地误读。

最大的遗憾来自于理论基础和实验。

文章作者也承认,训练集是来自于网上图片。特点是多样,生活化。但是缺点就是控制性。相比计算机视觉学者更喜欢这样自然、通用的数据。我们认知心理学、神经科学工作者更倾向于控制的数据。看似前者更有用,但是别忘了,大千世界中,互相影响的因素众多。倘若不加以控制就难以得出清晰的结论。

虽然有人说不能按照心理学严格标准去要求此类基于大数据的研究。但是我得说一句,不仔细要求就会错误百出!

此项研究中使用了大量自己上传的图片。所以图片的光源,面孔朝向均无控制。然后作者用我们国家自主研发的 Face++ (给国产点个赞!)对五官进行了标记。就这简单两步可能错误百出。因为图片是二维的,所以光源朝向都可能会 「扭曲」五官相对位置,从而干扰结果。 Kramer (2014)的论文中就提到,同一个摆出不同的表情以及转动脑袋都会影响二维图形上的面孔比例。所以此项研究没有控制面孔图片,会给分析带来不少的未知干扰因素,削弱结论的强度。

我们再举几个例子。英国的科学家 Burton 和 Jenkins 曾经长期研究过一个人面孔在不同环境下差异。

这是 Bruce 与同事们在 1999 年的论文中的一个例子,这一堆面孔披头盖脸的忽闪上来,真心不太好判断左边那张面孔属于右边十个人里面的谁。原因之一就是不同环境。光源,甚至拍摄角度都会影响面孔的形态。别忘记了:头像照是你的三维面孔向二维图像的投影。你面孔上的宽高信息会随着光线和面孔朝向变化。


3fa8782f3b788d9fda4913d34d668b2.jpg


不同的镜头有不同的光学特性,同样的面孔在不同焦距下也不一样。面孔的「两性异性」也会变化。难道镜头变化,所以你的性取向就变了么?


真知拙见KnowledgeHot知识星球案例图


再比如小李子。随着年纪增长,他的脸颊见宽,胡子见多,下巴见方。倘若按照本文的理论基础去分析,难道奥斯卡影帝的性取向随着年纪在那变化么?

作者也承认,他们分类器对于男性面孔结果更清晰。一个原因就是胡须在男性面孔上的鲜明:材质特殊,高对比度,占据面积大。因此不同性取向者不一样的蓄胡须方式,会在此项判断上占据主导地位。所以说,此项分类器,倘若训练时依靠发型、胡型、以及妆容、配饰,而面孔特征;那么照片本身会极大影响此分类器的效用。

让我们回到实验里。左边两个为异性恋,右边两个为同性恋。男性的两张明显可见胡须的差异。明显可以看到男性的面孔有眼镜。所以说,只针对白人的研究可能没有控制教育水平这个因素。

仔细看一看,是不是左边的男性更仰头,右边的男性更低头。仰头和低头本身就会在拍摄过程中改变图像上面孔比例,因此结果需要打一个问号。

再说荷尔蒙。虽然说有不少学者认为在胎儿期的荷尔蒙水平会影响性取向。的确有很多学者承认荷尔蒙水平会影响面孔的特征,所谓两性异性。比如雄激素更多的男性,胡须旺盛,下巴坚毅宽阔;和此研究的数据结果吻合。但是,此项研究应该说用机器:1. 发现了荷尔蒙对于面孔形状的改变,2. 然后借用一个理论‘荷尔蒙和性取向相关’,3.最后推论说能够发现性取向。仔细想想看,第2步是整个实验的逻辑核心;但也是解读时容易犯错之处。

另一个角度看,别忘记这个荷尔蒙水平还会影响食指和无名指长度比值。也就是说,这个实验的原理,在某种程度上可以说是与 ‘通过看手指长度判断性取向’ 类似。更要命的是,之前有不少论文抨击过「荷尔蒙与面孔比例」的关系。比如 Bird 和同事们( 2016 )发现,分析大样本数据后,面孔宽高比与荷尔蒙没啥关系。因此,假如面孔比例不能预测荷尔蒙分泌,难么此研究基于的荷尔蒙-性取向假说不可能在面孔上被反映出来。总之,这篇文章的基础值得怀疑。(虽然以荷尔蒙-面孔比例的文章不少,而且有些也有让人满意的结果,但是不代表他的理论基础完全夯实)。

倘若这些研究是利用在分析面孔探究皮肤病我会双手赞成。但是如果分析人的特征,性格,我觉得计算机视觉的学者还是要找一个心理学工作者一起研究。机器学习用途广大,但是不加以分辨的使用会带来误解和谬误。只有理论基础扎实的研究,只有伦理方面无忧的研究,才能给我们的生活给以帮助!

 


本文来自由几十位各行业专业人士、知乎优秀答主共同成立的社群真知拙见KnowledgeHot」知识星球,「华沙」老师,更多精彩内容可以加入星球查看。


点赞(0)
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1545685@qq.com举报,一经查实,本站将立刻删除。
猜您喜欢

李宇春怎么了,歌手李宇春自曝患强直性脊柱炎

近日,李宇春在接受媒体采访时透露了一个重要的消息,是自己在去年患上严重的强直性脊柱炎,一时间引来无数网友的热议和关心。此次采访的画面是李宇春参加人文访谈类节目《我的青铜时代》,也是她自己在节目中诉说的,表示自己患上了一个很痛苦的疾病,那就是强直性脊柱炎,当时的诊断结果令她十分震惊,而且她还透露出这个病也是时常复发,有一...

0 987 10-12 23:04

免费的知识分享平台有哪些,国内5大免费高质量的自学网站推荐

今天就和大家分享5个我私下一直在用的学习网站,有些平台知道的人还不多,希望大家高调收藏,低调使用。1 易撰网自媒体必备网站,不管你做的是哪个方面的自媒体。都可以利用这款强大的文章写作工具,其中包括爆文分析、文章质量检测、标题生成、自媒体库等等资源,让你创作更加高效。2 哔哩哔哩B站上有非常多的up主,提供免费的视频教程...

0 530 09-30 16:07

装饰公司营销短信怎么写,装饰公司群发短信模板总结2022

装饰公司营销短信模板,装饰行业推广短信群发文案【xx装饰】尊敬的业主您好!65栋340户型平面设计,效果图,实景工地现场,随时欢迎您参观了解!xx(电联免费获取设计方案)退订回T【xx装饰】xx节日大惠利活动正在火热进行中!消费1万送5千活动等您来!地址xx,电话xx,欢迎您光临!退订回T【xx装饰】尊敬的用户,您好!...

0 575 10-13 14:27

图片外链是什么怎么弄,一文了解图片外链的原理及工具分享

一、图片外链是什么?图片外部链接是一种外部链接形式,可以通过图片超链接单击图片访问目标网站二、图片外链制作①创建一个文本文档②代码插入③另外保存,文件名称以.html结尾④双击图片点击,就能跳转三、注意事项①命令中的地址前面必须要带有http://②图片的边框、图片宽度以及图片高度。border表示图片边框,width...

0 890 10-08 11:43

离婚财产如何分割,10分钟给你讲清此类问题的解决方案

别处看到一道题:「刘强东每年只拿一元年薪,如果章泽天通过诉讼离婚的话,可分配的婚后财产会只有几块钱吗」。闲话他人家事未免长舌,然而「股票期权离婚分割」却是一个法律上的好问题。故而不妨撇除八卦闲话的部分,单以「股票期权离婚分割」的司法实践为题,从法律层面分析一二,抛砖引玉。2015 年,刘强东与章泽天被曝婚姻登记,当年度...

0 932 09-08 17:45

迪拜住宿大概多少钱一晚,奢侈不再的的迪拜酒店一晚只要400元

华舆讯 据迪拜中华网报道 迪拜的酒店住宿开始变得彻头彻尾的实惠,经济型酒店的过夜住宿费用降到了200迪拉姆(约363元人民币)以下,再加上一些额外的费用。这意味着,酒店运营商希望在千禧一代旅行者大量回归时,能够抓住更多具有经济意识的游客。经济型酒店,不要与 "基本酒店 "混淆,特别是在迪拜,提供艺术...

0 710 10-14 14:33
关注我们
在线咨询
返回顶部