日本电子维修技术 目前人脸识别技术的挑战是什么?



请问目前业内人脸识别技术的挑战和难点是什么。为什么没有成熟可靠的商业应用。但是论文中已经接近99.7%了。实践和论文的差距是什么。是不是人脸识别的研究没得搞了。

评论
也是放假太闲,上知乎来锻炼一下手指。

在回答题主的问题的时候,我觉得应该注意做『科研』和做『产品』之间的区别。论文中汇报的人脸识别技术是属于科研的行列。比如在LFW上99.7%,这种数字的意义更多是让搞研究的那个圈子里面的人更加直观的了解到一些情况,你也知道,通常来说这个准确率是非常高的了,所以我们可以说『人脸识别技术在LFW上已经很成熟了』,但是一模一样的技术,拿到真实环境下得到的准确率可能只有75%……也许会有些人觉得这是很可笑的,不,请不要笑,这是科研圈里朋友的普遍做法,不是没有苦衷的。

捣腾过LFW的朋友其实心里都清楚,这并不是一个很好的数据库。图片都是从网上下载的,人脸的质量也是千差万别,有人说这样才接近真实情况……但实际上距离大部分的实际应用场景还是太远了。

目前评价科研中算法的优劣的唯一方法就是找一个数据集,然后大家一起对比,数据集的不同算法得到的结果也会不同,然而……论文上通常是有报喜不报忧的恶习的,所以常常会有不公平的对比存在,随着越来越多更大的人脸数据集的慢慢增加,对于算法的评价会可能会变得稍微公平一些……即便是这样,论文里所谓的人脸识别技术,跟可用的『产品』之间的差距仍然很大。

这并不是说论文的算法不好,而是『产品』的天性。大部分产品都是针对性的解决一类或几类问题,产品讲究是速度,稳定性,成本,等等,不同的产品通常可以加入不同的先验甚至额外的硬件来提升产品的可用性。这是做『产品』和做『科研』的区别。

举两个容易理解的例子:

某著名手机厂商想开发一个自己的人脸解锁功能,在第一次使用手机的时候,经过一个人脸注册的过程,记录下手机主人的样子,在之后的使用中如果被触发,就进行人脸验证,解锁。这里你如果上来一个几十层网络的卷积网络,这个是不行的……因为速度很重要,内存也重要,如果你一个网络模型一上来就已经几十兆几百兆了,产品经理会疯的。做产品的往往是想在保证用户体验的情况下,使用最少的资源。所以最后的产品可能是……下面是我瞎掰的……检测到人脸,检测五官的基本landmark,然后通过几何关系约束来缩小识别范围,再用简单的特征比如LBP,在一个一千张主人人脸的数据库进行验证,验证里可能有各种trick,并且这个一千张人脸的数据库也是实时更新的,比如当前识别正确了,那么就加入进去,如果识别错了,就把这个数据提取特征作为反例存起来……一个可用的产品总是包含了很多看似没有道理的trick的,但是就是这些构成了产品的核心技术。

另外一个例子,做人脸识别,但是是做煤矿工的……请自行脑补一脸煤的辛苦矿工。在这个场景下面,你连人脸检测都没法弄啊……加上光照和脸上煤的干扰,论文上的算法基本上是没办法用的。如果是你,你怎么去做识别?

做一个产品的时候,思路是需要很开阔的。比如人脸的检测实际上是可以通过双目视觉来做的,两个廉价摄像头,简单的算法通过三角化得到一个稀疏的深度图,利用深度信息来做人脸的检测,然后基于眼睛和嘴唇来做识别,眼睛和嘴的识别可以用卷积网络来做,但是真是的产品里面可能还会考虑身高信息,当然,在洞里还需要考虑补光的问题……

说完了这两个例子之后,再回到题主的问题上来吧:

『请问目前业内人脸识别技术的挑战和难点是什么。为什么没有成熟可靠的商业应用。但是论文中已经接近99.7%了。实践和论文的差距是什么。是不是人脸识别的研究没得搞了。』

如果题主这里说的『业内』指的是科研行业,挑战和难点其实都不好说……有些问题是可解决的,有些问题是不可解决的,比如化妆和双胞胎的问题,其实长得像也是很普遍的例子。人脸识别这个行业存在一个由大佬们吹出来的硬伤,就是它在真实环境下总是无法达到100%的可靠,但是总被吹成是极其可靠……以至于领域外的人瞪大眼睛激动地要往里砸钱要项目上线……所以人脸识别在产业界总会给土老板们带去失望。

稍微有点偏,别回来。

我假设这里的业内并不是『科研界』,而是工业界,产业界,『产品』界,那么有很多地方其实都有成熟应用了,比如海关的过关人脸识别系统,当然人家会加上身份证或者指纹来双重验证,比如人脸识别的门禁系统,这个作为产品已经有了,虽然发生了『司机卖掉赵薇豪宅那个事』,但我还是相信在这个应用场景下,这个产品是可以达到可用的程度的。人脸识别技术最大的一个客户可能就是政府了,这个是让我有些伤感的事情,同时我也觉得这个东西在公安系统里面也是『采购了,但是极少用到,领导来了,我们就演示一下Demo,真办案了,还是要靠人来筛选一下以防疏漏』。

另外最近那些银行推出一些自动服务机器,里面有人脸识别功能,道理其实跟过海关一样,你需要的是身份证,人脸,密码甚至指纹……即便是把人脸识别关掉了……也是可以正常运作的……我常常好奇,为什么有些公司,不遗余力地去集中做一个产品落地很难的人脸识别技术……并且其做法仍然是按照学术那样,收集大量的数据集,然后交给科研人员,然后搞几个算法,提高准确率,然后把代码交给码农去优化,码农优化完,产品经理觉得仍然没法上线,但是上线压力太大,于是给科研和码农施压,科研人员也烦躁,只能过来给码农施压,码农无处诉苦,开始自我怀疑,失去自信,变得烦躁,更年期早到……

这可能是做科研出身的人,突然跑去做产品的通病。

论文和实践的差别在于数据和方法。针对数据选择方法,是用很多种方法融合,针对不同的情况调试不同的参数,使用不同的trick,甚至使用外围的硬件辅助,最终的目的是提升产品的综合体验。人脸识别,实际的产品里面,最深奥的算法复杂程度也不会超过那些开源出来的已有算法,理解那些通用的算法,再去一线做产品应该足够了。但是注意,这些算法也许根本不会构成你产品的核心技术,真正的核心技术是你做产品的时候处理各种情况,各种数据的经验公式和方法。

在科研里,人脸识别技术还是有很多可以去研究的东西的,比如怎么用更小的数据更小的模型得到更好的准确率。比如怎么克服光照的影响,比如怎么通过局部特征来完成准确识别……。

但是如果是去做产品的话,我认为不需要迟疑,不要仰望科研成果。贴近一线的数据和场景,花时间分析数据钻研工程方法,也许就做出来了。

借用一句话:『未来属于那些愿意弄脏自己双手的人』。

评论
最高分已经答的非常的好了。说一点浅见,反正这种小众问题就算说的不对也不会有那么多人喷。
首先说说商业应用。
所谓成熟靠谱如果说的是百分之百代替人工那么目前是没有的,毕竟就算是人工,面对双胞胎也会出错,面对白百何VS王珞丹  or 周迅VS李小璐这样的组合也难免会脸盲。
但是商业应用上确实已经有很多公司在做了。BAT里面阿里收购了face++;腾讯有优图;百度更是有自己的研究院,百度国内应该是LFW上刷分最高的公司了,毕竟吴恩达在百度,成绩单还是要漂亮的说,(剩下三个业界大牛一个在FaceBook,一个在谷歌,另一个还在学术界)。其他公司像360请了新加坡国立大学的颜水成(1000w年薪),还有汉王科技,川大智胜,都是有人脸识别的项目在做的。专业做人脸识别或者图像识别的还有linkface、格林深瞳等等。
所以说商业应用确实是有的。

LFW号称是最难的人脸图像库,很多公司都有专门的人在上面刷分,包括一些大学的研究生也有刷过这个的。确实现在分数已经刷到很高了,但是实际应用上却完全不是那么回事。 @李济深前辈提到了现实落地当中存在产品内存大小和速度以及稳定性的问题,万分赞同。补一点其他的方面的个人理解:

LFW上刷的是人脸与人脸对比,也就是俗称的1:1、1:N或者N:N,应用到实际当中所有的公司都在做的是不得不降低那个N的样本。或者是加入其他的校验方法来实现人脸识别并且保障它的安全性。
通俗一点说好了,现在很多商家都跟支付宝或者微信合作,吃饭买东西都可以扫二维码支付,想象一下,假如现在咱们可以刷脸支付的话是什么样的场景呢,查了下新闻,支付宝目前的活跃用户是2.7亿,张三对着摄像头刷了脸准备结账走人(即验证的是1:N),结果服务器跑了半个小时还没找到他的脸——毕竟要在2.7亿张脸里面搜索呢,用户体验不忍直视有没有,但是如果同时输入张三的姓名,是不是这个N立马减少了很多,如果输入张三的身份证号码呢,立马就从1:N切换成了1:1,效率大大提高。
那么问题来了,如果有人刻意攻击张三的账户呢,毕竟身份证号码很容易被熟悉的人知道的,连赵薇的豪宅都被司机卖了有没有,人脸识别要检验的部分主要有两个,第一张三是张三,第二张三是活的,举个栗子,张三的好基友李四,对着摄像头 扫一下张三的照片,并且报出他的身份证号码,是不是就成功支付了,如果这个时候人脸识别要求他对着摄像头做几个微表情,是不是一定程度上提高了安全性。当然这也只是在一定程度提高了安全性而已,毕竟还有视频攻击等等。

大部分的技术到实际落地的时候都是需要场景的,随着技术的不断发展可能会解决越来越多的问题,比如将来我们计算机的运算速度大大的提高了,那么1:N的速度就会变得非常的快等等。但是在现阶段人脸识别确实有很大的局限性,但也不是没搞头。不能刷卡支付咱们可以用它来做证券远程开户嘛。

all in all,tomorrow will be better

评论
人脸识别不是没得搞,而是有很长的路要走。我本人就做这方面技术。所谓99.7%的准确度,是指在某个有限集合里的测试结果,比如2万张公开图片中,90%用于训练,10%用于识别,这个其实离实际应用还有很大差距,我就举个简单应用场景,某大厦需要对来往的人员做白名单布控,也就是说,大厦内部人员进入不报警,外来人员报警。在大厦门口安装高清摄像机,通过人脸进行识别,但不能要求人员刻意配合刷脸,这样太影响效率,也就是说,必须是非配合型人脸识别。要求准确度超过80%,室外,而且是实时比对,人脸库为1万左右。但摄像机补光和安装角度等都可以由厂家自己定。我相信,现在还没有一家公司能做到,而且我认为,业内号称最牛的几家公司,在此场景下的准确率应该在50%到70%之间。甚至更低。不信拿出来测测。就不要说识别了,即便是人脸检测,能达到80%已经是niubility的公司了。有人会问,你为啥要求非配合啊,刷脸不行么?我是客户的话,我想反问:我为何要人脸识别?我刷卡不行么,如果担心盗刷,那刷指纹也不是不可以啊。人脸识别,其独特的优势,就是理论上可以做到非配合,其他的生物识别,基本上很难,或者基本不可行,比如指纹,虹膜,静脉,以及DNA等。其实人脸识别大部分应用属于非配合场景,原因可以自己琢磨。另外,关于深度学习的人脸识别,包括在LFW刷存在感的众多中国公司,准确地说,他们的技术只适合做图片1比1人脸验证,且不说别的,对实时应用来说,性能就是个很大问题。即便是1比1验证,去年由某部召集的国内100多家人脸识别公司公开测评中,准确度没有一家能达到70%,几乎所有国内公司都去了,为啥?用于训练模型的数据集跟现场实际环境差距很大,不低才怪呢。所以说,要达到商用化,尤其是安全相关,这条路还很长,很长。当然,做娱乐应用还是可以的。说起做娱乐,某公司的明星脸也被归类于人脸识别,明星海量的照片都在库里,然后你把其中一张照片丢进去做比对,那当然可以识别了,别说用深度学习,即便用SIFT特征找相似图也是可以的。

评论
人脸识别经过近几年的发展,取得了长足的进步,也支撑起了大大小小不少人脸识别应用的公司。在很多行业中,比如刷脸访客,人脸闸机,人脸登录,酒店入住等诸多应用场景,都有人脸识别的成功应用。
从应用场景看,人脸识别分为两个方向:
① 1:1的人脸验证
应用场景:比如火车站验票进站,需要手持身份证照片和本人人脸符合同一个人的相貌特征即可。
② 1:N的人脸搜索
应用场景:在一些刷脸签到的课堂上,安装了人脸识别闸机的居民小区出入口处,只要识别到的人脸,出现在原先已经注册了的人脸库中即可。
第一种1:1的人脸验证目前来看问题不是太大,多多少少都有一些辅助手段能够帮助人脸识别落地到项目中。比如,在一些零售店中的刷脸支付应用场景,需要用户预先输入全手机号,确定用户身份再进行人脸识别,将原本为1:N的问题转化为了1:1的问题。
第二种1:N的人脸搜索,主要难点集中在三个问题上:
① 1:N中的N能够支持多大
从一个班级百号人刷脸签到,到一个公司千号人的刷脸打卡,再到一个学校的几万人,一个四线城市几十万人,一个一线城市的几千万人,难度是呈指数上升的。
目前各家公司的成熟人脸识别应用能够支持几万到几百万人不等的应用场景,而且还有一个错误率的概念。比如,公司宣称千万分之一的错误率的情况下(1/10000000),人脸通过率其实只有93%,这时因为很难做到一定不发生错误,而且每个人都能识别通过。
假如一家公司说自己能做到亿分之一的错误率,通过率能做到98%以上,多半是虚假宣传,在实际使用中是很难达到。
以往很多学术论文中的结果是在LFW数据集上进行测试的,但其实,LFW数据集只包含5749个人。在LFW上达到99%,可能在MegaFace数据集上连80%都达不到,因为MegaFace包含了690572个人,身份信息是前者的100倍以上。
可以看到,近来很多人脸识别的测试结果都以MegaFace作为测试标注,应该说这个数据集更加符合实际应用场景一些。
② 非配合应用场景
这是相对于配合应用场景而言的。比如ATM机刷脸取款,用户会自主配合,将人脸以一个理想的角度通过识别。
而在非配合应用场景下,比如监控视频下的人脸识别,追踪违法犯罪分子的身份信息,情况就要困难得多。这种情况下,用户脸部会发生角度偏大,遮挡,光线不可控等问题。
如果有一天这个问题解决了,那离彻底解决城市犯罪问题就更进了一大步;
③ 跨人种,跨年龄识别问题
研究发现,在一个数据集上训练好的模型,想到迁移到另外一个人种上,效果会出现较大程度的下降。另外,人脸随着年龄的变化带来的改变也给人脸识别带来不小的挑战。
要改善这样的问题,一个必要条件是需要建立一个足够完备的跨人种,跨年龄的人脸数据库。
不过建立这样的一个数据库是存在不小困难的,尤其在国内的话,是以汉族人为主,同时跨年龄的人脸数据库也比较难收集,需要不短的时间跨度。
具体在金融行业,人脸识别技术同样面临很多挑战。
目前来看,在金融行业要衡量人脸识别技术是否足够成熟的一个重要标准是人脸防伪是否足够安全,不能让一张打印的照片欺骗过去。
比如近来备受关注的刷脸支付,很多时候都会要求用户输入全手机号,或手机号后四位,以缩小用户搜索库大小,实际上这是比较影响体验的。如何在用户搜索库巨大的时候还能够保证人脸识别的正确率,同时还需要考虑到用户是否是一个真实存在的自然人,不能够是照片或者视频,需要有安全度极高的人脸活体检测和人脸防伪技术。


本文作者:京东金融-智能识别实验室 程郑鑫

评论
相关:博士论文相当部分是人脸识别,12年水平。



正向人脸,现在基本95%以上了,很多算法可以容忍光照变化、眼睛胡须、甚至年龄变化。
正面人脸识别能力是超过(受过训练)的人的水平的,其实现在人脸识别在门禁领域应用非常成熟广泛。

------------主要的难点------------
无法(用正向人脸训练集)去识别侧向人脸,包括左右侧脸,超过一定上下角度的视角看的人脸,都无法识别。

换言之,在固定场景下的人脸识别(门禁、证件等:正面,光照一致),
技术非常成熟应用非常广泛,
硬件简单,计算迅速,识别度超过人类(接近100%)。

但是实地场景的识别,比如街道摄像头对感兴趣区域路人的识别,识别率非常低。

顺便:我博士做的内容是正面人脸,但是在平面内旋转了,仍然能识别出来,识别率不会下降太多。(然而并没有什么实际的卵用)

----------几个可能的方向-------------
1、3D建模,用部分人脸照片数据,拟合一个3D人脸模型,从而识别各个角度的人脸。
2、生物特征综合识别,比如人脸和步态综合进行识别。姿态识别是场景识别的一个比较有前途的方向
3、神秘学:比如流型、DNN、或者某种诡异的数学方法,说不定直接解决了正面人脸去识别各个侧向人脸(不是完全没有可能,最基本的PCA刚开始感觉也很神秘,但是效果很好,开创了子空间方法。)


免责声明:我12年之后就不做这方面了,且本人本身学术很水。 上述内容不代表模式识别及机器学习领域任何尖端内容。

评论
最近和业内两家比较知名的做人脸识别的公司聊了聊(不是face++和商汤),总结和归纳一下大家的观点吧,仅供参考:

算法层面:
(1)深度学习的算法近几年看不到革命性的突破,算法或技术领先的先发优势将越来越弱,基本上copy的速度可能会达到十天半个月。
(2)论文中接近99.....%是在5000个样本库里的数据,在实际操作中,1:1基本可以得到较好的结果,1:n计算量稍大,n:n基本是天眼级别,至今无解。
(3)毕竟足够的样本是训练的基础,所以可能最终比拼的还是数据量。

应用层面:
(1)金融的身份验证:银行、券商、银联这样的企业基本要求私有部署,按项目制收费;互联网金融公司用户上限基本在2亿,按调用次数收费,目前基本在1-5毛/次不等,然而这个行业调用次数基本有个上限,所以天花板。。。你懂得。
(2)安防领域:这个就不单纯是算法的事儿了,硬件层面有高清摄像头,芯片传感器,系统层面有服务器、视频传输,软件层面才是这些做人脸识别的厂商。现在海康威视、佳都科技还是比较强势的。一个单纯的软件厂商基本还得抱着大腿玩。

总的来说,这个领域远没有想象的性感。

评论
虽然人脸识别技术已经很成熟,具有很好的前景,我认为还有一个问题就是存在被伪造合法用户人脸的攻击的风险。做了一些调研和分析,传送门~知乎专栏 ——人脸识别中的活体检测

评论
我倒是觉得不是计算机技术方面的问题,而是目前为止人类还不能明白大脑的工作方式。

评论
看了楼上技术的分析,我从社科伦理的角度来插个嘴么:
挑战一:隐私的认知与突破

2017年9月9日出版的《经济学人》指出,人脸和其他生物数据(比如说指纹)的一个巨大区别是,人脸是可以进行远距离采集的,任何一个人在远处拍一张照,把照片放在人脸识别的软件里,理论上就欧了。
此外,很少有人会意识到,自己的脸是隐私,因为人脸是公开的。往往,我们会把隐私和私密划等号,现在看来,这样的等号得拆了
当然,草根民营企业是很难有能力把人的面部图像和个人身份联系在一起的,但是政府可以啊。还记得你16岁时在公安系统留下的丑照么……
当人脸只是一张美照或丑照时,问题还不大,但现在人脸可以用作支付或开锁工具时,你是不是应该开始慌了。
挑战二:应用场景中的公平问题

人脸不仅仅是一个name-tag,它呈现出很多机器可以识别的信息。这当然有很多好处,比如一些原本难以通过医者识别的疾病,可以更早地通过算法分析人脸、由机器诊断得出结论;再比如机器可以捕捉自闭症的一些表情,这样我们就知道他们在想什么了。
硬币的另一面是,技术也会加剧偏见和不平等。斯坦福大学近期发布的一份报告发现,机器能比人更准确地识别一个人是否为同性恋:机器识别的准确率是81%,人工识别的准确率仅为61%。在一些同性恋还被认为是犯罪的国家,这一技术的存在……还是有点吓人的。
更本质的一个不平等是——从机器学习的本质考虑,所有的脸部识别系统不可避免地玩的是一个概率游戏,但是,在白人偏多而少数族裔偏少的数据情况下(特指美国情况),训练出的结果一定是白人情境下算法表现更优的。这一类bias,在一些尝试将机器评估结果引入法院判决中的情况里,已经出现了。
挑战三:直逼人际关系的基础

都说,人是其社会关系的总和。能准确读出面部表情,会很深很远滴影响人与人之间的关系建立基础。
Dissembling helps grease the wheels of daily life. 试想,如果你的妻子/丈夫能识破你每次对话中的不耐烦;你的老板可以识别你工作场合中的每次炸毛,那婚姻和工作的关系确实会更真实,但也会更不和谐。
那所有社会关系的基础就会变,会从信任变为精准的“算计”。这样的关系可能是更理性的,但也会是更带有“功利性”(transactional)的吧。
----------
答案选自:独家编译 |《经济学人》警示:人脸识别会给我们带来哪些伤害?

评论
挑战啊(^Д^) 当然是南朝鲜网红脸咯!
不信识别一下我头像。
老司机飙车润物细无声。

评论
作为做人脸验证和分类的小渣硕总结一下说的几个常见挑战吧,不一定正确:(对了,听导师说今年某司有用自己的算法帮助公安部在火车站成功抓捕到犯罪分子,虽然不知道具体什么形式采集到的犯罪分子待识别人脸图片,但是可喜可贺啊~)
1.目前做的lfw刷烂了,但是lfw其实主要是pose,背景变化最大。而且往往大部分论文的实验是基于严格提取关键点、矫正后的训练样本和测试样本。但是实际应用中,光照,抖动,模糊,遮挡,分辨率都是影响人脸识别的重要因素。特别是在做已注册样本为身份证照,待识别样本为手机或者摄像头采集的视频帧时候,图像在质量(FQI指标)上存在严重不同的情况,这时候识别难度是很大的
2.工业界应用中,用CNN train出来的model,往往是比较大的,公司怎么用一个单机版app做相似性度量?又或者加速卷积和pooling的前向这块可能比较耗时。当需要已注册大样本提取的特征进行一一匹配的时候。
3.之前有问过导师,某些公司不是都和银行合作推出了人脸取款流程吗,这难道不是说算法效果特别好?实际上,银行操作人脸也是走了一个实验室条件的流程。当你进行人脸验证的时候,实际上人是正脸对着摄像头采集与已注册身份证照一样的高质量的人脸图像。而且结合身份证原件,安全性才得以保证。
4.人脸图像输入是活体吗?如果拍了A的照片去开锁A的手机,怎么样更好的更有产品经理气息去做这种问题的检测。
5.随着人的年龄、五官本身变化,本人与已注册身份证照片相似性在变化!!!

评论
在不久的将来,你的丰田汽车可以通过面部识别功能来解锁——刷脸在开车这事儿上也将成为可能。

此外,还有已开始在汽车领域应用的体感技术,比如车载摄像头看到你搬着沉重的行李箱后,就会自动打开后备箱——当然,由于汽车未能进化成“大黄蜂”,你应该还是需要自己把东西放进去。

就像手机、可穿戴设备一样,汽车也可能成为你的健康管理“工具”。丰田和微软表示,未来的汽车,方向盘和座椅上都会集成不少传感器,它们可以收集关于你的一些身体数据(比如手心出汗程度、体重等),进而判断你的健康甚至是心情。你现在焦躁不安?那就给你自动放首舒缓的音乐吧!最近体重超标?那么导航就推荐一家低卡路里的餐厅吧!

评论
本人从事人脸识别相关工作(因为工作原因先匿名),这一波人工智能的投资风潮起来,很多人脸识别公司恨不得马上往自己脸上贴几吨金,连凯芙丽这样的大拿都出来喊话实在不应该(看看百度自动驾驶的系统和google图像识别系统的开放可以预知未来免费是大趋势,想想人脸识别算法跟曾经投入数百亿美元的自动驾驶算法相比有多大差距)。
人脸识别算法不神秘,也不高大上,几年后一定会有大量免费算法,因为行业变现太难了,目前国内所知的人脸识别公司无一例外都是在烧钱。始终认为这是一个存在极大泡沫的概念。
人脸识别作为一项模块技术很少有独立应用(独立的业务层设计),大部分只是为已有的业务软件体系上做增强,比如客户人脸校验(在过去密码基础上增加一层),人脸检索(比人工高效,摄像头结果过滤),相似人脸推荐(比如婚介软件,整容设计),但是这个过程中已经死掉大量公司。
1. 算法再好,也只是调味料,最终出路还是做到最终产品中,通过业务层叠加开发,解决真正问题的产品和方案(最早发明FTP,压缩算法协议的谁赚钱了?)。
2.人脸算法的使用成本很低,目前市场上终端算法部署比较低端的产品授权就500元/套(1:1的远程接口调用所使用的前端授权),市场竞争的结果就是低价倾销。

--------以下为答案--------
首先,题主的问题比较宽泛(到底是盈利强,还是算法强,还是应用强?),人脸识别技术的衡量维度太多,但从技术比较,比如图像比对级的1:1,1:N,N:N;衡量的标准和维度都不同。比如算法精确度上,国内国外的人脸识别技术大多数在开源OPENCV等开源库上进行新规则添加(深度学习进行叠层运算),公司之间的识别正确率差异仅仅在小数点上,99.6%-99.7%提升意义不大,如果说在LFW上称王称霸就是世界一流,就要被内行笑话了。
衡量人脸识别的算法能力:拒识率、误识率、通过率,准确率。
先看看人脸识别的基本流程:

1214c896bd95ad78d0e6afe83f66b5a7_hd.jpg (43.59 KB, 下载次数: 0)

下载附件  保存到相册

2018-3-21 10:15 上传



3c8c3cc3fb99e0a310df56a8522673e3_hd.jpg (45.5 KB, 下载次数: 0)

下载附件  保存到相册

2018-3-21 10:15 上传

人脸识别最难的部分是有充分适应各大光线环境的人脸预处理算法,需要在各种复杂的光线环境中提取到人脸信息,特别是移动互联网时代,摄像头拍照的地方可以在斑驳的树影下,也可以在昏暗的街灯下,以及深夜出租车内,这对算法的鲁棒性考验极大。同时还要考虑照片和视频欺诈,二次成像的光线污染等问题。

c2fe5012ff264013678839c43c39e5a2_hd.jpg (24.3 KB, 下载次数: 0)

下载附件  保存到相册

2018-3-21 10:15 上传

下面说一下目前人脸识别的常见问题(不要再问人脸识别准确度了,这个是外行话)。
1:1人脸识别算法主要用于身份验证
1:1人脸识别技术主要是利用图像处理技术从图像中提取人像特征点,利用生物统计学的原理进行分析建立数学模型,即人脸特征点模型。再从人脸特征点模型与被测者的人的面像进行特征分析(可以假定为无数的几何特征点求解),根据分析的结果来给出一个相似值,通过这个值即可确定是否为同一人。简单的说就是A/B两张照片比对,产生的计算数值是否达到要求。

这个值我们称之为阈值,可以从1到100(100就是极端严苛)很多人脸识别公司说他们的产品很容易通过,那只说了一半,如果阈值调整到5以下,几乎大部分人都可以是相似的,而调整到95以上,同一个人在不同的背景环境拍出的照片都无法匹配。所以当一公司跟你吹牛算法准确度,先问下使用的是用什么阈值,同一人脸比对通过率,非同一人比对通过率。
1:1主要用于快速的人脸识别比对,作为身份确认的一种新方式,比如考生身份确认、公司考勤确认、各种证件照和本人确认,由于这些照片源不一定有权威统一的接口调用,所以一直没有用起来。目前市面上做的比对来源主要有三种方式:
1. 用户自传照片,比如支付宝的人脸比对,用户自传的照片最大的问题是照片质量的合格率太低,拍照的光线、角度等因素会导致采集源的质量下降,不利于后期的大批量人脸特征码管理。
2. 使用身份证读卡器,读取身份证上的照片,遗憾的是这张照片的质量极差,2K的大小,很多照片上的人脸质量实际非常差,不过也是目前用最多的方式。
3. 使用公安部旗下NCIIC的人脸比对接口(注意,不是网纹照片接口,这个接口已经不对外),使用的是直接的人脸比对接口。目前具备有这个库调用权限的,目前所知的只有几家,在人脸识别公司中,好像只看到一家在提供,这里先不提了。BAT应该都还没有接入,如有大家有新发现的可以补充。
实际上,解决比对源的问题的关键是需要有权威的照片数据来进行比对,许多公司刚刚开始的时候采取NCIIC(NCIIC是公安部的一个事业单位,公安内网是不对外开放的)身份证返照接口的照片,进行消网纹处理进行比对,但人脸的很多特征点被损毁成功率大概只有6成(根据六月份发布的网络安全法,目前网纹返照接口市面上除了银行系统可以使用外,其他所用的身份证返照接口都是非法的,一用就被查)。
1:1 人脸识别算法主要使用场景

无证件的情况下,如何确认本人是XX?
曾经有一些问题是关于如何确认本人的笑话,派出所要求一个小伙证明就是本人,证明你妈是你妈。。这种奇葩问题,但是许多陌生场合也有这种尴尬,你如果没有带证件,警察无法看到你的照片,如何确认你就是XX就是之前经常出现的执法矛盾;如果一个人把身份证弄丢了,外面风雪交加,如何给这类人办理酒店入住手续?这些就是身份确认的问题。公安部推身份证网上副本 身份认证可“刷脸”完成就是用来解决这个问题,我们出门不用完全依赖身份证可以确定身份,可以方便很多。
但是1:1人脸算法的巨大隐患是我们随处可见的人脸,实际就是一个公开的钥匙,马云提出刷脸消费吃饭,如果没有手机验证码(本身也是一重手机实名验证),分分钟钟被吃垮。但是既然可以用手机,为什么还用刷脸,不是多此一举吗?
另外还有一些高级会所,希望实现VIP的贵宾警报服务,这个在下面的1:N和N:人脸识别算法系统中可以看到。但是1:1比对的身份应用哪家强了?

比如远程的互联网客户,如何确认身份?
在互联网买机票、车票,医院挂号,政府惠民工程项目,以及各种证券开户、电信开户、互联网金融开户都会用到。过去的身份认证方式是非常不妥的(比如支付宝的持有注册流程,还有一些不知名的社交APP等需要上传身份证照片),这些资料是极其容易被盗取和转卖的,下图是来自百度的图片搜索结果截图,还有最近的一些女大学生的裸条资料泄露知乎专栏,导致犯罪分子有很多利用的漏洞,黑客军团号称资料2000万,分分钟钟薅干一家金融平台没有问题:

df8704d7f04e891eeeba5c126657df9f_hd.jpg (31.82 KB, 下载次数: 0)

下载附件  保存到相册

2018-3-21 10:15 上传

许多金融公司喜欢把人脸识别SDK模块嵌入到APP当中,但这个太容易绕过,所以会再加上活体检测(市场上常见的活体检测为随机动作配合),但是即便加了活体检测,也一样可以绕过。比如下面这两种方式:
1. 3D人脸仿真面具

v2-3f8bbeafc79c8e8e8e1da427b91087a7_hd.jpg (17.14 KB, 下载次数: 0)

下载附件  保存到相册

2018-3-21 10:15 上传

2. 人脸模型实时重建

v2-1352bacad3ac4f46d4af98b1c781e9e9_hd.jpg (33.28 KB, 下载次数: 0)

下载附件  保存到相册

2018-3-21 10:15 上传

所谓道高一尺魔高一丈,这个还是增加其他的多维校验才能确认身份,否则真有人要进行远程攻击,也不是很难的事情。那么活体检测哪家强了?
1:N人脸识别算法主要用于人脸检索
跟1:1的A/B两张照片比对最大的区别是A/B A/C A/D……多个1:1计算,这个最大的问题是一旦BCD总和数量越大计算速度越慢,而总和超过20万,就回出现多个相似结果(20万人这个大数会导致有不少人长相相似),需要人工辅助定位。过去我们在电影里面看到什么“天网”识别系统只是一种理想状态,实际应用中都是排列出多个结果,排第一的未必是需要的人。

4aa7c667efd2a6d94a46d25a4406e3b3_hd.jpg (44.68 KB, 下载次数: 0)

下载附件  保存到相册

2018-3-21 10:15 上传

1:N人脸识别算法主要用于排查犯罪嫌疑人、失踪人口的全库搜寻、一人多证的重复排查,以此相似度列出相应的结果,可以大大提高排查效率。类似的也可以用到走失儿童的项目中去,相比美帝的亚当警报、安珀警戒,国内有没有类似的儿童走失警报及寻找机制? - 安全 - 知乎
这一类系统的部署需要两个条件:
1. BCD基本库(比如1000万人)
2. 强大的算法硬件
1:N同时作业就是N:N了,同时相应多张照片检索需求,检索耗费的时间跟硬件算法关系极大,就这一领域的应用,又哪家公司强了?
N:N人脸识别算法主要用于实时多1:N检索计算:
N:N 该算法实际上是基于1:N的算法,输入多个求解结果。比如视频流的帧处理所用,对服务器的计算环境要求严苛,目前的算法系统所支撑的输出率非常有限。

主要的限制如下:
海量的人脸照片解析需要大量运算(目前很少看到在采集端直接解析的,都是照片剪裁)海量的人脸照片传输需要大量的带宽(常见的720布控摄像头抓取最小的人脸照片为20K)海量的人脸照片在后台检索需要耗费大量的运算(国内主流主机为例,最多到24路摄像头)

v2-daf6b89fff5267a85239bcda64243863_hd.jpg (32.38 KB, 下载次数: 0)

下载附件  保存到相册

2018-3-21 10:15 上传

由此可见,真正实现“天网”人脸检索,一来要解决数亿摄像头的图片处理,二来需要解决联合库的超算检索,这可不是一般公司吃得消。有些小区和高级场所,对VIP客户的识别和接待比较喜欢这种视频校验方式,但是实际部署使用者会受到摄像头位置、角度,以及多人同时入场产生的问题,而且人脸库会非常有限,不然计算时间长,体验极差,一些所谓的迎宾机通常也就几个人的照片(就是纯粹给领导看的),实用价值大大的打折扣,有戴墨镜或者帽子遮蔽都认不出,毕竟关键特征取样有限。这又有谁强了?
人脸识别的技术发展方向:
结合三维信息:二维和三维信息融合使特征更加鲁棒多特征融合:单一特征难以应对复杂的光照和姿态变化大规模人脸比对:面向海量数据的人脸比对与搜索深度学习:在大数据条件下充分发挥深度神经网络强大的学习能力

在视频级N:N的校验中,如果要提高通过率,很多时候是采取降低准确率的方式,降低算法队列数量;同样在一些比赛中为了降低误识率,大大提高了准确率,所以算法在校验的过程中必须遵循至少一个固定标准,追求的是速度效率还是最高准确率。
人脸识别应用的发展方向
人脸识别这玩意儿就是一个调味料,在千万的业务解决方案中,就是一个小模块,其他的都是业务层的开发问题,使用上,技术也未必要高精尖,如果一定要真正称得上人工智能组成部分的,个人认为未来最大的使用端是机器人视觉交互。

人脸识别算法的应用分类派系:

v2-069c6eed8581261b4d23f72d1ed099ea_hd.jpg (45.64 KB, 下载次数: 0)

下载附件  保存到相册

2018-3-21 10:15 上传

人脸识别对应解决方案方向:

v2-af33a7a6f02b23ca1ba08b8c6020fd0f_hd.jpg (72.95 KB, 下载次数: 0)

下载附件  保存到相册

2018-3-21 10:15 上传

个人认为未来人脸识别会让大部分的数据更加真实,而可以通过社会工程学模板做很多分析和改良,比如近期一些科学家利用人脸识别来分析一些人的健康、清晰,甚至是犯罪倾向,或许在未来还可以结合大数据,对我们过去传统的面相分析技术做一个全新的提升,到时候算命先生都要失业了。更多机器人交互、无人机产生的摄像目标锁定分析等科幻画面并不是多遥远的事情。
关于算法核心研发情况的争论:
基本上国内每家公司都会说自己的算法牛,实际上有几家有人脸核心算法呢?国内在完全从事算法研究的总工程师人数到目前(2016年)总计不到100人,不过也没有现在问题也不大,中科院计算所山世光教授已经开源了SeetaFace开源人脸识别引擎介绍 - 知乎专栏,没有基础的公司不用太辛苦从零开始在OPENCV基础上做算法升级,相信很快google微软还会有新的算法发布。现在算法基本都是98%以上,这点差距已经不重要,算法核不核心也没有太大问题。大家不用太过于焦虑,产品到应用阶段,单单靠算法可不够,还要考虑实际的使用。
目前做人脸识别的公司很多,集成应用的有数百家,国内的看百度,看融资,看各种报道就差不多了,只是认真沉下心来做事情的公司太少。国内的腾讯和阿里都在做(阿里支付宝用的是自己的团队研发算法,只是特别低调,把名声都留给自己投资的公司,阿里可不止投了一家),国内的公司吹牛逼的、炒概念的太多,就不聊了,讲讲老外吧。

美国Identix公司
美国Bioscrypt公司
德国Cognitec Systems公司
西班牙Herta Security公司
日本NEC公司
日本Softwise公司
以上都是老牌人脸识别公司,美国Identix公司做的是多模认证(指纹、虹膜),而Bioscrypt公司早期起于指纹识别考勤,在政府市场的份额都不小,德国的Cognitec公司主要做政府项目的人脸识别系统,而NEC公司主要做机器人视觉识别系统,西班牙Herta公司是一家学术很浓厚的公司。此外的还有一些以色列公司技术也很不错。这些公司最强的一点是,几乎做的都是政府的安全项目,特别是CIA用的最多,此外还有Facebook等公司也在进入这个领域,互联网公司的加入主要是进行人群的分类和应用的优化(针对性的市场推广),项目都是作为公司原本业务的一种补充,这类几乎不用担心客户问题,因为这些公司本身就有很大的需求。随着人工智能的崛起,人脸识别未来会作为一个强大的功能补充,类似语音一样,成为机器人的标配。

评论
海关技术狗一只(不是边检不是边检不是边检)

大学毕设做的人脸识别,虽然基本是抄的,但也还算是了解一些基本知识吧,基本上那时候(四五年前吧)实验室里面识别率就可以到90%以上了,但是为啥到现在也没有特别好的应用。

拿海关来说吧,国内旅检口岸流量最大的属珠海的拱北口岸(一天30万左右)和深圳罗湖口岸(一天25万左右),我们也在口岸装过好几套人脸识别系统,用来识别水客,但是效果都不理想,最好的识别率也就40-50%吧,分析主要有以下原因:
1、人多,行为无法控制。一天30万是什么概念,一年就是一个亿,保守估计一年检测到的人脸也有千万级,需要对比识别的水客至少也有几万个。同时海关通道都是一条大通道,通道大概也就是8米*15米,每秒钟都有几十个人向你涌过来,而这些人里面脸朝各个方向的都有,甚至低着头的、带着口罩戴墨镜的,这对于摄像机数据采集是很大的挑战。一直认为人眼是最好的人脸数据采集的前端设备,人眼都不能很好的解决这些问题,更别说不能移动的摄像机了。所以这点和边检有很大差别,边检要么是自助通关,要么是人工,这些都是一个一个人过关,然后还会要求摘掉所有的遮挡(墨镜、口罩等)对准摄像头,这样才能保证人的脸部数据采集的准确性。被检测人员对系统的配合程度是会极大影响识别效果的,而出于某些政策的原因,海关不可能采取边检的通关方式,因此难度可想而知。有些人可能会说,那把戴口罩,戴墨镜,低头的都叫过来检查不就好了,但是通常把守一条通道的也就三四个关员,而香港和澳门人又很喜欢戴口罩,更何况水客还有可能一起十几个人一起过关,这无疑无法实现。
2、现场环境老旧,很难进行改造。口岸的旅检楼很多都是有着二三十年历史,整体环境都比较差,而且不能进行大面积改造,例如楼层层高不够,摄像机可选择的角度严重受限制;灯光昏暗,补光不够;通道狭窄又短,对系统运算效率较高等等。
3、目前我们能拿到的照片数据库来源较少,且部分质量一般,增加识别难度。由于某些原因,我们只能拿到一小部分的水客的证件照片,而其他水客的照片主要靠系统进行抓取,这导致数据库内的模版质量较差,直接影响识别效果。

所以人脸识别目前对于我们来说只能起到一个辅助作用,能有40%的识别率我们就已经很满足了,同时也希望还在做这方面研究的朋友能够看到实验室和实际应用的差距,加大对这方面的研究投入,做出更好的产品来。

评论
特么的每次我卸完妆手机就不认识我了。。。 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
 ·日本留学生活 求个大阪合租
·日本留学生活 自家房招租求
·日本留学生活 东京地区出9成新lv钱包
·日本育儿教育 孩子从国内过来如何学习日语
·日本育儿教育 明年四月横滨招月嫂
·日本育儿教育 请问咋让娃突破识字关?感谢分享中文共读和学习经验的妈妈
 ·中文新闻 东区明星迈克尔·格列柯,53 岁,将在第一次出生两年后第二次
·中文新闻 《爱情岛》明星卡米拉·瑟洛和杰米·朱维特在透露即将迎来第三

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...