编辑导语:人脸识别产品已经应用到生活的每一个场景。但是你知道它是如何工作的吗?在这篇文章中,作者拆解了人脸识别的原理。有兴趣一起看。
没错。我一眼就能看到数字1。似乎每个人都有人工智能的天赋。走吧。
第三,图像识别
图像用矩阵表示后,各种图像处理转化为数学问题,可以用数学理论和方法来解决,这正是计算机擅长的。
我们输入图片,希望计算机能够识别内容并输出结果。
仍然以数字为例,在输入图片用矩阵表示后,通过将灰度值转换为灰度,可以很容易地识别出图片所表示的内容。
但是在计算机世界里,只有0和1。如果要识别矩阵的内容并输出结果,必须建立从矩阵到结果的映射。这样,在输入图片并进行处理和计算后,就可以输出一个数字。
简单的想法是将每个数字所代表的矩阵预先存储在计算机中。输入一张图片后,计算机可以通过计算找到最适合输出的数字。
比如更容易理解。例如,计算机已经存储了数字1和7及其对应的灰色矩阵。
第一
7号
当输入新图像时,程序将自动计算其矩阵和这些矩阵之间的相似度。计算相似度的公式有很多,比如百分比、距离等等。
为简单起见,用两个矩阵对应元素之差的绝对值之和或平方和,计算机会做一个快速运算,找出最相似的矩阵,然后输出它所代表的数字。
经过简单计算,可以知道当输入以下内容时,输出结果为7。
第四,人脸表征
既然一张图片可以用矩阵来表示,一张脸也是一张照片,那么也可以用同样的方式来表示。下面这张脸可以表示为:
所谓人脸数据库,就是我们在系统中预先录入的人脸照片,照片与我们的名字一一对应。根据人脸数据库中照片数量的不同,人脸比对可分为1:1和1: n两种,这两种方法的计算量和计算方法因数量不同而不同。
1.1:1
1:1最常见的场景就是目击者的对比,比如我们坐高铁时遇到的这种设备。
正面1代表我们从设备上采集的照片,背面1代表身份证上的照片。通过现场采集的照片与身份证中存储的照片进行比对,可以判断持证人是否为本人。
这种情况下只涉及两张图片的对比,计算量相对较小。
可用于火车票安检等场景,要求精度较高。
身份证中的照片像素很小,市面上的身份证阅读器读取的照片只有100*100像素左右,给准确性带来了一定的挑战。
目前这个领域比较成熟,使用场景也在逐渐普及。
2.1:N
1:N是数据库中一个面和N个面的比较。
比如在考勤机中,我们的人脸数据库包含了整个公司的所有人脸照片。上班打卡时,考勤机采集人脸输入系统,比对后输出员工身份。
这种情况下计算量比较大,时效性和识别准确率太低,会影响用户体验。因此,制造商通常会考虑权衡,并在设备参数中标记支持面的数量。
这一波人工智能发展带动了人脸识别技术在1: N领域的进步,更多的产品可以登陆各种场景。比如智慧城市和智能家居。
国内厂商也借此东风,加快技术研发和产品落地,诞生了AI Vision四小龙等知名独角兽。
今天梳理一下人脸识别的基本原理。虽然整个实现过程看似简单,但技术在基本原理的基础上不断改进和完善,最终取得了更好的效果。