电脑眼中的0与1─开启影像辨识新知

电脑眼中的0与1─开启影像辨识新知

跨界专栏

电脑眼中的0与1─开启影像辨识新知

编辑撰文者:林耿呈(Aaron Lin);慧稳科技股份有限公司 总经理(AIWin Technology Co., Ltd., General Manager)

 

2017年Apple公司发表了纪念iPhone手机十周年的新款”iPhone X”,iPhone X正是采用Face ID取代Touch ID,可说是人脸辨识(Face Recognition)实际运用的新里程碑,说起人脸辨识已经不是什么新技术,但是经过Apple公司的重新定义下,让它具有新的可应用性,这也是Apple公司所擅长之处。人脸辨识为影像辨识的应用之一,主要是透过摄影机(Camera)与镜头(Lens)将影像成像至装置(Device)中,在透过影像处理(Image Processing)的演算法(Algorithm)将影像资讯转换成有用的资讯,听起来好像没什么,但是实际的运作是复杂的,笔者将一一解说如下。

 

 

电脑中的影像
影像辨识简单说就是经过摄影机取像再透过电脑的程式运算,最后由影像中进行处理、分析、量测与解译出有关该实体有用之资讯,在电脑世界里面,都使0与1的资料,而一张照片中全都是满满的0与1的组合,电脑是完全看不懂其中的意涵,不像我们人类,因为经过小时候的学习与认知,我们可以很快的从眼中马上连结到大脑且联想出所见为何物,但电脑完全没有办法,因此科学家就发展了一些影像处理的演算法来让这些存在电脑里的0与1组合有了意义。在电脑世界里面的图像,组成图像大小的最小单位我们称为画素(Pixel),每个画素是以三原色R(红色)、G(绿色)、B(蓝色)所组合成列的,每个原色都采大多8bits方式,所以是分布于0至255的灰阶值,透过不同原色的灰阶表现,而呈现多元的色彩;每个图像都是画素采2D的方式组成,如常见的解析度有:640X460,800X600等等,这都是表示影像大小的方式。

一张图是由多个画素所组成

影像辨识演算法
影像辨识演算法中,常见的有:前级处理(Image Pre-processing)、影像分割(Image Segmentation)、表示及描述(Image Representation and Description)与目标物辨识(Object Recognition)。前级处理指的是将影像的品质做强化,常见的有影像清晰、边缘强化(Edge Enhancement)与亮度饱和度强化等等,经过这些前级处理后,影像中我们所要抓取的物体可以很清楚的被强化突显出来。接下来就要进行影像分割,由于前级处理已将期望的物体在灰阶度上突显后,即可采用二值化(Thresholding)的方式,将物体切割出来,切割出来的物体会进入特征的表示与描述,最后把这些特征进行分类(Classification)以达到辨识的效果。以人脸辨识为例,前级处理即是将过亮或过暗的人脸影像进行调整,然后采用肤色的灰阶范围进行二值化,把人脸的部份抓出来,接下来把眼睛与嘴巴的特征抓出来并且描述对应的距离,将这些距离当做辨识个人的特征,最后进行资料库的比对分类,即可辨识出此人的身份。

可疑人物识别

影像辨识之应用
影像辨识除了辨识人脸外,还有许多领域都有用到,如改善影像品质的卫星影像、医学影像、旧照片重建;美工应用中的海报设计、动画制作、电影特效;量测尺寸中的长、宽、直径、面积、体积、形状、元件间的距离;计数相关应用中的数钱、体细胞计数、微生物计数、鱼苗计数;自动辨识领域中的检测产品分级、瑕疵检测、微生物鉴定、指纹比对动态物体追踪;定位应用中的目标物之2D或3D座标位置计算影像重建、虚拟实境等等,相当多元,然后近几年人工智慧(Artificial Intelligence)与深度学习(Deep Learning)技术上的突破,以上的应用也随之有更准确性的突破,更带来了许多新型态的应用产生,未来有机会再来细谈人工智慧与深度学习。

纺织品检测

鞋带瑕疵检测

前车影像辨识