电脑眼中的0与1─开启影像辨识新知

跨界专栏

电脑眼中的0与1─开启影像辨识新知

编辑撰文者：林耿呈(Aaron Lin)；慧稳科技股份有限公司总经理(AIWin Technology Co., Ltd., General Manager)

2017年Apple公司发表了纪念iPhone手机十周年的新款”iPhone X”，iPhone X正是采用Face ID取代Touch ID，可说是人脸辨识(Face Recognition)实际运用的新里程碑，说起人脸辨识已经不是什么新技术，但是经过Apple公司的重新定义下，让它具有新的可应用性，这也是Apple公司所擅长之处。人脸辨识为影像辨识的应用之一，主要是透过摄影机(Camera)与镜头(Lens)将影像成像至装置(Device)中，在透过影像处理(Image Processing)的演算法(Algorithm)将影像资讯转换成有用的资讯，听起来好像没什么，但是实际的运作是复杂的，笔者将一一解说如下。

电脑中的影像
影像辨识简单说就是经过摄影机取像再透过电脑的程式运算，最后由影像中进行处理、分析、量测与解译出有关该实体有用之资讯，在电脑世界里面，都使0与1的资料，而一张照片中全都是满满的0与1的组合，电脑是完全看不懂其中的意涵，不像我们人类，因为经过小时候的学习与认知，我们可以很快的从眼中马上连结到大脑且联想出所见为何物，但电脑完全没有办法，因此科学家就发展了一些影像处理的演算法来让这些存在电脑里的0与1组合有了意义。在电脑世界里面的图像，组成图像大小的最小单位我们称为画素(Pixel)，每个画素是以三原色R(红色)、G(绿色)、B(蓝色)所组合成列的，每个原色都采大多8bits方式，所以是分布于0至255的灰阶值，透过不同原色的灰阶表现，而呈现多元的色彩；每个图像都是画素采2D的方式组成，如常见的解析度有：640X460，800X600等等，这都是表示影像大小的方式。

一张图是由多个画素所组成

影像辨识演算法
影像辨识演算法中，常见的有：前级处理(Image Pre-processing)、影像分割(Image Segmentation)、表示及描述(Image Representation and Description)与目标物辨识(Object Recognition)。前级处理指的是将影像的品质做强化，常见的有影像清晰、边缘强化(Edge Enhancement)与亮度饱和度强化等等，经过这些前级处理后，影像中我们所要抓取的物体可以很清楚的被强化突显出来。接下来就要进行影像分割，由于前级处理已将期望的物体在灰阶度上突显后，即可采用二值化(Thresholding)的方式，将物体切割出来，切割出来的物体会进入特征的表示与描述，最后把这些特征进行分类(Classification)以达到辨识的效果。以人脸辨识为例，前级处理即是将过亮或过暗的人脸影像进行调整，然后采用肤色的灰阶范围进行二值化，把人脸的部份抓出来，接下来把眼睛与嘴巴的特征抓出来并且描述对应的距离，将这些距离当做辨识个人的特征，最后进行资料库的比对分类，即可辨识出此人的身份。

可疑人物识别

影像辨识之应用
影像辨识除了辨识人脸外，还有许多领域都有用到，如改善影像品质的卫星影像、医学影像、旧照片重建；美工应用中的海报设计、动画制作、电影特效；量测尺寸中的长、宽、直径、面积、体积、形状、元件间的距离；计数相关应用中的数钱、体细胞计数、微生物计数、鱼苗计数；自动辨识领域中的检测产品分级、瑕疵检测、微生物鉴定、指纹比对动态物体追踪；定位应用中的目标物之2D或3D座标位置计算影像重建、虚拟实境等等，相当多元，然后近几年人工智慧(Artificial Intelligence)与深度学习(Deep Learning)技术上的突破，以上的应用也随之有更准确性的突破，更带来了许多新型态的应用产生，未来有机会再来细谈人工智慧与深度学习。

纺织品检测

鞋带瑕疵检测

前车影像辨识

跨界专栏

电脑眼中的0与1─开启影像辨识新知

编辑撰文者：林耿呈(Aaron Lin)；慧稳科技股份有限公司 总经理(AIWin Technology Co., Ltd., General Manager)

你可能也喜欢

加速成熟企业AI转型 新创团队用「场景」让技术落地

慧稳科技隆重推出2023年NumOps特惠方案！

慧稳科技与基士德科技共同展出智慧水务解决方案

编辑撰文者：林耿呈(Aaron Lin)；慧稳科技股份有限公司总经理(AIWin Technology Co., Ltd., General Manager)

加速成熟企业AI转型新创团队用「场景」让技术落地