電腦眼中的0與1─開啟影像辨識新知

電腦眼中的0與1─開啟影像辨識新知

跨界專欄

電腦眼中的0與1─開啟影像辨識新知

編輯撰文者:林耿呈(Aaron Lin);慧穩科技股份有限公司 總經理(AIWin Technology Co., Ltd., General Manager)

 

2017年Apple公司發表了紀念iPhone手機十周年的新款”iPhone X”,iPhone X正是採用Face ID取代Touch ID,可說是人臉辨識(Face Recognition)實際運用的新里程碑,說起人臉辨識已經不是什麼新技術,但是經過Apple公司的重新定義下,讓它具有新的可應用性,這也是Apple公司所擅長之處。人臉辨識為影像辨識的應用之一,主要是透過攝影機(Camera)與鏡頭(Lens)將影像成像至裝置(Device)中,在透過影像處理(Image Processing)的演算法(Algorithm)將影像資訊轉換成有用的資訊,聽起來好像沒什麼,但是實際的運作是複雜的,筆者將一一解說如下。

 

 

電腦中的影像
影像辨識簡單說就是經過攝影機取像再透過電腦的程式運算,最後由影像中進行處理、分析、量測與解譯出有關該實體有用之資訊,在電腦世界裡面,都使0與1的資料,而一張照片中全都是滿滿的0與1的組合,電腦是完全看不懂其中的意涵,不像我們人類,因為經過小時候的學習與認知,我們可以很快的從眼中馬上連結到大腦且聯想出所見為何物,但電腦完全沒有辦法,因此科學家就發展了一些影像處理的演算法來讓這些存在電腦裡的0與1組合有了意義。在電腦世界裡面的圖像,組成圖像大小的最小單位我們稱為畫素(Pixel),每個畫素是以三原色R(紅色)、G(綠色)、B(藍色)所組合成列的,每個原色都採大多8bits方式,所以是分布於0至255的灰階值,透過不同原色的灰階表現,而呈現多元的色彩;每個圖像都是畫素採2D的方式組成,如常見的解析度有:640X460,800X600等等,這都是表示影像大小的方式。

一張圖是由多個畫素所組成

影像辨識演算法
影像辨識演算法中,常見的有:前級處理(Image Pre-processing)、影像分割(Image Segmentation)、表示及描述(Image Representation and Description)與目標物辨識(Object Recognition)。前級處理指的是將影像的品質做強化,常見的有影像清晰、邊緣強化(Edge Enhancement)與亮度飽和度強化等等,經過這些前級處理後,影像中我們所要抓取的物體可以很清楚的被強化突顯出來。接下來就要進行影像分割,由於前級處理已將期望的物體在灰階度上突顯後,即可採用二值化(Thresholding)的方式,將物體切割出來,切割出來的物體會進入特徵的表示與描述,最後把這些特徵進行分類(Classification)以達到辨識的效果。以人臉辨識為例,前級處理即是將過亮或過暗的人臉影像進行調整,然後採用膚色的灰階範圍進行二值化,把人臉的部份抓出來,接下來把眼睛與嘴巴的特徵抓出來並且描述對應的距離,將這些距離當做辨識個人的特徵,最後進行資料庫的比對分類,即可辨識出此人的身份。

可疑人物識別

影像辨識之應用
影像辨識除了辨識人臉外,還有許多領域都有用到,如改善影像品質的衛星影像、醫學影像、舊照片重建;美工應用中的海報設計、動畫製作、電影特效;量測尺寸中的長、寬、直徑、面積、體積、形狀、元件間的距離;計數相關應用中的數錢、體細胞計數、微生物計數、魚苗計數;自動辨識領域中的檢測產品分級、瑕疵檢測、微生物鑑定、指紋比對動態物體追蹤;定位應用中的目標物之2D或3D座標位置計算影像重建、虛擬實境等等,相當多元,然後近幾年人工智慧(Artificial Intelligence)與深度學習(Deep Learning)技術上的突破,以上的應用也隨之有更準確性的突破,更帶來了許多新型態的應用產生,未來有機會再來細談人工智慧與深度學習。

紡織品檢測

鞋帶瑕疵檢測

前車影像辨識