Custom vision 明星臉辨識

2017-12-02

922
0
Azure Machine Learning
2021-01-13

微軟的Azure Cognitive Service推出時，其產品經理突發奇想，請工程師寫了一個 How-old.net 網站並找了50個人來測水溫，想不到一下子就爆大量吸引了35000人次來訪這個網站，甚至晚間新聞就報出來了。
2017年真的是AI元年，全世界都動起來了，台灣微軟也利用了寒舍艾美酒店場地，在2017/11/23 舉辦了 Microsoft AI day。當天有一個讓全場超過六百個來賓為之驚豔的 demo，是應用Azure Custom Vision服務在 LV與Gucci名牌包的辨識，在本文中將會把它改成，應用影像辨識技術解決我對明星臉眼盲的問題。

源起：
美國普林斯頓大學自2007年發起了一個 ImageNet 專案，他們從網路上找了超過百萬張以上的照片，並且將照片整理過並標示(Tag)類型好，以作為電腦進行機器學習的素材。
而今十年過去了，隨著網路圖像的大量成長 ImageNet 也已經是全世界最大的圖像識別資料庫，丹佛大學也接棒，每年都會舉辦 ImageNet 圖像識別競賽，Google、微軟、Intel…這些世界級的大型企業，在競賽中除了爭奪名譽上的第一名，其實也在測試自家系統的效能與極限。
微軟在十年中有數次贏得了可貴的第一名，在大會指定的十萬張圖片考題中，目前最好的成績是，圖片分類項目的正確率可以高達 96.5%，圖片定位項目的準確率也高達 91%，
經過了大數據的淬鍊後，微軟的 Azure cognitive service，不僅只能辨別家中阿貓阿狗，生活中的路燈、吊橋、奔跑的人、游泳的人…等，都可以透過 Computer vsion 辨識後，回傳人類所需的分析資訊
若對其中的的技術細節有興趣，可以參考康乃爾大學的這篇論文 Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification，在網站中右上角有一個PDF下載的按鈕

承上，微軟在 Azure Cognitive Service 官網上雖然有提供免費的單次照片辨識，但是底層的模型都是 for general purpose 適用於普羅大眾，換句話說就是適合處理大哉問的問題。舉例來說，我將 Giorgio Armani義大利進口西裝照片上傳至Computer vision服務，它只能告訴你是西裝。但萬一我是經營一家當舖，光能辨識出西裝還不夠，我還需要區分出進口名牌、國內名牌、夜市…等級。

一旦需求很明確，要能建立一套能自行維護模型的Classifier分類器，我們就可以基礎於公司的戰略考量，選擇招募資料科學家人才，進行公司重要產品的研發專案，或是採用微軟的Azure Custom Vision Service進行企業應用的開發專案。

Azure Custom Vision Service究竟是怎麼樣市場定位的產品呢？還有它有什麼樣的限制？基本上，它就是針對有辨識需求的客群，在特定的應用範圍(目前已提供了一般用途、食物、地標、零售、成人內容…等五種)內，推出一個快速上手、不需自己管理機房維運的雲端服務。至於限制，它適合於影像辨識，而非物件辨識。在這邊影像指的是主體，比如說是一個人，穿著西裝，站在辨公室中。若是一天後，同一個在拍攝一張照片，這二張照片，一定會有細微的變化，這種就是物件辨識。
接下來，我打算要用一個分辨二個容易撞臉的女明星，分別是宋芸樺/夏于喬，來介紹Azure Custom Vision Service 這個擅長於影像分類的雲端服務。基礎於人工智慧需要大數據的支持，我們可能會需要數以百張的照片來協助這個分類器，它的辨識準確率才比較有把握，但是至少要多少張這裡先賣個關子。
最後，趕快空出你的手，一起來，讓我們快速地體驗一下，雲端世界的美好。

明星臉宋芸樺、夏于喬的辨識專案

環境準備
首先，需要一個有效地Azure subscription雲端訂閱或是一個Azure AD ID，若沒有可以申請試用
建立專案
打開瀏覽器 https://customvision.ai/
官網中提到，微軟已經把辨識過程化繁為簡，只需三步曲，上傳/訓練/使用登入決定是否同意 Terms of service？點選建立專案
輸入專案資訊
上傳照片
需注意：支援的規格有 jpg/png/bmp，但相素要大於256 pixel，且檔案大小要小於4MB
為了辨識率，建議至少要上傳 30張以上的圖片選擇你本機或網路磁碟機中的照片輸入欲標記的Tag名稱，並按下+號，在本例是宋芸樺最後按下 Upload files，等到照片上傳成功再依上述的步驟，上傳另一個明星照片檢視上傳結果
訓練模型
在瀏覽器上方找到 Train的綠色按鈕按下去畫面會出現 Iteration1 第一輪的模型訓練系統會顯示訓練的結果，包含精確率 Precision 與召回率 Recall關於精確率Precision 與召回率 Recall的定義，可以參考下圖Wiki中的解釋
預測分析
網頁上方找到 Quick Test(白色按鍵，字的前面還有打勾的那一個)選擇本機資料夾或是雲端空間，把照片上傳來分析我選擇了本機的照片，準備開始辨識辨識結果：宋芸樺85.8% (照片的下面會分別呈現二個類別，各自的分數)接著，再試夏于喬辨識結果：夏于喬88.2%
與應用程式結合
我們在網頁上方找到 Performance 頁籤，就是剛才訓練模型的那個頁面
在左邊可以找到一個 Probability Threshold 有一個機率的門檻值，這個參數可以用滑鼠拖拉來操作，預設值為 90%
我們按下 Prediction URL按鈕(字前面有球體符號的那一個)，右邊馬上會彈出如何呼叫這個 Web Service 的說明，只需把它加入你的程式或是網站即可

很簡單吧！趕快自己動手做一遍吧！

後記：

李秉錡 Christian Lee
Once worked at Microsoft Taiwan

回首頁