記者葉立斌/台北報導
在2017年2月,每日觀看Youtube時數達到10億小時,我們每天觀賞的Youtube,機器學習的能力如何在這平台妥善利用?Youtube的搜尋與探索團隊,想要幫觀眾找出想要以及想看的影片;同時因近期極端主義盛行,Youtube也利用機器學習來過濾並且遮蔽這些內容,比傳統靠使用者檢舉效果更好。
影片推薦
大家打開首頁都可以看到為你推薦的影片,不過這幾年來有多項改變,雖然是極細微的,但與你的點閱習慣仍一起造就現在的首頁風貌。
從2011年開始,演算法從觀看次數改為觀看時間為基礎,做推薦。使用者觀看次數在一天內下降20%,平均觀看時間卻從120秒增為140秒。2014開始,有60%使用者會用行動裝置看影片,轉行動機器學習支援的個人化影片推薦,2016年起,Youtube提升使用者體驗,推出超過190個更新,將個人化概念推至首頁。
TensorFlow是2015年開源的機器學習基礎系統,幫使用者快速找到目標照片或是Google翻譯中的神經機器翻譯系統。這為採用大規模分布是訓練的深層神經網絡架構提供靈活框架。
Youtube首頁每日推薦2億支不同內容的影片,使用者點閱自動推薦影片的觀看時間超過70%,在過去三年成長20倍。Youtube大中華與紐澳技術管理負責人葉佳威表示,精準影片推薦對廣告主來說,更容易打中目標群眾。
▲記者喜歡瑪利歐,所以首頁有許多與瑪利歐相關的影片。(圖/翻攝官網)
辨識極端主義影片的內容
Youtube上不時出現極端主義或暴力影片,過去靠使用者檢舉效果有限,今年6月開始用機器學習辨識含暴力或宣揚極端主義的影音內容,再用系統進一步判斷、審查違規影片。成果斐然,有83%影片內含暴力極端主義,在使用者檢舉前就被辨識出來。當然機器識別技術與審查機制不夠完善,須持續進步,降低誤判。Youtube提醒創作者針對紀錄或揭露暴力的影片,例如紀錄片或討論此事,記得加入必要背景資訊,以免影片誤刪。
Google團隊嘗試用機器學習理解影片中人物的行為與動作,但人類行為是自然不受規範的,既有資料庫也無法支援分析。因此團隊推出原子視覺化動作數據學習模式AVA,他們透過AVA提升機器學習理解影片人物動作的能力。這資料庫會提出以人為中心的註解,也就是只看「人」而非把整段影片看完;標籤限制在精細的時間長度「3秒」,通常會有清晰的視覺標誌。取材則來自各種類型與不同國家的電影。目前已分析57萬組影音,生成21萬個動作標籤,標註9萬6千組人類的動作。