不用鑒黃師,還要給視頻直播一片凈土,Facebook 會怎么做?
不管你喜歡打游戲,還是看比賽,如今,移動端的視頻直播都能滿足你。
但伴隨用戶規模驟增、直播數量上漲,諸如暴力、色情等不當內容也開始泛濫。解決這個問題,“積極地使用更好的算法,比采取法律手段有用得多”。 據路透社報道 ,Facebook 作為視頻直播巨頭,將使用 AI 對網民的視頻直播進行實時的監控識別,避免違規內容的傳播。
Facebook 負責“應用機器學習技術”的總監康德拉(Joaquin Candela)向媒體披露,Facebook 正在開發一個能夠對視頻直播中不當內容進行監控和識別的工具,并已經開始在 Facebook 的直播產品“Facebook Live”中進行測試。Facebook 希望,人工智能技術能夠幫助其主動監控視頻直播中的違規違法情況。
(圖片來自: Reuters )
人工智能技術對實時視頻影像的鑒黃分析主要是從三個方向進行:是否有人物、人形輪廓的膚色比例、姿態分析。直播視頻可以通過解碼抽幀,識別固定時間段中抽取的圖像來鑒定是否是色情視頻。當圖片或視頻幀達到十萬的量級,深度學習就能跑起來。鑒黃的難點就在于,機器容易將正常圖片(例如肉色褲子)誤判為色情圖片,這需要后期大量的數據不斷訓練和糾正,投入不小。
那么為什么不用人工識別呢?人工確實可以處理視頻直播中違規違法情況,但由于內容數量多,用戶規模大,人工處理不僅投入大,成本高,而且不穩定,速度慢,易漏判誤判。目前,僅國內視頻直播應用用戶規模已達 2 億臺,增速還在提高,2016 年第一季度同比就增長了近一倍。因此運用 AI 監控視頻直播確實是一種理想而必然的選擇。
(圖片截自 Talkingdata )
目前,圖像識別已經廣泛應用于互聯網圖片鑒黃、明星臉識別、暴力恐怖等信息的篩選和過濾。今年 6 月,Facebook 已經開發出能夠自動識別標注極端組織的技術;而在 9 月,雅虎開源了自己構建的一套深度學習神經網絡,專門用于自動監測圖片是否含有色情內容。該識別系統會通過通用 Caffe 深度神經網絡模型以圖像作為輸入并輸出一個概率,給圖片評估一個 NSFW(Not Suitable/Safe For Work)值,最無害的是 0,最極端是 1。
(圖片來自: Yahoo! Engineering )
視頻監控方面,今年4月,Twitter 的人工智能團隊 Cortex 開發出了一款即刻識別直播視頻內容的算法,該技術利用深度學習的方法來識別視頻中的活動。其通過學習大量樣例來訓練大型模擬神經網絡,以識別輸入的內容。樣例視頻由雇員觀看,并添加標簽,為視頻提供足夠復雜的語義理解框架。
當下,眾多公司都在爭奪視頻直播的陣地,亞馬遜 (Amazon) 2014 年斥資 10 億美元,收購了游戲直播網站 Twitch;Twitter 2015 年花費 5000 萬美元收購還未正式發布的視頻直播應用 Periscope;Yahoo 旗下 Tumblr 今年 6 月也宣布推出直播服務;Facebook 則因為手握巨大用戶量,Facebook Live 日觀看量可達 40 億人次。
國內市場中,也已經有近 200 家在線直播平臺,不乏在游戲、彈幕、視頻、秀場、移動等5大類垂直直播平臺。用戶總數已達 2 億,數字也十分可觀。但潛藏在這片紅海下的違規違法行為,如何通過人工智能技術手段處理,是視頻直播公司一直需要面對的問題。
黃嘉雯 Good things happen. 郵箱
#歡迎關注愛范兒認證微信公眾號:AppSolution(微信號:appsolution),發現新酷精華應用。
愛范兒 | 原文鏈接 · 查看評論 · 新浪微博