3月31日,「2018中國人工智能安防峰會」在深圳科興科學園國際會議中心正式開幕期油。期間眾多AI+安防界重量嘉賓登臺發(fā)表演講源洒,讓人受益匪淺。本文须拒,筆者對中科院生物識別與安全技術研究中心主任李子青的演講進行了要點整理赘眼,以最精華的觀點,供行業(yè)人士參考玛繁。
李子青发钞,人臉識別和智能視頻監(jiān)控專家,主持了多個國家科學研究項目和重大應用工程項目号呜,在相關領域獲準和申請專利10余項鞋倔。2004年,李子青作為“百人計劃”入選者來到中科院自動化所剑征,十一年后除呵,創(chuàng)辦AI公司中科奧森,親自主持了多個重大項目的落地爪喘。
動態(tài)人臉監(jiān)控存在的問題
過去雖然安防行業(yè)更聚焦在智能視頻分析的應用上颜曾,但是AI跟安防的結合是持續(xù)不斷的,早在十多年以前就已經(jīng)引入了AI秉剑,視頻結構化泛豪、人臉結構化、車輛結構化等秃症,都是安防行業(yè)在視頻大數(shù)據(jù)領域最關注的問題候址。但現(xiàn)在與過去不同的是,深度學習帶來的AI第三次浪潮將AI的概念進一步強化种柑,更深刻地影響著安防行業(yè)岗仑。在智能安防產(chǎn)品中,隨著靜態(tài)人臉識別已經(jīng)到了尾聲階段聚请,動態(tài)人臉監(jiān)控當前正如火如荼地進行中荠雕,但在實際應用中卻遇到一些問題:
(1)誤報率太高。以業(yè)務規(guī)模來解釋驶赏,在某個轄區(qū)中有1000路視頻抓拍人像酬桦,并且只有一個黑名單庫,假設每個攝像頭每10秒或者5秒抓拍一張人臉,該轄區(qū)每秒鐘抓拍100張左右的圖象桩眼,該轄區(qū)每天要產(chǎn)生864萬張抓拍人臉责什,跟20萬人的在圖庫比對次數(shù)是1.728萬億次。
對動態(tài)人臉識別的性能要求袄碱,用戶希望通過率比較高颓涉,例如90%的通過率,在動態(tài)人臉監(jiān)控上面算是較高的水平描宁,意味著它每天的誤報個數(shù)要少于200個√眨現(xiàn)在的問題是誤報率太高,如果每次都是“狼來了”坊偿,那么就算公安用戶對新技術的有強烈的需求华孙,也會選擇禁用甚至放棄。
(2)沒有足夠的標注數(shù)據(jù)去解決問題申建。去年12月份李開復談AI和大數(shù)據(jù)海槐,他的觀點是:具有一定規(guī)模和質量的數(shù)據(jù)集成為人工智能行業(yè)發(fā)展的一大制約。搜狗的CTO楊洪濤說敞峭,還沒有足夠的數(shù)據(jù)去解決問題踊谋。后者的總結是不太準確的,應該是沒有足夠的標注數(shù)據(jù)去解決問題旋讹,因為當前生產(chǎn)環(huán)節(jié)的數(shù)據(jù)是海量的殖蚕,就像剛才描述的公安生產(chǎn)環(huán)節(jié)的數(shù)據(jù)并不少。
李開復說沉迹,人工標注這些東西是不解決問題的睦疫,必須在真實運用場景里得到閉環(huán)回饋的標注,才能真正地解決AI與大數(shù)據(jù)的問題”夼唬現(xiàn)在行業(yè)做深度引擎開發(fā)的都遇到了這樣的問題蛤育。
這就引出了當前技術和應用的痛點所在,深度學習是需要大數(shù)據(jù)訓練的葫松,但是人工標注費時費力瓦糕,在這方面標注的資源非常有限。行業(yè)里聽說腋么,商湯每個月都要花費幾百萬來做標注咕娄,因此深度學習還有一定的發(fā)展空間,但是不管是提升算法贺跟、改進網(wǎng)絡架構柏咳,還是通過增大數(shù)據(jù)標注的方式,提升的空間都不會太大简骗,因為它已經(jīng)接近天花板柄倒。所以行業(yè)必須在這方面突破——必須像李開復說的那樣蚜雏,要形成應用場景的數(shù)據(jù)閉環(huán),能夠利用生產(chǎn)環(huán)節(jié)的大數(shù)據(jù)進行自主標注靡抓、自主學習附柜。
未來AI+安防的趨勢
從應用來講,動態(tài)識別的誤報率太高簿混,大數(shù)據(jù)的資源應用沒有充分的利用起來泉剔,研發(fā)單位不管是公司還是其他,只能選擇在公安現(xiàn)場去訓練住秉,或者通過一些手段把數(shù)據(jù)拷下來,自己標注钧失、加工睹傻,來提升核心引擎。
從數(shù)據(jù)源頭來講哼转,在傳感器方面明未,仍然是受到了暗光、強光和逆光的影響壹蔓,雖然行業(yè)現(xiàn)在有寬動態(tài)趟妥、星光型的攝像機,但是這仍然是一個問題佣蓉。未來的發(fā)展趨勢就是3D傳感器披摄,從Kinect到iphoneX到Lidar,這是另外一個趨勢勇凭,對二維的識別進行補充疚膊。最后李子青結合中科奧森的新技術,談了AI+安防未來的技術趨勢:
第一虾标,大數(shù)據(jù)閉環(huán)自主學習寓盗,行業(yè)通過前端獲取數(shù)據(jù),數(shù)據(jù)抓取之后經(jīng)過結構化或者直接送到后臺大數(shù)據(jù)存儲璧函,通過核心引擎實現(xiàn)數(shù)據(jù)的訓練傀蚌,最后實現(xiàn)后臺大數(shù)據(jù)與核心引擎的再學習打通,實現(xiàn)閉環(huán)甲施。
第二互聪,從大數(shù)據(jù)到一人一檔。通過路人庫和名單庫這兩個集合的合輯梳理成一人一檔塌卜,實現(xiàn)跨時空的目標軌跡挖掘等應用标增,是核心算法和大數(shù)據(jù)產(chǎn)生的結果。
第三启脉,新一代智能攝像機杠卜,不僅能實現(xiàn)臉逐枢、人體、車輛的視頻結構化集成到前端去坠屹,而且能實現(xiàn)全光照拍攝功能遍跌。
李子青最后總結,安防跟深度學習是深度融合的兵扭,新銳企業(yè)依靠純算法肯定是沒有出路的哑立,像商湯、曠視這些企業(yè)都在做落地應用脾鸠。安防企業(yè)如航芪妫康大華等,它們具備市場優(yōu)勢棋蚌,落地應用非常好嫁佳,AI企業(yè)的核心技術要比傳統(tǒng)企業(yè)更加前沿,兩者各有各的優(yōu)勢谷暮,現(xiàn)階段而言蒿往,兩者之間的互動能讓產(chǎn)業(yè)與中國的安防技術提升到更高的臺階。