細(xì)究起來璃诀,不是技術(shù)問題弧可,高精尖技術(shù)國內(nèi)基本上可以與美國保持同步,國內(nèi)團(tuán)隊(duì)奪得國際比賽的成績單光明耀眼劣欢;不是人才問題棕诵,頂尖的國際人才流動(dòng)比比皆是。更不是制造能力問題凿将,中國的監(jiān)控設(shè)備制造商制造了世界六成還多的設(shè)備校套,可能有的小伙伴會說是對行業(yè)的理解度問題。
不可否認(rèn)牧抵,這是個(gè)重要因素笛匙,但對大規(guī)模落地“安防+AI”的關(guān)鍵要素認(rèn)知可能是個(gè)更關(guān)鍵的問題。
一犀变、當(dāng)前視頻監(jiān)控的應(yīng)用現(xiàn)狀
從2004年以來的平安城市妹孙,天網(wǎng)工程,雪亮工程考叽,經(jīng)過十多年的建設(shè)肢姜,全國各省市乃至鄉(xiāng)村,都建起了大規(guī)模的視頻監(jiān)控系統(tǒng)连碎。
據(jù)不完全統(tǒng)計(jì)驰闺,目前全國已建各類監(jiān)控近2億路,加上在建的和待建的弧哥,至少規(guī)模會翻翻呕豪。隨之而來的是天量級視頻文件,即使配備數(shù)百萬視頻巡視員來看視頻返引,每天能監(jiān)控到的視頻大概也不到總視頻量的百分之一。
但是這些天量的視頻數(shù)據(jù)勿玖,在社會公共安全管理和案件偵破等工作中隔每,起著越來越重要的作用。在公共安全信息化建設(shè)深入持續(xù)開展的背景下场比,現(xiàn)有視頻系統(tǒng)缺乏深度應(yīng)用模式贼酵,視頻數(shù)據(jù)智能化程度不高的問題不斷凸顯糙笛。如何用AI升級現(xiàn)有的視頻系統(tǒng),使之能更好地適應(yīng)物聯(lián)網(wǎng)時(shí)代視頻智能化烛愧、信息化油宜、情報(bào)化的應(yīng)用需求已勢在必行。
當(dāng)前小規(guī)模落地安防+AI怜姿,已經(jīng)不是難題慎冤,智能攝像頭或者結(jié)構(gòu)化服務(wù)器就能解決這個(gè)問題。
以下要說的是大規(guī)模沧卢、城市級的安防+AI中的落地要素:
要素一:視頻結(jié)構(gòu)化
要實(shí)現(xiàn)視頻信息智能化蚁堤、信息化的問題,必須要先面對結(jié)構(gòu)化的問題但狭,結(jié)構(gòu)化之后就可以把原來只能看無法調(diào)用的視頻變成可調(diào)用的信息披诗。迎接視頻數(shù)據(jù)深度應(yīng)用的挑戰(zhàn),其核心及瓶頸是通過研究視頻結(jié)構(gòu)化描述技術(shù)立磁,解決通用視頻數(shù)據(jù)向視頻信息化呈队、視頻情報(bào)化方向的轉(zhuǎn)化,實(shí)現(xiàn)社會公共安全視頻應(yīng)用工作模式的創(chuàng)新唱歧。
視頻結(jié)構(gòu)化描述是一種基于視頻內(nèi)容信息提取的技術(shù)宪摧,它對視頻內(nèi)容按照語義關(guān)系,采用時(shí)空分割轴艇、特征提取谊阐、對象識別等處理手段,組織成可供計(jì)算機(jī)和人類理解的結(jié)構(gòu)化信息的技術(shù)婆掐。
從數(shù)據(jù)處理的流程看它蛔,視頻結(jié)構(gòu)化描述技術(shù),能夠?qū)⒎墙Y(jié)構(gòu)化的視頻數(shù)據(jù)轉(zhuǎn)化為人和機(jī)器可理解的結(jié)構(gòu)化信息呜紊,并進(jìn)一步轉(zhuǎn)化為公安民警實(shí)戰(zhàn)所用的情報(bào)數(shù)據(jù)首袍,實(shí)現(xiàn)視頻數(shù)據(jù)向信息化、情報(bào)化碧碉、智能化的應(yīng)用轉(zhuǎn)化衰呢,達(dá)到借用視頻監(jiān)控掌控安全的目的。
視頻結(jié)構(gòu)化描述的內(nèi)容類型方面主要是:人員炒肚、車輛猪出、物品、行為酱赘。
在視頻中把人作為一個(gè)可描述的個(gè)體展現(xiàn)出來鬓催,其中包括人員的臉部精準(zhǔn)定位、臉部特征提取恨锚、臉部特征比對宇驾,還包括人員的性別倍靡、年齡范圍、大概身高课舍、衣著特征塌西、發(fā)飾特征、配飾筝尾、攜帶物品捡需、步履形態(tài)、交通工具等多種可結(jié)構(gòu)化描述信息忿等;
對于車輛的描述信息包括:車牌栖忠、品牌、車顏色贸街、車型庵寞、子品牌、車貼薛匪、車飾物信息等多種車輛描述信息朗溶;
對于行為的描述信息包括:區(qū)域、越界腥默、徘徊彼窥、遺留、聚集等多種行為描述信息匿微。
經(jīng)過視頻結(jié)構(gòu)化解析處理写阐,可以實(shí)現(xiàn)如下目標(biāo):
一是視頻變成了可調(diào)用的信息庫,可以針對目標(biāo)對象進(jìn)行快速檢索翎味,線索查找速度會得到極大的提升蝉择。視頻結(jié)構(gòu)化之后,從百萬量級的目標(biāo)圖庫中(大約一千小時(shí)內(nèi)的高清視頻)民逾,查找視頻截圖中的一個(gè)嫌疑人對象蛀植,一秒內(nèi)即可完成;千萬量級目標(biāo)的圖庫中查找垫凝,數(shù)秒內(nèi)即可完成填要。
二是監(jiān)控系統(tǒng)所占用存儲容量極大的降低,結(jié)構(gòu)化后的信息仔戈,存儲人的結(jié)構(gòu)化檢索信息和目標(biāo)數(shù)據(jù)信息不到原視頻數(shù)據(jù)容量的2%关串;對于車輛和行為,均不到1%监徘。存儲容量極大地降低晋修,可以解決視頻長期存儲和存儲成本高昂的問題。
三是視頻結(jié)構(gòu)化可以活化視頻數(shù)據(jù),作為數(shù)據(jù)挖掘飞蚓、應(yīng)用的基礎(chǔ)。結(jié)構(gòu)化的圖像及描述信息廊蜒,存入相應(yīng)的數(shù)據(jù)倉庫趴拧,對各類數(shù)據(jù)倉庫可以進(jìn)行深度的數(shù)據(jù)挖掘、關(guān)聯(lián)山叮、融合著榴、應(yīng)用,充分發(fā)揮大數(shù)據(jù)的作用屁倔,提升視頻監(jiān)控的應(yīng)用價(jià)值脑又,提高對視頻場景的分析和預(yù)測能力。
要素二:視頻智能分析技術(shù)
視頻結(jié)構(gòu)化描述是針對視頻內(nèi)容的智能結(jié)構(gòu)化分析蛹暗,將非結(jié)構(gòu)化的視頻數(shù)據(jù)經(jīng)過智能分析噪终,形成可供標(biāo)記描述的結(jié)構(gòu)化數(shù)據(jù),因此視頻智能化分析是視頻結(jié)構(gòu)化的核心技術(shù)坑哥。
智能視頻分析技術(shù)的高低痒蛇,對視頻結(jié)構(gòu)化描述的準(zhǔn)確率至關(guān)重要。為了能更高質(zhì)量地進(jìn)行視頻結(jié)構(gòu)化分析弦途,必須在這三個(gè)方向進(jìn)行創(chuàng)新:
首先俺下、視頻預(yù)處理技術(shù),主要包括視頻解碼抡广、圖片篩選预铁、圖片清洗等,也包括視頻防抖動(dòng)和圖像增強(qiáng)公掰。
視頻解碼把視頻還原成一張張的圖片簸翠,圖片篩選把圖片中的無用圖片進(jìn)行廢棄處理,圖片清洗保留最有效圖片肿夜;
視頻抖動(dòng)主要是道路監(jiān)控中高架安裝方式帶來的較高頻率的小幅抖動(dòng)桶求,抖動(dòng)的拍攝往往會拍出一團(tuán)糊的視頻,視頻防抖動(dòng)能有效抑制智能分析中的誤報(bào)和漏報(bào)色查,提高智能分析的準(zhǔn)確率薯演;
圖像增強(qiáng)是對視頻源進(jìn)行質(zhì)量改善處理,有效改善畫質(zhì)秧了,提高圖像的清晰度跨扮,使原本低質(zhì)量的圖像達(dá)到清晰可辨。
其次验毡,不斷提升分析準(zhǔn)確率衡创。
如人臉識別技術(shù)從最初的特征臉方法過渡到卷積神經(jīng)網(wǎng)絡(luò)方法,由可見光人臉識別到多源光人臉識別。類同璃氢,車輛哟玷、物品和行為的智能分析也有了更高效的分析技術(shù)。要不斷關(guān)注前沿AI技術(shù)的發(fā)展一也,重點(diǎn)關(guān)注實(shí)戰(zhàn)場景下的訓(xùn)練方法巢寡、模型構(gòu)建,加上大數(shù)據(jù)量的實(shí)踐椰苟,不斷提升分析識別的準(zhǔn)確率抑月,最后達(dá)到可實(shí)用的程度。
再次跷塘,影像處理技術(shù)苗鸦,主要包括圖像復(fù)原技術(shù)等。圖像復(fù)原就是綜合利用超分辨率跋共、去模糊濾波外羽、變形矯正、色彩調(diào)整等對模糊視頻進(jìn)行處理絮很,使之清晰可辨枕褂。
要素三:結(jié)構(gòu)化圖像信息數(shù)據(jù)庫
通過對視頻內(nèi)容的智能化分析處理,生成一個(gè)高密度存儲奇忆,又能快速調(diào)用的結(jié)構(gòu)化圖像信息大數(shù)據(jù)庫桌蟋。只有實(shí)現(xiàn)了對圖像庫的快速落盤,才能使結(jié)構(gòu)化信息不堵塞享处、不丟失篮踏;也只有實(shí)現(xiàn)了快速調(diào)用,才能做到千萬量級秒級檢索喝撒,也才能快速準(zhǔn)確的發(fā)現(xiàn)有效線索你踩,充分發(fā)揮視頻資源的實(shí)戰(zhàn)價(jià)值。
然而讳苦,在公安信息化建設(shè)深入開展的背景下带膜,現(xiàn)有視頻資源缺乏深度應(yīng)用的模式。其應(yīng)用的瓶頸依然是視頻信息如何高效提仍铡膝藕?如何保障識別的準(zhǔn)確率?如何進(jìn)行快速調(diào)用咐扭?如何同其他信息系統(tǒng)進(jìn)行標(biāo)準(zhǔn)數(shù)據(jù)交換芭挽、融合、共享等蝗肪。
視頻結(jié)構(gòu)化技術(shù)難點(diǎn)
首先是視頻結(jié)構(gòu)化核心算法技術(shù)的突破袜爪。
視頻結(jié)構(gòu)化描述依托于智能分析技術(shù)蠕趁,但是當(dāng)前視頻智能分析技術(shù)還未突破各種應(yīng)用環(huán)境的制約。
比如:人臉識別的應(yīng)用場景辛馆,當(dāng)下的人臉識別多半是配合式俺陋、重復(fù)式應(yīng)用場景,如:銀行昙篙、機(jī)場央垢、海關(guān)卡口。在這種應(yīng)用場景下士挽,人臉的識別率基本能達(dá)到實(shí)用要求,而在無配合碑裤、多人臉您脂、動(dòng)態(tài)視頻的場景下就很難達(dá)到實(shí)用目標(biāo)。特別是在一般視頻監(jiān)控場景下电动,由于架設(shè)位置高蛀田、拍攝距離遠(yuǎn),基本上識別不到人臉褂洽,更別說進(jìn)行人臉結(jié)構(gòu)化了乖阐。
雖然當(dāng)前的深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)模式,使得人臉檢測和識別的準(zhǔn)確度大幅提長痛祈,但是隨之而來的負(fù)面效應(yīng)也相當(dāng)明顯亦誊,首當(dāng)其沖的就是運(yùn)算復(fù)雜度的提升,需要耗費(fèi)大量的計(jì)算資源暴撼。
針對這一瓶頸傻丝,雖然業(yè)內(nèi)公司試圖通過將計(jì)算前端推移(智能攝像頭)和后端集中化處理(GPU結(jié)構(gòu)化服務(wù)器)兩種方案來解決,但是智能攝像頭方案大規(guī)模部署成本高昂诉儒,且對已安裝的巨量監(jiān)控?zé)o法結(jié)構(gòu)化葡缰。
集中化處理方案也需要大量價(jià)格昂貴的結(jié)構(gòu)化服務(wù)器,而且?guī)淼膸拤毫薮蟪婪矗膊焕谝?guī)模性實(shí)施泛释。這就需要第三種更貼合當(dāng)前實(shí)際的解決方案,報(bào)道稱由安軟慧視推出的這種方案已在部分省市公安廳公安局開始實(shí)施温算,作者已與市局進(jìn)行了聯(lián)系怜校,等詳細(xì)了解后再詳細(xì)寫出。
其次是實(shí)戰(zhàn)場景大數(shù)據(jù)和深度學(xué)習(xí)場景訓(xùn)練模型的構(gòu)建注竿。
算法韭畸、算力和數(shù)據(jù)作為AI的基本三大支撐,少了哪一個(gè)都不行蔓搞。不獲得足夠量的場景數(shù)據(jù)就訓(xùn)練不出好的模型胰丁,而沒有好的模型又不被客戶認(rèn)可,沒辦法從客戶那里獲得巨量的場景數(shù)據(jù)。
最后是視頻結(jié)構(gòu)化標(biāo)記描述數(shù)據(jù)存儲熔又,檢索和應(yīng)用技術(shù)創(chuàng)新协伴。
隨著結(jié)構(gòu)化數(shù)據(jù)總量的海量累積,如何實(shí)現(xiàn)其圖像大數(shù)據(jù)的超大容量非宝、高效存儲杨趣、高效檢索以及快速調(diào)用就需要不斷進(jìn)行技術(shù)創(chuàng)新。如果不能做到規(guī)模性實(shí)時(shí)處理實(shí)時(shí)檢索券转,它最終只能是一個(gè)事后處置系統(tǒng)凡搪,仍然會讓公安辦案失去時(shí)機(jī),對于提高破案率的效果不大樊悬。
雖然當(dāng)前還面臨不少困難轨凡,但隨著AI技術(shù)的發(fā)展和成熟,AI+安防谋哼,必然會為視頻資源的信息化文紧、情報(bào)化、智能化提供強(qiáng)有力的支撐缩铸,變視頻的被動(dòng)防御為主動(dòng)識別俭谨,變事后處置為事前事中事后全程掌控,進(jìn)而最終實(shí)現(xiàn)“AI+安防”的規(guī)模性落地径筏。