細(xì)究起來(lái),不是技術(shù)問(wèn)題偶屯,高精尖技術(shù)國(guó)內(nèi)基本上可以與美國(guó)保持同步光丢,國(guó)內(nèi)團(tuán)隊(duì)奪得國(guó)際比賽的成績(jī)單光明耀眼;不是人才問(wèn)題冶习,頂尖的國(guó)際人才流動(dòng)比比皆是镰掐。更不是制造能力問(wèn)題,中國(guó)的監(jiān)控設(shè)備制造商制造了世界六成還多的設(shè)備琐幔,可能有的小伙伴會(huì)說(shuō)是對(duì)行業(yè)的理解度問(wèn)題炸诚。
不可否認(rèn),這是個(gè)重要因素为稽,但對(duì)大規(guī)模落地“安防+AI”的關(guān)鍵要素認(rèn)知可能是個(gè)更關(guān)鍵的問(wèn)題碗屏。
當(dāng)前視頻監(jiān)控的應(yīng)用現(xiàn)狀
從2004年以來(lái)的平安城市,天網(wǎng)工程疑苔,雪亮工程甫匹,經(jīng)過(guò)十多年的建設(shè),全國(guó)各省市乃至鄉(xiāng)村夯巷,都建起了大規(guī)模的視頻監(jiān)控系統(tǒng)赛惩。
據(jù)不完全統(tǒng)計(jì),目前全國(guó)已建各類監(jiān)控近2億路趁餐,加上在建的和待建的喷兼,至少規(guī)模會(huì)翻翻。隨之而來(lái)的是天量級(jí)視頻文件后雷,即使配備數(shù)百萬(wàn)視頻巡視員來(lái)看視頻季惯,每天能監(jiān)控到的視頻大概也不到總視頻量的百分之一。
但是這些天量的視頻數(shù)據(jù)臀突,在社會(huì)公共安全管理和案件偵破等工作中勉抓,起著越來(lái)越重要的作用。在公共安全信息化建設(shè)深入持續(xù)開展的背景下候学,現(xiàn)有視頻系統(tǒng)缺乏深度應(yīng)用模式藕筋,視頻數(shù)據(jù)智能化程度不高的問(wèn)題不斷凸顯。如何用AI升級(jí)現(xiàn)有的視頻系統(tǒng)呕摹,使之能更好地適應(yīng)物聯(lián)網(wǎng)時(shí)代視頻智能化蒂抒、信息化、情報(bào)化的應(yīng)用需求已勢(shì)在必行二搀。
當(dāng)前小規(guī)模落地安防+AI先兆,已經(jīng)不是難題肢箕,智能攝像頭或者結(jié)構(gòu)化服務(wù)器就能解決這個(gè)問(wèn)題。
城市級(jí)的安防+AI中的落地要素:
要素一:視頻結(jié)構(gòu)化
要實(shí)現(xiàn)視頻信息智能化爵例、信息化的問(wèn)題牲支,必須要先面對(duì)結(jié)構(gòu)化的問(wèn)題,結(jié)構(gòu)化之后就可以把原來(lái)只能看無(wú)法調(diào)用的視頻變成可調(diào)用的信息豌淹。迎接視頻數(shù)據(jù)深度應(yīng)用的挑戰(zhàn)窥血,其核心及瓶頸是通過(guò)研究視頻結(jié)構(gòu)化描述技術(shù),解決通用視頻數(shù)據(jù)向視頻信息化女饺、視頻情報(bào)化方向的轉(zhuǎn)化纹怨,實(shí)現(xiàn)社會(huì)公共安全視頻應(yīng)用工作模式的創(chuàng)新磨爪。
視頻結(jié)構(gòu)化描述是一種基于視頻內(nèi)容信息提取的技術(shù)儒恋,它對(duì)視頻內(nèi)容按照語(yǔ)義關(guān)系,采用時(shí)空分割黔漂、特征提取诫尽、對(duì)象識(shí)別等處理手段,組織成可供計(jì)算機(jī)和人類理解的結(jié)構(gòu)化信息的技術(shù)炬守。
從數(shù)據(jù)處理的流程看牧嫉,視頻結(jié)構(gòu)化描述技術(shù),能夠?qū)⒎墙Y(jié)構(gòu)化的視頻數(shù)據(jù)轉(zhuǎn)化為人和機(jī)器可理解的結(jié)構(gòu)化信息减途,并進(jìn)一步轉(zhuǎn)化為公安民警實(shí)戰(zhàn)所用的情報(bào)數(shù)據(jù)酣藻,實(shí)現(xiàn)視頻數(shù)據(jù)向信息化、情報(bào)化鳍置、智能化的應(yīng)用轉(zhuǎn)化辽剧,達(dá)到借用視頻監(jiān)控掌控安全的目的。
視頻結(jié)構(gòu)化描述的內(nèi)容類型方面主要是:人員税产、車輛怕轿、物品、行為辟拷。
在視頻中把人作為一個(gè)可描述的個(gè)體展現(xiàn)出來(lái)撞羽,其中包括人員的臉部精準(zhǔn)定位、臉部特征提取卒亩、臉部特征比對(duì)蚀攘,還包括人員的性別、年齡范圍划万、大概身高嘴略、衣著特征、發(fā)飾特征息体、配飾囊脉、攜帶物品瑰兄、步履形態(tài)、交通工具等多種可結(jié)構(gòu)化描述信息屉争;
對(duì)于車輛的描述信息包括:車牌锤距、品牌、車顏色檩讯、車型脸夜、子品牌、車貼干跛、車飾物信息等多種車輛描述信息子姜;
對(duì)于行為的描述信息包括:區(qū)域、越界楼入、徘徊哥捕、遺留、聚集等多種行為描述信息嘉熊。
經(jīng)過(guò)視頻結(jié)構(gòu)化解析處理遥赚,可以實(shí)現(xiàn)如下目標(biāo):
一是視頻變成了可調(diào)用的信息庫(kù),可以針對(duì)目標(biāo)對(duì)象進(jìn)行快速檢索阐肤,線索查找速度會(huì)得到極大的提升凫佛。視頻結(jié)構(gòu)化之后,從百萬(wàn)量級(jí)的目標(biāo)圖庫(kù)中(大約一千小時(shí)內(nèi)的高清視頻)孕惜,查找視頻截圖中的一個(gè)嫌疑人對(duì)象愧薛,一秒內(nèi)即可完成;千萬(wàn)量級(jí)目標(biāo)的圖庫(kù)中查找衫画,數(shù)秒內(nèi)即可完成毫炉。
二是監(jiān)控系統(tǒng)所占用存儲(chǔ)容量極大的降低,結(jié)構(gòu)化后的信息楚餐,存儲(chǔ)人的結(jié)構(gòu)化檢索信息和目標(biāo)數(shù)據(jù)信息不到原視頻數(shù)據(jù)容量的2%斤卒;對(duì)于車輛和行為,均不到1%撇扯。存儲(chǔ)容量極大地降低囚誓,可以解決視頻長(zhǎng)期存儲(chǔ)和存儲(chǔ)成本高昂的問(wèn)題。
三是視頻結(jié)構(gòu)化可以活化視頻數(shù)據(jù)见撵,作為數(shù)據(jù)挖掘启孔、應(yīng)用的基礎(chǔ)。結(jié)構(gòu)化的圖像及描述信息薪尉,存入相應(yīng)的數(shù)據(jù)倉(cāng)庫(kù)键羡,對(duì)各類數(shù)據(jù)倉(cāng)庫(kù)可以進(jìn)行深度的數(shù)據(jù)挖掘、關(guān)聯(lián)凡加、融合慰奉、應(yīng)用销泽,充分發(fā)揮大數(shù)據(jù)的作用,提升視頻監(jiān)控的應(yīng)用價(jià)值证森,提高對(duì)視頻場(chǎng)景的分析和預(yù)測(cè)能力辰令。
要素二:視頻智能分析技術(shù)
視頻結(jié)構(gòu)化描述是針對(duì)視頻內(nèi)容的智能結(jié)構(gòu)化分析,將非結(jié)構(gòu)化的視頻數(shù)據(jù)經(jīng)過(guò)智能分析节值,形成可供標(biāo)記描述的結(jié)構(gòu)化數(shù)據(jù)徙硅,因此視頻智能化分析是視頻結(jié)構(gòu)化的核心技術(shù)。
智能視頻分析技術(shù)的高低搞疗,對(duì)視頻結(jié)構(gòu)化描述的準(zhǔn)確率至關(guān)重要嗓蘑。為了能更高質(zhì)量地進(jìn)行視頻結(jié)構(gòu)化分析,必須在這三個(gè)方向進(jìn)行創(chuàng)新:
首先匿乃、視頻預(yù)處理技術(shù)桩皿,主要包括視頻解碼、圖片篩選扳埂、圖片清洗等业簿,也包括視頻防抖動(dòng)和圖像增強(qiáng)瘤礁。
視頻解碼把視頻還原成一張張的圖片阳懂,圖片篩選把圖片中的無(wú)用圖片進(jìn)行廢棄處理,圖片清洗保留最有效圖片柜思;
視頻抖動(dòng)主要是道路監(jiān)控中高架安裝方式帶來(lái)的較高頻率的小幅抖動(dòng)岩调,抖動(dòng)的拍攝往往會(huì)拍出一團(tuán)糊的視頻,視頻防抖動(dòng)能有效抑制智能分析中的誤報(bào)和漏報(bào)触擎,提高智能分析的準(zhǔn)確率沛狱;
圖像增強(qiáng)是對(duì)視頻源進(jìn)行質(zhì)量改善處理,有效改善畫質(zhì)博旬,提高圖像的清晰度尤乎,使原本低質(zhì)量的圖像達(dá)到清晰可辨。
其次剪妥,不斷提升分析準(zhǔn)確率波寓。
如人臉識(shí)別技術(shù)從最初的特征臉?lè)椒ㄟ^(guò)渡到卷積神經(jīng)網(wǎng)絡(luò)方法,由可見光人臉識(shí)別到多源光人臉識(shí)別蝇居。類同报逛,車輛、物品和行為的智能分析也有了更高效的分析技術(shù)刮锹。要不斷關(guān)注前沿AI技術(shù)的發(fā)展任疤,重點(diǎn)關(guān)注實(shí)戰(zhàn)場(chǎng)景下的訓(xùn)練方法、模型構(gòu)建惯狠,加上大數(shù)據(jù)量的實(shí)踐丙图,不斷提升分析識(shí)別的準(zhǔn)確率刮便,最后達(dá)到可實(shí)用的程度。
再次绽慈,影像處理技術(shù)诺核,主要包括圖像復(fù)原技術(shù)等。圖像復(fù)原就是綜合利用超分辨率久信、去模糊濾波窖杀、變形矯正、色彩調(diào)整等對(duì)模糊視頻進(jìn)行處理裙士,使之清晰可辨入客。
要素三:結(jié)構(gòu)化圖像信息數(shù)據(jù)庫(kù)
通過(guò)對(duì)視頻內(nèi)容的智能化分析處理,生成一個(gè)高密度存儲(chǔ)腿椎,又能快速調(diào)用的結(jié)構(gòu)化圖像信息大數(shù)據(jù)庫(kù)桌硫。只有實(shí)現(xiàn)了對(duì)圖像庫(kù)的快速落盤,才能使結(jié)構(gòu)化信息不堵塞啃炸、不丟失铆隘;也只有實(shí)現(xiàn)了快速調(diào)用,才能做到千萬(wàn)量級(jí)秒級(jí)檢索南用,也才能快速準(zhǔn)確的發(fā)現(xiàn)有效線索膀钠,充分發(fā)揮視頻資源的實(shí)戰(zhàn)價(jià)值。
然而末径,在公安信息化建設(shè)深入開展的背景下俺媳,現(xiàn)有視頻資源缺乏深度應(yīng)用的模式。其應(yīng)用的瓶頸依然是視頻信息如何高效提热庾亍驮桐?如何保障識(shí)別的準(zhǔn)確率?如何進(jìn)行快速調(diào)用披腻?如何同其他信息系統(tǒng)進(jìn)行標(biāo)準(zhǔn)數(shù)據(jù)交換寝丹、融合、共享等唱撩。
視頻結(jié)構(gòu)化技術(shù)難點(diǎn)
首先是視頻結(jié)構(gòu)化核心算法技術(shù)的突破肩堡。視頻結(jié)構(gòu)化描述依托于智能分析技術(shù),但是當(dāng)前視頻智能分析技術(shù)還未突破各種應(yīng)用環(huán)境的制約费武。
比如:人臉識(shí)別的應(yīng)用場(chǎng)景嘶违,當(dāng)下的人臉識(shí)別多半是配合式、重復(fù)式應(yīng)用場(chǎng)景耽翁,如:銀行旭贬、機(jī)場(chǎng)、海關(guān)卡口。在這種應(yīng)用場(chǎng)景下稀轨,人臉的識(shí)別率基本能達(dá)到實(shí)用要求扼脐,而在無(wú)配合、多人臉奋刽、動(dòng)態(tài)視頻的場(chǎng)景下就很難達(dá)到實(shí)用目標(biāo)瓦侮。特別是在一般視頻監(jiān)控場(chǎng)景下,由于架設(shè)位置高佣谐、拍攝距離遠(yuǎn)肚吏,基本上識(shí)別不到人臉,更別說(shuō)進(jìn)行人臉結(jié)構(gòu)化了狭魂。
雖然當(dāng)前的深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)模式罚攀,使得人臉檢測(cè)和識(shí)別的準(zhǔn)確度大幅提長(zhǎng),但是隨之而來(lái)的負(fù)面效應(yīng)也相當(dāng)明顯雌澄,首當(dāng)其沖的就是運(yùn)算復(fù)雜度的提升斋泄,需要耗費(fèi)大量的計(jì)算資源。
針對(duì)這一瓶頸略雪,雖然業(yè)內(nèi)公司試圖通過(guò)將計(jì)算前端推移(智能攝像頭)和后端集中化處理(GPU結(jié)構(gòu)化服務(wù)器)兩種方案來(lái)解決癌蚂,但是智能攝像頭方案大規(guī)模部署成本高昂,且對(duì)已安裝的巨量監(jiān)控?zé)o法結(jié)構(gòu)化摩赎。
集中化處理方案也需要大量?jī)r(jià)格昂貴的結(jié)構(gòu)化服務(wù)器在策,而且?guī)?lái)的帶寬壓力巨大,也不利于規(guī)模性實(shí)施锄垛。這就需要第三種更貼合當(dāng)前實(shí)際的解決方案何杈,報(bào)道稱由安軟慧視推出的這種方案已在部分省市公安廳公安局開始實(shí)施,作者已與市局進(jìn)行了聯(lián)系默峦,等詳細(xì)了解后再詳細(xì)寫出。
其次是實(shí)戰(zhàn)場(chǎng)景大數(shù)據(jù)和深度學(xué)習(xí)場(chǎng)景訓(xùn)練模型的構(gòu)建揩榴。算法袱类、算力和數(shù)據(jù)作為AI的基本三大支撐,少了哪一個(gè)都不行柱爵。不獲得足夠量的場(chǎng)景數(shù)據(jù)就訓(xùn)練不出好的模型趣匪,而沒有好的模型又不被客戶認(rèn)可,沒辦法從客戶那里獲得巨量的場(chǎng)景數(shù)據(jù)晒来。
最后是視頻結(jié)構(gòu)化標(biāo)記描述數(shù)據(jù)存儲(chǔ)钞诡,檢索和應(yīng)用技術(shù)創(chuàng)新。隨著結(jié)構(gòu)化數(shù)據(jù)總量的海量累積湃崩,如何實(shí)現(xiàn)其圖像大數(shù)據(jù)的超大容量荧降、高效存儲(chǔ)、高效檢索以及快速調(diào)用就需要不斷進(jìn)行技術(shù)創(chuàng)新。如果不能做到規(guī)模性實(shí)時(shí)處理實(shí)時(shí)檢索朵诫,它最終只能是一個(gè)事后處置系統(tǒng)辛友,仍然會(huì)讓公安辦案失去時(shí)機(jī),對(duì)于提高破案率的效果不大剪返。
雖然當(dāng)前還面臨不少困難废累,但隨著AI技術(shù)的發(fā)展和成熟,AI+安防脱盲,必然會(huì)為視頻資源的信息化邑滨、情報(bào)化、智能化提供強(qiáng)有力的支撐钱反,變視頻的被動(dòng)防御為主動(dòng)識(shí)別驼修,變事后處置為事前事中事后全程掌控,進(jìn)而最終實(shí)現(xiàn)“AI+安防”的規(guī)模性落地卸橘。