還記得上月昼牛,海康威視研究院預(yù)研團(tuán)隊(duì)基于深度學(xué)習(xí)技術(shù)研發(fā)的OCR(Optical Character Recognition康聂,圖像中文字識(shí)別)技術(shù)贰健,在ICDARRobust Reading競賽數(shù)據(jù)集競賽中刷新全球最好成績,并在“互聯(lián)網(wǎng)圖像文字”早抠、“對焦自然場景文字”和“隨拍自然場景文字”三項(xiàng)挑戰(zhàn)的文字識(shí)別(Word Recognition)任務(wù)中獲得第一嗎霎烙?《海康威視深度學(xué)習(xí)“文字識(shí)別技術(shù)”國際競賽中獲第一》
安防OCR技術(shù)實(shí)力彰顯 市場應(yīng)用其實(shí)很廣
借助先進(jìn)的OCR技術(shù)蕊连,盒康威視的文字識(shí)別系統(tǒng)能夠應(yīng)對更為復(fù)雜文字識(shí)別場景,如污損及模糊甘苍、背景干擾及形變尝蠕、惡劣天氣等。目前载庭,基于全新OCR技術(shù)的嚎幢耍康威視車牌識(shí)別系統(tǒng)已經(jīng)覆蓋全球六十余個(gè)國家和地區(qū)∏艟郏基于車牌識(shí)別技術(shù)的卡口靖榕、電子警察、出入口控制乃倔、停車系統(tǒng)等應(yīng)用也已經(jīng)全面鋪開翎襟。
這里是不是有人要問OCR技術(shù)是個(gè)什么?小編這就先科普下:OCR 技術(shù)是通過識(shí)別軟件將圖像中的文字轉(zhuǎn)換成文本格式镊僚,供文字處理軟件進(jìn)一步編輯加工的技術(shù)寿针。具體的說,OCR意為光學(xué)字符識(shí)別镰钦,即自動(dòng)識(shí)別通過掃描儀径卜、數(shù)碼相機(jī)、攝像機(jī)等得到的圖像中的文字(含字符)或書寫在紙面上的文字箫驻,便于存儲(chǔ)芽茄、編輯和檢索。
事實(shí)上寺帽,OCR智能識(shí)別技術(shù)還可以進(jìn)行細(xì)分俱篡,下面介紹下幾種OCR智能識(shí)別技術(shù)。
1.證件OC識(shí)別
此類最開始是基于PC的,近幾年開始向移動(dòng)端發(fā)展颤枪,主要有android汗捡,ios平臺(tái)的SDK,目前成熟的有身份證識(shí)別畏纲,行駛證識(shí)別扇住,駕駛證識(shí)別,護(hù)照識(shí)別等盗胀。
2.銀行卡OCR識(shí)別
此類技術(shù)是2014年以后開始興起的技術(shù)艘蹋,主要用于移動(dòng)支付綁卡,是一項(xiàng)非常有技術(shù)含量的細(xì)分OCR技術(shù)票灰,目前有一些APP已經(jīng)在用女阀,如拉卡拉,宜人貸屑迂,支付寶浸策,微信等。
3.名片OCR識(shí)別
這一類技術(shù)也非常成熟了惹盼,目前市場上名片管理的APP也非常多庸汗,多半已經(jīng)使用這類技術(shù)。
4.文檔OCR識(shí)別
其實(shí)OCR最早的時(shí)候就是主要識(shí)別文檔诅鹰,主要針對圖書也隧,報(bào)刊等,把這些紙質(zhì)文檔進(jìn)行電子化笋骡。但這類技術(shù)主要是借助在掃描儀的基礎(chǔ)上得到快速發(fā)展絮商,目前識(shí)別率也非常高。移動(dòng)端的文檔OCR識(shí)別叮盲,近幾年也有不少成功的應(yīng)用榛蜻。
5.票據(jù)類OCR識(shí)別
這類技術(shù)主要是針對各種不同格式的票據(jù),主要基于模板機(jī)制翁漠,需要針對不同的票據(jù),定制不同的識(shí)別要素妻行,這項(xiàng)技術(shù)也稱要素識(shí)別OCR舆焕,最早的其實(shí)運(yùn)用的是銀行行業(yè),主要在銀行的后督中汉疮,有非常成功的應(yīng)用棍详。
6.手寫OCR識(shí)別
其實(shí)手寫OCR可以分為兩類,一類是書面手寫的識(shí)別丛剿,這類技術(shù)沒有得到很好的應(yīng)用冒萄,只有是因?yàn)槊總€(gè)人的手寫習(xí)慣不太一樣。目前能識(shí)別好是手寫的數(shù)字和字母,因?yàn)檫@些差異不會(huì)太大尊流,手寫的漢子帅戒,難度還是非常大的。第二類是聯(lián)機(jī)手寫技術(shù):聯(lián)機(jī)手寫技術(shù)得到了非常好的應(yīng)用崖技,各種手寫輸入法逻住,都是基于這個(gè)技術(shù)∮祝可能有些人會(huì)問瞎访,同時(shí)手寫OCR智能識(shí)別技術(shù),為了聯(lián)機(jī)手寫識(shí)別的非常好吁恍,其實(shí)有兩點(diǎn)扒秸,一是聯(lián)機(jī)手寫是單字識(shí)別,不用做切分冀瓦,OCR里最難的不是比對識(shí)別伴奥,而是字符切分。二是因?yàn)槁?lián)機(jī)手寫技術(shù)是單字選擇因摸,有人進(jìn)行判斷蜗南。所以應(yīng)用的非常廣。
7.車牌OCR識(shí)別
車牌識(shí)別技術(shù)相信大家都不會(huì)覺得陌生侦滩,智能交通饰测,小區(qū)停車場等,都有很好的應(yīng)用假祝,車牌識(shí)別的原理其實(shí)技術(shù)對車牌進(jìn)行OCR識(shí)別靡庵,再進(jìn)行比對的過程。也是相當(dāng)成熟的技術(shù)虎内。
目前燕汗,人工智能蓬勃發(fā)展,OCR作為AI黑技術(shù)的重要組成部分已經(jīng)深深融入人們的日常生活工作當(dāng)中诅挖。以當(dāng)下最流行的身份證識(shí)別為例枣惨,最簡單的描述它的工作流程包括,圖像的采集輸入虚烂、圖像預(yù)處理邮敛、圖像文字的分割與識(shí)別、信息關(guān)鍵詞歸屬的判斷和處理歉摧,以及OCR識(shí)別信息的輸出艇肴。在這五大模塊中,圖像的文字分割與識(shí)別作為核心技術(shù)在開源的OCR中叁温,作為一個(gè)技術(shù)開發(fā)新人再悼,無法從開源的OCR內(nèi)獲取到有用的算法或代碼核畴。例如谷歌的OCR開源項(xiàng)目,Tesseract-OCR需要通過復(fù)雜的配置和訓(xùn)練方式才有可能接近自己想要的結(jié)果冲九。冗余的代碼讓工程師在代碼熟悉階段就對OCR技術(shù)望而怯步谤草。
其實(shí)仔細(xì)觀察,我們會(huì)發(fā)現(xiàn)OCR識(shí)別技術(shù)在身邊生活中隨處可見娘侍,比如網(wǎng)上購物手機(jī)充值要用移動(dòng)支付咖刃、理財(cái)貸款要找互聯(lián)網(wǎng)金融、轉(zhuǎn)賬要用手機(jī)銀行憾筏、股票開戶要用證券移動(dòng)嚎杨、公司票據(jù)信息錄入存檔等,在這些業(yè)務(wù)里你會(huì)發(fā)現(xiàn)很多環(huán)節(jié)都已經(jīng)用到了OCR技術(shù)氧腰,在錄入身份證和銀行卡證件或發(fā)票等票據(jù)信息時(shí)現(xiàn)在不需要再手動(dòng)輸入枫浙,通過OCR識(shí)別,信息就會(huì)自動(dòng)識(shí)別并錄入存檔三钦,速度快而且準(zhǔn)確度提升很多尼缨。
隨著未來業(yè)務(wù)流程的自動(dòng)化、智能化和多樣化趨勢做堂,OCR識(shí)別將會(huì)被更廣泛應(yīng)用综货,很多場景會(huì)實(shí)現(xiàn)操作的實(shí)時(shí)識(shí)別錄入存檔,屆時(shí)人們將真正感受到智能化生活所帶來的便利虽趋,看到人工智能時(shí)代發(fā)展將收獲跨越式的發(fā)展螃势。
安防OCR技術(shù)實(shí)力彰顯 市場應(yīng)用其實(shí)很廣
借助先進(jìn)的OCR技術(shù)蕊连,盒康威視的文字識(shí)別系統(tǒng)能夠應(yīng)對更為復(fù)雜文字識(shí)別場景,如污損及模糊甘苍、背景干擾及形變尝蠕、惡劣天氣等。目前载庭,基于全新OCR技術(shù)的嚎幢耍康威視車牌識(shí)別系統(tǒng)已經(jīng)覆蓋全球六十余個(gè)國家和地區(qū)∏艟郏基于車牌識(shí)別技術(shù)的卡口靖榕、電子警察、出入口控制乃倔、停車系統(tǒng)等應(yīng)用也已經(jīng)全面鋪開翎襟。
這里是不是有人要問OCR技術(shù)是個(gè)什么?小編這就先科普下:OCR 技術(shù)是通過識(shí)別軟件將圖像中的文字轉(zhuǎn)換成文本格式镊僚,供文字處理軟件進(jìn)一步編輯加工的技術(shù)寿针。具體的說,OCR意為光學(xué)字符識(shí)別镰钦,即自動(dòng)識(shí)別通過掃描儀径卜、數(shù)碼相機(jī)、攝像機(jī)等得到的圖像中的文字(含字符)或書寫在紙面上的文字箫驻,便于存儲(chǔ)芽茄、編輯和檢索。
事實(shí)上寺帽,OCR智能識(shí)別技術(shù)還可以進(jìn)行細(xì)分俱篡,下面介紹下幾種OCR智能識(shí)別技術(shù)。
1.證件OC識(shí)別
此類最開始是基于PC的,近幾年開始向移動(dòng)端發(fā)展颤枪,主要有android汗捡,ios平臺(tái)的SDK,目前成熟的有身份證識(shí)別畏纲,行駛證識(shí)別扇住,駕駛證識(shí)別,護(hù)照識(shí)別等盗胀。
2.銀行卡OCR識(shí)別
此類技術(shù)是2014年以后開始興起的技術(shù)艘蹋,主要用于移動(dòng)支付綁卡,是一項(xiàng)非常有技術(shù)含量的細(xì)分OCR技術(shù)票灰,目前有一些APP已經(jīng)在用女阀,如拉卡拉,宜人貸屑迂,支付寶浸策,微信等。
3.名片OCR識(shí)別
這一類技術(shù)也非常成熟了惹盼,目前市場上名片管理的APP也非常多庸汗,多半已經(jīng)使用這類技術(shù)。
4.文檔OCR識(shí)別
其實(shí)OCR最早的時(shí)候就是主要識(shí)別文檔诅鹰,主要針對圖書也隧,報(bào)刊等,把這些紙質(zhì)文檔進(jìn)行電子化笋骡。但這類技術(shù)主要是借助在掃描儀的基礎(chǔ)上得到快速發(fā)展絮商,目前識(shí)別率也非常高。移動(dòng)端的文檔OCR識(shí)別叮盲,近幾年也有不少成功的應(yīng)用榛蜻。
5.票據(jù)類OCR識(shí)別
這類技術(shù)主要是針對各種不同格式的票據(jù),主要基于模板機(jī)制翁漠,需要針對不同的票據(jù),定制不同的識(shí)別要素妻行,這項(xiàng)技術(shù)也稱要素識(shí)別OCR舆焕,最早的其實(shí)運(yùn)用的是銀行行業(yè),主要在銀行的后督中汉疮,有非常成功的應(yīng)用棍详。
6.手寫OCR識(shí)別
其實(shí)手寫OCR可以分為兩類,一類是書面手寫的識(shí)別丛剿,這類技術(shù)沒有得到很好的應(yīng)用冒萄,只有是因?yàn)槊總€(gè)人的手寫習(xí)慣不太一樣。目前能識(shí)別好是手寫的數(shù)字和字母,因?yàn)檫@些差異不會(huì)太大尊流,手寫的漢子帅戒,難度還是非常大的。第二類是聯(lián)機(jī)手寫技術(shù):聯(lián)機(jī)手寫技術(shù)得到了非常好的應(yīng)用崖技,各種手寫輸入法逻住,都是基于這個(gè)技術(shù)∮祝可能有些人會(huì)問瞎访,同時(shí)手寫OCR智能識(shí)別技術(shù),為了聯(lián)機(jī)手寫識(shí)別的非常好吁恍,其實(shí)有兩點(diǎn)扒秸,一是聯(lián)機(jī)手寫是單字識(shí)別,不用做切分冀瓦,OCR里最難的不是比對識(shí)別伴奥,而是字符切分。二是因?yàn)槁?lián)機(jī)手寫技術(shù)是單字選擇因摸,有人進(jìn)行判斷蜗南。所以應(yīng)用的非常廣。
7.車牌OCR識(shí)別
車牌識(shí)別技術(shù)相信大家都不會(huì)覺得陌生侦滩,智能交通饰测,小區(qū)停車場等,都有很好的應(yīng)用假祝,車牌識(shí)別的原理其實(shí)技術(shù)對車牌進(jìn)行OCR識(shí)別靡庵,再進(jìn)行比對的過程。也是相當(dāng)成熟的技術(shù)虎内。
目前燕汗,人工智能蓬勃發(fā)展,OCR作為AI黑技術(shù)的重要組成部分已經(jīng)深深融入人們的日常生活工作當(dāng)中诅挖。以當(dāng)下最流行的身份證識(shí)別為例枣惨,最簡單的描述它的工作流程包括,圖像的采集輸入虚烂、圖像預(yù)處理邮敛、圖像文字的分割與識(shí)別、信息關(guān)鍵詞歸屬的判斷和處理歉摧,以及OCR識(shí)別信息的輸出艇肴。在這五大模塊中,圖像的文字分割與識(shí)別作為核心技術(shù)在開源的OCR中叁温,作為一個(gè)技術(shù)開發(fā)新人再悼,無法從開源的OCR內(nèi)獲取到有用的算法或代碼核畴。例如谷歌的OCR開源項(xiàng)目,Tesseract-OCR需要通過復(fù)雜的配置和訓(xùn)練方式才有可能接近自己想要的結(jié)果冲九。冗余的代碼讓工程師在代碼熟悉階段就對OCR技術(shù)望而怯步谤草。
其實(shí)仔細(xì)觀察,我們會(huì)發(fā)現(xiàn)OCR識(shí)別技術(shù)在身邊生活中隨處可見娘侍,比如網(wǎng)上購物手機(jī)充值要用移動(dòng)支付咖刃、理財(cái)貸款要找互聯(lián)網(wǎng)金融、轉(zhuǎn)賬要用手機(jī)銀行憾筏、股票開戶要用證券移動(dòng)嚎杨、公司票據(jù)信息錄入存檔等,在這些業(yè)務(wù)里你會(huì)發(fā)現(xiàn)很多環(huán)節(jié)都已經(jīng)用到了OCR技術(shù)氧腰,在錄入身份證和銀行卡證件或發(fā)票等票據(jù)信息時(shí)現(xiàn)在不需要再手動(dòng)輸入枫浙,通過OCR識(shí)別,信息就會(huì)自動(dòng)識(shí)別并錄入存檔三钦,速度快而且準(zhǔn)確度提升很多尼缨。
隨著未來業(yè)務(wù)流程的自動(dòng)化、智能化和多樣化趨勢做堂,OCR識(shí)別將會(huì)被更廣泛應(yīng)用综货,很多場景會(huì)實(shí)現(xiàn)操作的實(shí)時(shí)識(shí)別錄入存檔,屆時(shí)人們將真正感受到智能化生活所帶來的便利虽趋,看到人工智能時(shí)代發(fā)展將收獲跨越式的發(fā)展螃势。