然而近零,這個優(yōu)勢也將失去了。
近幾年抄肖,Alphago久信、視頻識別、指紋解鎖漓摩、圖片識別裙士、語音轉文字、機器人看病等一系列事件管毙,使我們深刻的感受到人工智能在改變我們的工作方式和認知腿椎。國內(nèi)人工智能產(chǎn)業(yè)中,就算集視覺與圖像領域公司的數(shù)量已達數(shù)百家夭咬,僅次于自然語言處理類公司啃炸,位居第二。其中該領域最為出名的創(chuàng)業(yè)公司包括曠世科技Face++卓舵、商湯科技肮帐、極鏈科技Video++等。
一百多年前番搅,電改變了生產(chǎn)代徒、交通和農(nóng)業(yè)等產(chǎn)業(yè),而今天瘸拳,人工智能也像電一樣將改變傳統(tǒng)產(chǎn)業(yè)昔黍。人臉識別和圖片識別是人工智能視覺與圖像領域中的兩大熱門應用穗俩。但將人工智能技術單純用于圖片識別分析的應用企業(yè)數(shù)量并不如預想的多,可能有以下幾個方面的原因:目前視頻監(jiān)控方面的盈利空間大伴糟,眾多企業(yè)的注意力都放在了視頻監(jiān)控領域熏祝,人臉識別屬于圖片識別的一個應用場景,做人臉識別的大多數(shù)企業(yè)同時也在提供圖片識別服務壮焰,但是銷售效果不佳们眶,主要贏利點還在于人臉識別等。
識別物體是圖片分類的另一個比較常見的應用费武,例如一個簡單的手機識別模型嘶违,我們首先要給計算機定義模型,然后準備大量手機的照片去訓練這個模型耽翁,讓計算機能識別出來旭贬,輸一張圖片的時候能識別出圖片是不是手機。正常情況下計算機模型能識別得比較準確搪泳,但是當我們輸入了一些有遮擋稀轨、形態(tài)多變或者角度多變、光照不易的圖片時岸军,之前我們建立的模型就識別不出來了奋刽。這就是計算機視覺在應用中尋在的難點問題。機器學習的本質(zhì)其實就是為了找到一個函數(shù)艰赞,讓這個函數(shù)在不同領域發(fā)揮不同的作用佣谐,像語音識別領域,這個函數(shù)會把一段語音識別成一段文字猖毫。圖像識別的領域台谍,這個函數(shù)會把一個圖像映射到一個分類须喂。
進入21世紀吁断,計算機視覺與計算機圖形學的相互影響日益加深,基于圖像的繪制成為研究熱點坞生,高效求解復雜全局優(yōu)化問題的算法得到發(fā)展仔役。到現(xiàn)在,通過技術迭代更新和機器學習翁写,物體的識別率也已經(jīng)達到了相當高的水平惠所。像是極鏈科技Video++自主開發(fā)的文娛人工智能系統(tǒng)「VideoAI」已實現(xiàn)場景、物體汰检、人臉更掺、品牌、表情何杈、動作拴挫、地標默峦、視覺特征檢索8大維度的數(shù)據(jù)結構化,同步生成軌跡流數(shù)據(jù)揩榴,通過復合推薦算法將元素信息升級為情景信息袱类,直接賦能各種商業(yè)化場景。
(圖片來源自網(wǎng)絡柱爵,如有侵權趣匪,請聯(lián)系刪除。)
通過SAS針對企業(yè)人工智能的調(diào)研報告可以看出晒来,大部分企業(yè)認為人工智能還處于初期階段钞诡,但我們也可以發(fā)現(xiàn),正在部署的大量應用場景都包含AI板塊潜索。顯而易見我們必須學習新的技能來配合AI的發(fā)展臭增,未來也是屬于意識到這一點并立即發(fā)展的企業(yè)。機器的每一點進步都依賴于不斷模擬和接近人腦的水平竹习,提升AI在場景應用上的工程能力誊抛,會為生活帶來更多的便利。