大華股份在人工智能的核心技術(shù)領(lǐng)域持續(xù)耕耘刷桐,不斷提升智能算法粥谐、算力的核心競爭力。這是大華股份繼取得字符識別痛只、場景流識別漾群、目標跟蹤、2D目標檢測漱竖、行人重識別等多項國際競賽第一之后禽篱,再次在3D目標檢測領(lǐng)域取得突破。
(圖片來源自網(wǎng)絡(luò)馍惹,如有侵權(quán)躺率,請聯(lián)系刪除。)
源自:http://www.cvlibs.net/datasets/kitti/eval_object.php?obj_benchmark=3d
關(guān)于KITTI:
KITTI數(shù)據(jù)集由德國卡爾斯魯厄理工學(xué)院和豐田美國技術(shù)研究院聯(lián)合創(chuàng)辦万矾,是目前國際上最大的計算機視覺算法評測數(shù)據(jù)集之一悼吱。數(shù)據(jù)集用于評測立體匹配(stereo)、光流(flow)良狈、場景流(sceneflow)后添、視覺里程計(visual odometry)、物體檢測(object detection)和跟蹤(tracking)们颜、道路分割(road)吕朵、語義分割(semantics)等計算機視覺技術(shù)的性能。KITTI包含市區(qū)窥突、鄉(xiāng)村和高速公路等場景采集的真實圖像數(shù)據(jù),每張圖像中最多包含15輛車和30個行人硫嘶,且存在不同程度的遮擋與截斷阻问。
3D目標檢測是自動駕駛領(lǐng)域的核心技術(shù)之一,自動駕駛的汽車需要實時檢測周圍所有交通參與者纤厨,包括機動車族逻、非機動車、行人守镰,并準確地檢測出各個目標的位置崎络、大小和運動方向。由于2D圖像缺少深度信息猖右,難以準確地估計目標的距離颗酷,加上天氣、光照稽橱、陰影等因素的影響戏丽,基于視覺的2D目標檢測技術(shù)難以應(yīng)對復(fù)雜的道路環(huán)境,因此自動駕駛技術(shù)中主要依靠基于雷達設(shè)備所采集的點云數(shù)據(jù)進行3D目標檢測,同時采用基于2D的圖像識別技術(shù)提高3D目標檢測的準確性耙屹。
本次競賽在大華自主研發(fā)的深度學(xué)習(xí)平臺上铲醉,汲取了2D目標檢測、場景流識別等算法的優(yōu)點抗俄,研發(fā)了一套基于圖模型和神經(jīng)網(wǎng)絡(luò)的3D目標檢測框架脆丁,使用3D點云數(shù)據(jù)與2D圖像數(shù)據(jù),從多個視角進行目標檢測动雹,并將多視角的檢測結(jié)果進行融合槽卫,有效地提升了3D目標檢測的準確性。
該項國際競賽數(shù)據(jù)集的車輛3D檢測效果圖
(圖片來源自網(wǎng)絡(luò)洽胶,如有侵權(quán)晒夹,請聯(lián)系刪除。)
圖1 3D檢測效果圖
(圖片來源自網(wǎng)絡(luò)姊氓,如有侵權(quán)丐怯,請聯(lián)系刪除。)
圖2 點云數(shù)據(jù)的鳥瞰圖效果