AI人工智能知識科普篇—計算機視覺技術
2019.10.06
“人的大腦皮層的活動,大約70%是在處理視覺相關信息。視覺就相當於人腦的大門,其它如聽覺、觸覺、味wei覺jiao那na都dou是shi帶dai寬kuan較jiao窄zhai的de通tong道dao。視shi覺jiao相xiang當dang於yu八ba車che道dao的de高gao速su,其qi它ta感gan覺jiao是shi兩liang旁pang的de人ren行xing道dao。如ru果guo不bu能neng處chu理li視shi覺jiao信xin息xi的de話hua,整zheng個ge人ren工gong智zhi能neng係xi統tong是shi個ge空kong架jia子zi,隻zhi能neng做zuo符fu號hao推tui理li,比bi如ru下xia棋qi、定理證明,沒法進入現實世界。計算機視覺之於人工智能,它相當於說芝麻開門。大門就在這裏麵,這個門打不開,就沒法研究真實世界的人工智能。”——朱鬆純,加州大學洛杉磯分校UCLA統計學和計算機科學教授根據科普中國撰寫的對計算機視覺的定義,這是一門研究如何讓機器“看”的科學,更進一步的說,是指用計算機代替人眼對目標進行識別、跟蹤和測量的機器視覺,並進一步做圖形處理,使計算機處理成為更適合人眼觀察或傳送給儀器檢測的圖像。
2.計算機視覺VS機器視覺
計算機視覺更關注圖像信號本身以及圖像相關交叉領域(地圖、醫療影像)的研究;機器視覺則偏重計算機視覺技術工程化,更關注廣義上的圖像信號(激光和攝像頭)和自動化控製(生產線)方麵的應用。
3.計算機視覺識別技術的分類
物體識別分為“1VSN”對不同物體進行歸類,以及“1VS1”對同類型的物體進行區分和鑒別;物體屬性識別,結合地圖模型讓物體在視覺的三維空間裏得到記憶的重建,進而進行場景的分析和判斷;物體行為識別分為3個ge進jin階jie的de步bu驟zhou,移yi動dong識shi別bie判pan斷duan物wu體ti是shi否fou做zuo了le位wei移yi,動dong作zuo識shi別bie判pan斷duan物wu體ti做zuo的de是shi什shen麼me動dong作zuo,行xing為wei識shi別bie是shi結jie合he視shi覺jiao主zhu體ti和he場chang景jing的de交jiao互hu做zuo出chu行xing為wei的de分fen析xi和he判pan斷duan。
4.計算機視覺的識別流程
訓練模型:樣本數據包括正樣本(包含待檢目標的樣本)和負樣本(不包含目標的樣本),視覺係統利用算法對原始樣本進行特征的選擇和提取訓練出分類器(模型);此外因為樣本數據成千上萬、提取出來的特征更是翻番,所以一般為了縮短訓練的過程,會人為加入知識庫(提前告訴計算機一些規則),或者引入限製條件來縮小搜索空間。
識別圖像:會先對圖像進行信號變換、jiangzaodengyuchuli,zailailiyongfenleiqiduishurutuxiangjinxingmubiaojiance。yibanjianceguochengweiyongyigesaomiaozichuangkouzaidaijiancedetuxiangzhongbuduandeyiweihuadong,zichuangkoumeidaoyigeweizhijiuhuijisuanchugaiquyudetezheng,ranhouyongxunlianhaodefenleiqiduigaitezhengjinxingshaixuan,panduangaiquyushifouweimubiao。
5.計算機視覺技術模式圖和對應企業圖
目前世界上圖像識別最大的數據庫,是斯坦福大學人工智能實驗室提供的ImageNet,針對諸如醫療等細分領域也需要收集相應的訓練數據;Google、Microsoft此類科技巨頭會麵向市場提供開源算法框架,為初創視覺識別公司提供初級算法。












