0
首頁 公文范文 計算機視覺論文

計算機視覺論文

發布時間:2022-05-02 09:37:29

開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的1篇計算機視覺論文,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。

計算機視覺論文

計算機視覺論文:計算機視覺下食品工業論文

1計算機視覺技術概述

1.1自動化程度高

計算機視覺可以實現對農產品的多個外形和內在品質指標進行同時檢測分析,可以進行整體識別、增強對目標識別的準確性。

1.2實現無損檢測

由于計算機視覺技術對農產品的識別是通過掃描、攝像,而不需要直接接觸,可以減少對所檢測食品的傷害。

1.3穩定的檢測精度

設計的運行程序確定后,計算機視覺技術的識別功能就會具有統一的識別標準,具有穩定的檢測精度,避免了人工識別和檢測時主觀因素所造成的差異。

2計算機視覺技術在食品檢測中的應用

20世紀70年代初,學者開始研究計算機視覺技術在食品工業中的應用,近幾十年電子技術得到快速發展,計算機視覺技術也越來越成熟。國內外學者在研究計算機視覺技術在食品工業中的應用方面主要集中在該技術對果蔬的外部形態(如形狀、重量、外觀損傷、色澤等)的識別、內部無損檢測等方面。國內有關計算機視覺技術在食品業中的應用研究起始于90年代,比國外發達國家晚20多年,但是發展很快。

2.1計算機視覺技術在果蔬分級中的應用研究

計算機視覺技術在食品檢測中的應用研究相當廣泛,從外部直徑、成熟度的檢測到內部腐爛程度的檢測都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計算機算法計算水果的半徑,進而得出果蔬的最大直徑。研究表明,該算法不僅降低了計算量而且提高了計算精度,此方法用于水果分級的誤差不超過2mm,高于國際水果分級標準所規定的5mm分類標準差,可在工業生產中很好應用。李慶中[5]也利用圖像的缺陷分割算法研究了計算機視覺技術在蘋果檢測與分級中的應用,結果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規律為理論基礎,結合模糊聚類知識利用計算機視覺技術來檢測蘋果缺陷域,檢測不僅快速而且結果精確。劉禾等[7]通過研究認為蘋果的表面缺陷可以利用計算機視覺技術進行檢測,計算機視覺技術還可以將蘋果按照檢測結果進行分級,把檢測過的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級的重要特征之一,應義斌等[8]通過計算機視覺技術、圖象處理技術、傅立葉描述子的方法來描述和識別果形以及有無果柄,其識別率達到90%。楊秀坤等[9]綜合運用計算機視覺技術、遺傳算法、多層前饋神經網絡系統,實現了具有精確度高、靈活性強和速度快等優點的蘋果成熟度自動判別。陳育彥等[10]采用半導體激光技術、計算機視覺技術和圖像分析技術相結合的方法檢測蘋果表面的機械損傷和果實內部的腐爛情況,初步驗證了計算機視覺技術檢測蘋果表面的損傷和內部腐爛是可行的。馮斌等[11]通過計算機視覺技術對水果圖像的邊緣進行檢測,然后確定水果的大小用以水果分級。試驗表明,該方法比傳統的檢測方法速度快、準確率高,適用于計算機視覺的實時檢測。朱偉[12]在模糊顏色的基礎上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對西紅柿的缺陷進行分割,結果顯示準確率高達96%。曹樂平等[13]人研究了溫州蜜柑的果皮顏色與果實可滴定酸含量以及糖分含量之間的相關性,然而根據相關性,樣品檢測的正確識別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個方向獲取蘋果的圖像,并通過計算機自動分析圖像數據,對蘋果的外徑、體積、以及圓形度等參數進行處理,與人工檢測相比,計算機視覺技術具有檢測效率高,檢測標準統一性好等優點。Blasco.J[15]通過計算機視覺技術分析柑橘果皮的缺陷,進而對其在線分級,正確率約為95%。趙廣華等[16]人綜合計算機視覺識別系統、輸送轉換系統、輸送翻轉系統、差速勻果系統和分選系統,研制出一款適于實時監測、品質動態的智能分級系統,能夠很好地實現蘋果分級。王江楓等[17]建立了芒果重量與攝影圖像的相互關系,應用計算機視覺技術檢測桂香芒果和紫花芒果的重量和果面損傷,按重量分級其準確率均為92%,按果面損傷分級的準確率分別為76%和80%。

2.2計算機視覺技術在禽蛋檢測中的應用研究

禽蛋企業在生產過程中,產品的分級、品質檢測主要采用人工方法,不僅需要大量的物力人力,而且存在勞動強度大、人為誤差大、工作效率低等缺點,計算機視覺技術可以很好的解決這類產品工業生產中存在的困擾。歐陽靜怡等[18]利用計算機視覺技術來檢測雞蛋蛋殼裂紋,利用攝像機獲取雞蛋圖像后,采用fisher、同態濾波和BET算法等優化后的圖像處理技術,獲得裂紋形狀并判斷,試驗結果表明,計算機視覺技術對雞蛋蛋殼裂紋的檢測準確率高達98%。汪俊德等[19]以計算機視覺技術為基礎,設計出一套雙黃雞蛋檢測系統。該系統獲取蛋黃指數、蛋黃特征和蛋形尺寸等特征,和設計的數學模型對比來實現雙黃雞蛋的檢測和識別,檢測準確率高達95%。鄭麗敏等[20]人通過高分辨率的數字攝像頭獲取雞蛋圖像,根據圖像特征建立數學模型來預測雞蛋的新鮮度和貯藏期,結果表明,計算機視覺技術對雞蛋的新鮮度、貯藏期進行預測的結果準確率為94%。潘磊慶等[21]通過計算機視覺技術和聲學響應信息技術相結合的方法檢測裂紋雞蛋,其檢測準確率達到98%。MertensK等[22]人基于計算機視覺技術研發了雞蛋的分級檢測系統,該系統識別帶污漬雞蛋的正確率高達99%。

2.3計算機視覺技術在檢測食品中微生物含量的應用研究

計算機技術和圖像處理技術在綜合學科中的應用得到快速發展,在微生物快速檢測中的應用也越來越多,主要是針對微生物微菌落的處理。食品工業中計算機視覺技術在微生物檢測方面的研究和應用以研究單個細胞為主,并在個體細胞的研究上取得了一定的進展。殷涌光等[23]以顏色特征分辨技術為基礎,設計了一套應用計算機視覺技術快速定量檢測食品中大腸桿菌的系統,該系統檢測結果與傳統方法的檢測結果具有很好的相關性,但與傳統方法相比,可以節省5d時間,檢測時間在18h以內,并且能夠有效提高產品品質。Lawless等[24]人等時間段測定培養基上的細胞密度,然后通過計算機技術建立時間和細胞密度之間的動態關聯,利用該關聯可以預測和自動檢測微生物的生長情況,如通過計算機控制自動定量采集檢測對象,然后分析菌落的邊緣形態,根據菌落的邊緣形態計算機可以顯示被檢測菌落的具體位置,并且根據動態關聯計算機視覺系統可以同時處理多個不同的樣品。郭培源等[25]人對計算機視覺技術用于豬肉的分級進行了研究,結果顯示計算機視覺技術在識別豬肉表面微生物數量上與國標方法檢測的結果顯著相關,該技術可以有效地計算微生物的數量。Bayraktar.B等[26]人采用計算機視覺技術、光散射技術(BARDOT)和模式識別技術相結合的方法來快速檢測李斯特菌,在獲取該菌菌落中的形態特征有,對圖像進行分析處理達到對該菌的分類識別。殷涌光等[27]人綜合利用計算機視覺、活體染色、人工神經網絡、圖像處理等技術,用分辨率為520萬像素的數字攝像機拍攝細菌內部的染色效果,并結合新的圖像處理算法,對細菌形態學的8個特征參數進行檢測,檢測結果與傳統檢測結果顯著相關(相關系數R=0.9987),和傳統檢測方法相比該方法具有操作簡單、快速、結果準確、適合現場快速檢測等特點。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征和微生物數量進行識別,并以此作為衡量乳制品質量是否達標的依據,并對產品進行分級。

2.4計算機視覺技術在其他食品產業中的應用研究

里紅杰等[30]通過提取貝類和蝦類等海產品的形狀、尺寸、紋理、顏色等外形特征,對照數學模型,采用數字圖像處理技術、計算機識別技術實現了對貝類和蝦類等海產品的無損檢測和自動化分類、分級和質量評估,并通過實例詳細闡述了該技術的實現方法,證實了此項技術的有效性。計算機視覺技術還可以檢驗玉米粒形和玉米種子質量、識別玉米品種和玉米田間雜草[31]。晁德起等[32]通過x射線照射獲取毛葉棗的透視圖像后,運用計算機視覺技術對圖像進行分析評估,毛葉棗可食率的評估結果與運用物理方法測得的結果平均誤差僅為1.47%,因此得出結論:計算機視覺技術可以應用于毛葉棗的自動分級。GokmenV等[33-34]通過對薯片制作過程中圖像像素的變化來研究薯片的褐變率,通過分析特色參數來研究薯片中丙烯酰胺的含量和褐變率的關系,結果顯示兩項參數相關性為0.989,從而可以應用計算機視覺技術來預測加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業中得到廣泛應用。韓仲志等[35]人拍攝和掃描11類花生籽粒,每類100顆不同等級的花生籽粒的正反面圖像,利用計算機視覺技術對花生內部和外部采集圖像,并通過圖像對其外在品質和內在品質進行分析,并建立相應的數學模型,該技術在對待檢樣品進行分級檢測時的正確率高達92%。另外,郭培源等[36]人以國家標準為依據,通過數字攝像技術獲取豬肉的細菌菌斑面積、脂肪細胞數、顏色特征值以及氨氣等品質指標來實現豬肉新鮮程度的分級辨認。

3展望

新技術的研究與應用必然伴隨著坎坷,從70年代初計算機視覺技術在食品工業中進行應用開始,就遇到了很多問題。計算機視覺技術在食品工業中的研究及應用主要存在以下幾方面的問題。

3.1檢測指標有限

計算機視覺技術在檢測食品單一指標或者以一個指標作為分級標準進行分級時具有理想效果,但以同一食品的多個指標共同作為分級標準進行檢測分級,則分級結果誤差較大[37]。例如,Davenel等[38]通過計算機視覺對蘋果的大小、重量、外觀損傷進行分析,但研究結果顯示,系統會把花萼和果梗標記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復雜,造成分級誤差很大,分級正確率只有69%。Nozer[39-40]等以計算機視覺為主要技術手段,獲取水果的圖像,進而通過分析圖像來確定水果的形狀、大小、顏色和重量,并進行分級,其正確率僅為85.1%。

3.2兼容性差

計算機視覺技術針對單一種類的果蔬分級檢測效果顯著,但是,同一套系統和設備很難用于其它種類的果蔬,甚至同一種類不同品種的農產品也很難公用一套計算機視覺設備。Reyerzwiggelaar等[41]利用計算機視覺檢查杏和桃的損傷程度,發現其檢測桃子的準確率顯著高于杏的。Majumdar.S等[42]利用計算機視覺技術區分不同種類的麥粒,小麥、燕麥、大麥的識別正確率有明顯差異。

3.3檢測性能受環境制約

現階段的計算機視覺技術和配套的數學模型適用于簡單的環境,在復雜環境下工作時會產生較大的誤差。Plebe等[43]利用計算機視覺技術對果樹上的水果進行識別定位,但研究發現由于光照條件以及周邊環境的影響,水果的識別和定位精度不高,不能滿足實際生產的需要。綜上所述,可看出國內外學者對計算機視覺技術在食品工業中的應用進行了大量的研究,有些研究從單一方面入手,有些研究綜合了多個學科,在研究和應用的過程中,取得了較大的經濟效益,也遇到了很多問題,在新的形勢下,計算機視覺技術和數碼拍攝、圖像處理、人工神經網絡,數學模型建設、微生物快速計量等高新技術相融合的綜合技術逐漸成為了各個領域學者的研究熱點,以計算機視覺為基礎的綜合技術也將在食品工業中發揮更加重要的作用。

作者:姚瑞玲 單位:四川工商職業技術學院

計算機視覺論文:基于計算機視覺的移動機器人導航

摘 要:針對跟隨路徑導引的移動機器人導航方式的靈活性較差、維護成本較高、功能單一的缺點,將計算機視覺用于移動機器人路徑識別。首先對視覺傳感器獲得的視頻圖像進行處理,獲得有用的特征目標,實現機器人對當前路徑信息的理解。然后調用直行或轉彎功能模塊對機器人進行導航控制。實驗結果表明,該導航方式具有較好的實時性和魯棒性。

關鍵詞:計算機視覺;移動機器人;路徑識別;自主導航

現代機器人技術在人工智能、計算機技術和傳感器技術的推動下獲得了飛速發展,其中移動機器人因具有可移動性和自治能力,能適應環境變化被廣泛用于物流、探測、服務等領域[14]。移動機器人的優秀技術之一是導航技術,特別是自主導航技術。由于環境的動態變化和不可預測性、機器人感知手段的不完備等原因,使得移動機器人的導航難度較大,一直是人們研究的重點[5]。

目前常用的一種導航方式是“跟隨路徑導引”[6],即機器人通過對能感知到某些外部的連續路徑參考信息做出相應的反應來導航。如在機器人運動路徑上敷設金屬導線或磁釘,通過檢測金屬導線或磁釘的特征信息來確定機器人的位置。從導航的角度看,這種方法的優點是可靠性較高,但功能單一,如不能在行進的同時對目標進行識別、避障,對環境的適應能力較弱、靈活性較差、維護成本較高,因此限制了其在移動機器人中的應用。

隨著計算機技術、數字圖像處理技術及圖像處理硬件的發展,基于計算機視覺的導航方式在機器人導航中得到廣泛關注[68]。在實際應用中,只需要在路面上畫出路徑引導線,如同在公共交通道路上畫的引導線一樣,機器人就可以通過視覺進行自主導航。相對于敷設金屬導線、磁釘等方法,這種方法增強了系統的靈活性,降低了維護成本。視覺信息中包含有大量的數據,要從中提取有用的信息,需要復雜的算法及耗時的計算。如何保證視覺導航系統在正確理解路徑信息的前提下仍具有較好的實時性和魯棒性,是該方法要解決的優秀問題。

1 視覺導航系統構成及工作過程

基于計算機視覺的移動機器人導航實驗系統的硬件部分由計算機、USB接口的攝像頭、LEGO實驗用機器人組成。軟件分為2部分,即圖像處理和機器人運動控制。基于視覺導航的原始輸入圖像是連續的數字視頻圖像。系統工作時,圖像預處理模塊首先對原始的輸入圖像進行縮小、邊緣檢測、二值化等預處理。其次利用哈夫變換提取出對機器人有用的路徑信息。最后,運動控制模塊根據識別的路徑信息,調用直行或轉彎功能模塊使機器人做相應的移動。整個工作流程如圖1所示。

1.1 視覺導航的圖像預處理

目前圖像采集設備都具有較高的空間和灰度分辨率,精度高、數據量大。

實驗中的原始輸入圖像是USB攝像頭采集320×240像素的RGB格式圖像,最大幀數30幀/s。

圖像預處理的效果對后續哈夫變換檢測路徑信息的速度和準確性有很大影響。對整幅圖像進行抽取時計算量過大、也無必要,故先將彩色圖像轉換為灰度圖像,再將圖像的大小依據最近鄰域插值法原理[9]進行縮小以節約后續計算時間。在實驗室環境下,經測試,將原始圖像縮小到30%仍然能滿足需要,處理時間縮短了72%。

由于圖像傳感器從時間和空間上對介質(光)采樣,其圖像質量對現場的非均勻光場和其他干擾因素非常敏感,二值化時,不同光照條件下閾值的確定是一件比較困難的工作。目前常用的閾值選取方法有雙峰法、迭代法和 最大類間方差法[10]。從執行時間和處理效果2方面考慮,對3種方法比較后(結果如表1所示),在優先考慮實時性的前提下,選用雙峰法來求取閾值。在實驗室條件下,路徑環境相對理想,黑色引導線與背景反差較大。在灰度直方圖上,引導線和背景都形成高峰,對這2個峰值及谷底的求取也可簡化,使用灰度級的最大值和最小值代替2個峰值,那么這2個峰值的中間值即可作為谷底用作圖像的閾值。

地面的反光和陰影,以及不均勻的光照都會導致同一幅圖像的二值化效果表現出很大差別,圖2和圖3是對同一幅圖像在不同光照條件下二值化的結果,可以看到在光照條件2下會出現大量的黑點,這些黑點將嚴重影響提取路徑信息的速度并且可能導致錯誤的路徑信息。然而,相對于灰度、顏色特征,邊緣特征受光照影響較小[11]。為此,對縮小后的圖像先進行引導線的邊緣檢測,邊緣檢測后圖像中引導線邊緣像素灰度的對比度得到增強,通過實驗確定合適的閾值,然后對圖像進行二值化以提取路徑信息。

1.2 引導線角度檢測

2 視覺導航的機器人運動控制

機器人運動控制部分分為直行控制和轉彎控制2部分。

2.1 直行控制

如果哈夫變換的檢測結果表明是一條直線即機器人視野中只有1條主引導線時,則運行直行模塊。實際中有2種情況需要考慮:一是機器人的初始位置不一定正對引導線,二是在機器人的機電配置中,左右輪子的馬達運動不會絕對精確和對稱。這些會使機器人在運動中出現側偏。可采用下述方法進行直行控制:根據引導線在圖像平面坐標中的位置來判斷機器人的偏向。當引導線位于圖像平面的左半邊,說明攝像頭的光軸與引導線不垂直且相對于引導線右偏,則命令機器人左轉;當引導線位于圖像平面的右半邊,說明攝像頭的光軸與引導線不垂直且相對于引導線左偏,則命令機器人右轉;當引導線在圖像平面兩邊均存在時,則命令機器人不偏轉繼續直行。機器人在前進過程中,根據圖像平面中引導線位置不斷調整方位,以一定的轉動角度(轉動角度盡量小,這樣機器人的擺動幅度就會小)在直線路徑上行走。

2.2 轉彎控制

如果哈夫變換的檢測結果表明是兩條相互垂直的直線,即機器人的視野中出現轉彎路口,則開始運行轉彎模塊。

機器人需要在距轉角合適的距離處開始運行轉彎模塊,以保證機器人視野中始終具有引導線。如圖4所示,AB段表示攝像頭的縱向視野范圍,C點為轉角點,機器人需要知道自身在實際二維平面中相對于轉角點C的距離即BC段距離。由圖像信息獲得現實世界坐標系中的參數,即所謂三維重建,這需要對基于計算機視覺的移動機器人導航系統進行攝像機標定。

鑒于移動機器人識別的引導線在地面上這一限制條件,并且攝像頭固定在機器人上,可以選擇機器人坐標系為世界坐標系,即世界坐標系與機器人同步移動。坐標原點為標定模板的左下角標定點的中心,Zw軸垂直地面,XwYw平面即為地面。在該坐標系下地面目標的坐標可以表示為(Xw,Yw,0),П甓模板由直徑5 mm、相距10 mm共72個圓點構成,如圖5所示。

3 實驗結果及結論

實驗中選用的LEGO移動機器人,其運動速度為8.57 cm/s(指令設定Power=25 RPM)。導航場地中畫有寬1 cm的黑色引導線,實驗要求中機器人完全根據引導線自主運動。實驗中,識別1幀圖像并且機器人根據識別的路徑信息運行直行或轉彎模塊共需0.311 s,即機器人每處理1幀圖像移動2.67 cm。實驗室中的光照條件是機器人移動時的主要干擾,而銳利的引導線邊緣受光照影響較小,對這些干擾有較好的濾除作用。經過在陰天白天、晴天白天以及開燈和不開燈的情況下、晚上開燈的情況下、遮蓋物位于攝像頭上方50 cm處形成陰影情況下,機器人能正確的沿引導線移動。同時,當攝像頭視野范圍內引導線消失即認為出現障礙物,機器人能發出前方有障礙物的報警信息。

可見上面所述方法有較好的實時性和魯棒性有一定的通用性,使得該視覺導航方法具有一定的應用價值。只要光照條件變化不是非常劇烈,在工廠、醫院、辦公樓等環境中,機器人根據路徑引導線可自主到達目的地。

當然,由于移動機器人活動場景的復雜性和動態特性,以及視覺處理的復雜性,視覺導航還有很多需要解決的問題,例如當導航場地出現較大面積的強烈反光、極暗的陰影時能否有效可靠的進行移動機器人的導航控制,這需要進一步研究。另外,如何將視覺系統與本系統機器人平臺中的超聲波傳感器、光電傳感器及聲音傳感器在空間、時間及數據上進行融合以提高系統的適應性和環境識別能力也是一個研究方向。

作者簡介

趙 瑜 女,1983年出生,陜西西安人,碩士研究生。主要研究方向為非接觸測量與可視化計算。

種蘭祥 男,1960年出生,陜西合陽人,西北大學信息科學與技術學院副教授,中國科學院西安光學精密儀器研究所博士研究生。主要從事非接觸測量、光電子技術和可視化計算方面的研究。

張萬緒 男,1964年出生,山西運城人,西北大學信息科學與技術學院副教授。主要研究方向為智能儀器儀表。

注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文

計算機視覺論文:談計算機視覺課程的教學創新

摘要:近年來,隨著計算機視覺技術與應用的飛速發展,越來越多學生對這門課產生了濃厚的興趣。文章是對我院計算機視覺課程教學經驗的總結,討論我們在教學過程中遇到的一些具體問題,主要包括教學內容和工程實例的選取、教學方法的幾個注意事項,期待與同行們進行交流探討。

關鍵詞:計算機視覺;教學應用;教學改革

計算機視覺是人工智能學科中的一門重要課程。隨著相關應用在多個領域中的出現,越來越多的學生開始對這門課產生了濃厚的興趣。如何讓學生能夠在整個課程中保持盎然的興趣,并為有志于深入研究計算機視覺的學生指明方向,成為我們教師首先應注重的問題。

在實際的教學工作中,通過不斷摸索總結,我們認為,以實際應用引導學生的學習興趣,既滿足了學生想了解計算機視覺實際應用的需求,又加深了學生對于算法的理解,把算法放在一個實際應用中,學生可以理解怎么用,為什么這么用。在這樣的目標導引下,我們從選擇教材開始,準備教學內容(包括合理的應用實例的選擇)、制作PPT、探索教學方法,形成了目前以實際應用為主導的創新教學體系,非常受學生歡迎。在此,我們對這期間遇到的問題,解決方法、心得體會做一個總結和思考,希望能對同行有些許參考作用。

1選擇教材

在我們這個專業,每年的上研率基本都保持在50%左右。在本專業的研究生階段,也開設了雙語教學的計算機視覺課程。另外,畢業后選擇參加工作的同學也基本都進入和本專業非常相關的一些單位,所從事的工作,都是和在學校學習的知識密切相關。

因此,如何讓這門課程的教學既兼顧本科畢業就參加工作的那部分同學,又兼顧繼續深造的學生的需求,也是在這門課程講授的過程中,需要特別注意的一個問題。對于本科畢業就要參加工作的同學而言,需要“廣度”,需要了解計算機視覺這門課在各個領域中的應用,在實際中接觸到相關的項目或工作時,能夠知道去哪里可以找到自己需要的參考資料;而對于要進一步深造的同學而言,則需要一定的“深度”,為研究生階段的研究打下基礎。

全盤考慮到這些學生畢業之后的去向,我們選擇了兩本教材。一本是賈云得教授編著,科學出版社于 2000年出版的《機器學習》[2],這是一部順應了時代與教學發展要求的教材,對計算機視覺中的基本概念、基本算法、基本算法的應用、經典應用進行了由淺入深的介紹。內容涵蓋了所有經典的數字圖像處理與機器視覺方法,也對一些已經得到非常好實際應用的方法,如光流法等作了簡要介紹。另外還選擇了一本英文原版的計算機視覺的經典著作,Ramesh Jain 教授等所著的《Machine Vision》[3],機械工業出版社于2003年出版。這是國內外非常推崇的一本計算機視覺著作,該教材條理清晰,深入淺出,對計算機視覺的基本原理、算法、應用的介紹非常詳盡。

在教學中,我們采用了英文的PPT,但主要用的教材是賈云得教授的《機器視覺》,這樣中英文對照講解,一方面加深學生對教學內容的理解,另一方面也為學生今后閱讀專業的英文論文做了相應準備。

2教學內容和工程實例的選取

2.1選取教學內容

本課程之前,大學二年級的本科生已開設數字圖像處理課程,但所講的基本原理和算法都非常淺顯,所以在教學內容的安排上,分為兩大部分:數字圖像處理部分和視覺部分。數字信號處理部分主要講解在視覺部分會用到的一些基本算法,為后面進入計算機視覺部分打基礎。這部分約占總課時的1/3。視覺部分的課時也分為兩部分:算法講解與實例講解。在算法講解部分,對計算機視覺的基本算法、經典算法都做了深入淺出的講解。實例部分則選擇了經典的工業應用,讓學生能夠對所學算法進一步加以理解。

2.2選取適當的工程實例

就計算機視覺的教學內容而言,各個孤立的算法和方法對本科生來講,有些抽象不好理解。如果在教學上僅僅通過老師在課堂上的講解,很難讓學生深入地理解相關的教學內容,而選擇一個觸手可及且簡單好理解的工程實例往往就會達到意想不到的教學結果,學生可以把課堂上所學的枯燥理論與現實中活生生的事物聯系起來,從而加深對教學內容的理解。

通過反復比對、反復論證,我們選擇了在講解基本原理和算法之后,在課程結束前,專門留出課時講解手機制造這個例子。手機現在是人手一部,是這些年青學子再熟悉不過的事物了,通過對手機主板、手機鍵盤的制造過程的講解,把所學的算法都融合進來,學生在覺得有趣的同時,不知不覺就加深了對所學算法的理解。

另外,在教學的過程中,我們還不斷穿插其他學生耳熟能詳的實例,如數碼相機原理中的一些算法的講解,我們和學生一起探討應該怎么選擇數碼相機。再有,濾波器算法、在課堂上對Photoshop功能的演示,與所學算法關聯起來,學生都很容易理解接受。

3教學點滴

3.1點睛之筆

在第一節課的講述中,我們的重點不在于Marr理論,而是告訴學生:

人工智能就是要讓計算機像人一樣,能夠會聽、會看……

我們這門課程就是要讓計算機“會看”,要像人一樣會看。進而展示給學生一些我們精心挑選的圖片,讓學生自己判斷,是不是自己的眼睛“騙了”自己,人眼和計算機看到的到底有什么不一樣。

每次講到這里,學生都會進行熱烈的討論,每個人都有不同的看法,每個人都有自己的堅持,不知不覺中,對這門課就產生了濃厚的興趣,有了繼續深入學習下去的愿望。在課堂討論的最后,比較人眼對圖片的判斷以及計算機的判斷后,讓學生自己總結歸納,我們這門課到底要研究些什么,都有可能應用在哪些方面,然后對爭議比較大的提議一一探討。每到這個時候,大家的積極性就都被激發出來,在不斷的爭論與思想碰撞中找出正確的結論。

3.2拿身邊的事物說“事”

計算機視覺課程的前半部分,多涉及到圖像處理的一些常見算法。在講授各種各樣的濾波器和算子時,并沒有針對各個濾波器和算子擺出一堆示例圖片,讓學生比較濾波前后的差異,從而很生硬地理解濾波器與算子的功能。取而代之的,我們首先以現在人手一臺的數碼相機為例提出問題,你為什么要選擇你手里的這臺數碼相機?當初選這個品牌和型號時,你的考慮是什么?歷年學生的回答幾乎都是看網上測評,或者在網上看別人怎么說。這時列出我們收集到的各個品牌相機的測評報告,列出它們的優缺點,然后引導學生去思考,例如這個品牌的相機的缺點是照片發灰,不是很鮮亮,而另一個品牌的相機則綠的特別綠,紅的特別紅,為什么?那么有可能是哪部分的算法不夠完善,為什么?

通過如此簡單的對比,學生的積極性被完全激發。原來,數碼相機這個幾乎人人都有,大家都熟悉的“玩具”竟然和自己在課堂上學到的知識這么密切相關。

再有,就是利用學生們都熟悉的PS(Photoshop),演示現在所謂的“完美證件照”是怎么來的。為什么可以把疙疙瘩瘩的臉部皮膚變得光滑?在PS中,你就是點了一下鼠標,其實在后臺,是加入了一個濾波器進行了濾波。各種這樣的演示,學生都非常喜聞樂見。因為他們突然發現,原來那些事物,和我自己接觸到這些看似枯燥的理論之間,還有這么深刻的聯系。

還有一個很受學生歡迎的例子就是對于“鼓形失真”的講解。我們的老師每次講到這里,都不會簡單告訴學生“鼓形失真”發生的原因是什么,應該怎么解決?老師都會問學生,明星為什么都一窩蜂去減肥?現在的女明星為什么都要去弄個“錐子臉”?課堂上就會出現一個小高潮,男同學和女同學的看法各異,彼此之間開始爭論不休。此時再趁熱打鐵地問學生,如果拿著相機,離自己的鼻子一公分,會拍出什么樣的效果?有學生開始拿出手機對著自己和別人開拍,有的學生開始頭頭是道地分析。每到這種學生都開始熱烈討論的時候,就可以適時引導學生往正確的方向去,讓他們自己找到正確的分析解決方法,往往這個時候,學生都會頗有成就感,對于問題的理解也會特別的深刻。

3.3選擇合適的實際應用

在所有理論講解結束后,我們會留出2~4次課講述計算機視覺在工業上的應用。這些年來,對于手機制造這樣一個工業應用,非常受學生歡迎。正如“數碼相機”這個例子一樣,現在學生都是人手一部手機,是大家再熟悉不過的東西。這個例子涉及到了在前面理論講述中的大部分算法,如二值圖像的處理、模板匹配、高斯濾波器等。學生通過對這個工業應用的理解,更進一步加深了對算法的理解。

以講解手機鍵盤的制造過程為例,向學生提出和前面所講內容相關的問題,引導學生自發思考,如為什么選擇模板匹配法,而不是采用其他更復雜更精確的方法等等。每到這個時候,課堂氣氛總是分外熱烈,學生各抒己見,在不斷爭論中,更進一步加深對課本上枯燥理論的認識。

在這里需要注意的問題是一定要一步一步提出問題,循循善誘,引導學生一層一層地深入思考。如果問題的答案過于“深藏不露”,則有可能觸發學生的抵觸情緒,無法繼續深入地思考。

4結語

通過多年的教學摸索,我們認為,在計算機視覺課程的講述中,以實際應用引導學生這樣的教學方法非常可取,而且也收到了很好的效果。另外,除了制定好的教學大綱,并選擇合適的教材外,根據學校現在的時間情況,我們選擇了多媒體手段輔助教學,充分利用Matlab和大屏幕投影等方方面面的優勢,結合多種方法進行教學,對講好計算機視覺這門課,非常有益。

計算機視覺論文:計算機視覺導航綜述

摘要:導航技術是移動機器人優秀技術,移動機器人又有多種導航方式,本文對各種導航方式進行了分析比較,提出由于計算機視覺理論及算法的發展,又由于和激光、雷達和超聲在導航方面相比,視覺導航具有很多優點,因此視覺導航被大量地采用。根據移動機器人是在導航過程中對圖像進行處理,實時性差始終是一個非常棘手的問題,提出解決該問題的關鍵在于設計一種快速圖像處理方法。

關鍵詞:視覺導航;移動機器人;圖像處理

移動機器人是一種在復雜的環境下工作的具有自規劃、自組織、自適應能力的機器人。移動機器人集人工智能、智能控制、信息處理、圖像處理、模式識別、檢測與轉換等專業技術為一體,跨計算機、自動控制、模式識別、智能控制等多學科,成為當前智能機器人研究的熱點之一。

在移動機器人的運動過程中始終要解決的是自身的導航與定位問題,相關技術研究中,導航技術可以說是其優秀技術,也是其實現真正的智能化和完全的自主移動的關鍵技術。也就是DurrantWhyte提出的三個問題:(1)“我現在何處?”;(2)“我要往何處去?”;(3)“要如何到該處去?”[1] 其中問題(1)是移動機器人導航系統中的定位及跟蹤問題,問題(2)、(3)是移動機器人導航系統中路徑規劃問題。導航研究的目標就是沒有人的干預下使機器人有目的地移動并完成特定任務,進行特定操作。機器人通過裝配的信息獲取手段,獲得外部環境信息,實現自我定位,判定自身狀態,規劃并執行下一步的動作。

移動機器人的導航方式分為:基于環境信息的地圖模型匹配導航;基于各種導航信號的路標導航、視覺導航和味覺導航等[2]。

環境地圖模型匹配導航是機器人通過自身的各種傳感器,探測周圍環境,利用感知到的局部環境信息進行局部地圖構造,并與其內部事先存儲的完整地圖進行匹配。如兩模型相互匹配,機器人可確定自身的位置,并根據預先規劃的一條全局路線,采用路徑跟蹤和避障技術,實現導航。它涉及環境地圖模型建造和模型匹配兩大問題。

路標導航是事先將環境中的一些特殊景物作為路標,機器人在知道這些路標在環境中的坐標、形狀等特征的前提下,通過對路標的探測來確定自身的位置。同時將全局路線分解成為路標與路標間的片段,不斷地對路標探測來完成導航。根據路標的不同,可分為人工路標導航和自然路標導航。人工路標導航是機器人通過對人為放置的特殊標志的識別實現導航,雖然比較容易實現,但它人為地改變了機器人工作的環境。自然路標導航不改變工作環境,是機器人通過對工作環境中的自然特征的識別完成導航,但路標探測的穩定性和魯棒性是研究的主要問題[3]。

視覺導航,計算機視覺具有信息量豐富,智能化水平高等優點,近年來廣泛應用于移動機器人的自主導航。視覺導航方式具有信號探測范圍廣,獲取信息完整等優點,是移動機器人導航的一個主要發展方向[4]。目前國內外主要采用在移動機器人上安裝車載攝像機的基于局部視覺的導航方式,如文獻[4]中所提及的:D.L.Boley等研制的移動機器人利用車載攝像機和較少的傳感器通過識別路標進行導航;A.Ohya等利用車載攝像機和超聲波傳感器研究了基于視覺導航系統中的避碰問題等。視覺導航中邊緣銳化、特征提取等圖像處理方法計算量大且實時性較差,解決該問題的關鍵在于設計一種快速的圖像處理方法或采取組合導航方式[4-5]。

味覺導航是通過機器人配備的化學傳感器感知氣味的濃度,根據氣味的濃度和氣流的方向來控制機器人的運動。由于氣味傳感器具有靈敏度高、響應速度快以及魯棒性好等優點,近年來許多研究人員在氣味導航技術上做了許多研究工作。但該項技術能夠真正應用到實際環境中的卻很少,仍處于試驗研究階段。Figaro Engineering Inc.公司研制的氧化錫氣味傳感器,被廣泛用于氣味導航試驗。石英晶體微平衡氣味傳感器、導電聚合物氣味傳感器和一種模仿哺乳動物鼻子功能的電子鼻等用于移動機器人味覺導航的傳感器都處于試驗階段。目前的味覺導航試驗多采用將機器人起始點和目標點之間用特殊的化學藥品,如酒精和樟腦丸等,引導出一條無碰氣味路徑,機器人根據不同的道路跟蹤算法,用氣味傳感器感知氣味的濃淡和氣味源的方向進行機器人導航試驗。味覺導航的研究具有很好的研究價值,該種移動機器人可用來尋找化學藥品泄露源。

由于計算機視覺理論及算法的發展,又由于和激光、雷達和超聲在導航方面相比,視覺導航具有以下幾個優點:首先,即使在丟棄了絕大部分的視覺信息后,所剩下的關于周圍環境的信息仍然比激光雷達和超聲更多更精確;其次,激光雷達和超聲的原理都是通過主動發射脈沖和接受反射脈沖來測距的,因此當多個機器人同時工作時,相互之間可能產生干擾,而視覺由于是被動測量,因此多個機器人相互之間的干擾可以減少到最小;最后,激光雷達和超聲數據的采樣周期一般比攝像機長,不能及時對高速運動的機器人提供信息并作出規劃,因此視覺傳感器被大量地采用。目前移動機器人的導航大都采用基于視覺或有視覺參與的導航技術。最近二十年來,在未知或部分未知環境中,基于自然路標導航與定位技術的研究;視覺導航中路標的識別以及圖像處理的新型快速算法的研究成為了計算機視覺的主要研究方向。

視覺導航主要完成障礙物和路標的探測及識別。國內外應用最多的是在機器人上安裝車載攝像機的基于局部視覺的導航方式。P.I.Corke等對有車載攝像機的移動機器人視覺閉環系統的研究表明,這種控制方法可以提高路徑跟蹤精度。從視覺圖像中識別道路是影響移動機器人導航性能的一個最重要因素。對于一般的圖像邊沿抽取而言,已有了許多方法,例如,局部數據的梯度法和二階微分法。Trahanias利用視覺探測路標來完成機器人的導航。其中路標不是預先定義的人工路標,而是在學習階段自動提取的自然路標。在視覺導航中邊緣銳化、特征提取等圖像處理方法的計算量大,移動機器人是在運動中對圖像進行處理,實時性差始終是一個非常棘手的問題。解決該問題的關鍵在于設計一種快速圖像處理方法。為了滿足速度的要求,基于統計計算的預值法被應用于機器人的導航,但在實際應用中發現,它抑制噪聲的能力差,特別是預值的選取極大地依賴于環境,要想獲得理想的結果,僅在一幅圖像中的不同區域就要設置不同的預值。近些年,由于人工智能的發展,有很多好的算法被應用到移動機器人的視覺導航中去。比如,根據導航圖像的特點采用邊緣提取結合HOUGH變換的方法和帶濾波窗的區域掃描的方法,經過檢驗,這兩種算法都具有較好的實時性,對于直線形態的各類導航線以及對于已知半徑的弧形導航線具有較高的可靠性,以上算法目前對于分支較多的直線形態的導航線以及未知半徑的弧形導航線的效果不佳,這是今后努力的方向。

Stanley還提出了基于神經網絡的機器人視覺導航技術。該技術中估算逆雅可比矩陣,并將圖像特征的變化與機器人的位置變化對應起來,通過神經網絡訓練來近似特征雅可比矩陣的逆陣。該技術,通過提取幾何特征、平均壓縮、向量量化和主成分提取來簡化圖像處理,實現實時視覺導航。

綜上所述,移動機器人是在運動中對圖像進行處理,實時性差始終是一個非常棘手的問題。解決該問題的關鍵在于設計一種快速圖像處理方法。將室內地面作為機器人視覺導航的路標。依據地面的顏色信息,將地面上沒有障礙物的區域識別并分割出來,機器人在可行走區域內行走,這樣就可以實現機器人的自主導航。利用環境中地面的顏色特征,采用比較簡單的圖像處理算法分割彩色圖像,經實驗證明可提高機器人導航的實時性、準確性和魯棒性。

計算機視覺論文:基于計算機視覺的學生考試自動監考系統設計與實現

摘 要: 針對當前視頻監控進行考試監考的丟包率大和智能化程度不高的問題,在計算機視覺下進行學生考試自動監控系統優化設計,提出一種基于視頻幀循環糾錯編碼的計算機視覺自動監考系統設計方法。系統設計分為硬件和軟件部分,包括A/D電路、時鐘電路、視頻幀循環糾錯編碼電路、程序加載電路和輸出接口電路。實驗測試結果表明,該系統能有效降低監考過程中的視頻丟包,提高監考區域的視覺覆蓋度,系統集成性和智能性較高。

關鍵詞: 計算機視覺; 考試; 自動監考; 視頻幀

0 引 言

隨著視頻圖像處理技術的發展,采用計算機視頻監測方法進行現場O控設計,提高對監控區域的自動化識別和管理能力[1]。學生考試自動監考系統是考試智能化管理系統的重要部分,采用計算機視覺分析方法進行自動監考,首先采用計算機視頻監控方法進行考試現場的實時視覺畫面采集,從而實現對考試現場的檢驗分析和指導。研究學生考試自動監考系統,在促進智能化考試管理和提高考場監考的管控能力方面具有積極重要意義[2],對學生考試自動監考系統是建立在視頻圖像分析基礎上的,結合系統硬件設備設計和軟件開發,采用計算機視覺分析方法進行監控現場的異常信息特征提取和分析,采用視頻幀循環糾錯編碼避免監控過程中的丟包和誤碼失真。首先進行系統的總體構架分析,然后進行監考系統的硬件模塊化設計,最后進行系統調試分析,得出有效性結論。

1 系統設計與實現

1.1 外圍器件選擇

根據上述設計思想和總體設計構架,進行基于計算機視覺的學生考試自動監考系統的硬件模塊化設計,學生考試自動監考系統的數據采集系統是整個系統的基礎。通過PCI橋接芯片與PC機進行數據通信,采用PCI9054的LOCAL 總線設計方法,進行數據特征采集,把學生考試監考現場的視頻信息存儲到PCI總線上,在嵌入式RAM中對監控視頻信息進行收發轉換和視頻幀間編碼,基于視頻幀循環糾錯編碼方法進行視頻糾錯。硬件設計主要包括如下幾個部分:學生考試監考現場的視頻信息的DSP信號處理器、模擬信號預處理機、視頻信息的邏輯控制設備、外部I/O設備以及A/D設備和電源供電設備,用DSP控制A/D轉換FLASH寄存器寄存學生考試監考現場的視頻視覺特征信息,同時DSP與PCI通信,DSP接收PCI總線的用戶信息,輸出多路視頻編碼到功率放大器。通過串行E2PROM進行配置校驗,在C 模式下通過PCI總線送采樣數據或處理結果到PC機進行監考現場的監控信息分析。

1.2 監考系統的電路設計

根據上述總體設計要求,結合選擇的外圍器件,采用可編程DSP芯片ADSP?BF537作為優秀處理芯片,進行學生考試自動監考系統的電路設計,主要包括了A/D電路、時鐘電路、視頻幀循環糾錯編碼電路、程序加載電路和輸出接口電路等,分別設計描述如下:

(1) A/D電路。學生考試監考系統的A/D電路是實現對輸入視頻采集信息的數/模轉換,提供給計算機和DSP芯片可識別的原始計算機視覺信息,結合視頻幀循環糾錯編碼方法進行可視化校對和視頻編碼。外部I/O設備包括A/D轉換器AD7864兩片,A/D電路的分辨率為12位,最大采樣頻率25 kHz,采用AD7864(以下簡稱7864)作為A/D芯片,它是4通道輸入、轉換速度1.65 μs的高性能AD芯片,自動監考系統的A/D輸入電壓滿足:

采樣通道數由DSP數據總線dspD[3:0]控制[3],A4~A0和譯碼,利用信號作讀數標志信號,得到A/D電路的接口硬件設計圖如圖1所示。

考慮到系統處理視頻傳輸信息的時間和讀數匹配問題,在進行A/D設計中,需要考慮7864模擬輸入/輸出對應碼表,見表1。

(2) 時鐘電路。時鐘電路執行學生考試自動監考系統的時鐘中斷控制功能[4],采用5409A 作為自動監考系統的時鐘中斷的優秀控制芯片,5409A有3個多通道緩沖串口McBSPs,提供串行A/D、D/A 設備以及其他的串行器件直接接口,本地總線支持復用/非復用的 32 位地址/數據,包括 PCI 總線操作和LOCAL總線操作,PC9054 內部CI9054的LOCAL 總線與PCI總線通過異步操作實現兩個 DMA數據的串行接口輸入和輸出。時鐘電路的引腳設計如圖2所示。

(3) 視頻幀循環糾錯編碼電路。視頻幀循環糾錯編碼電路是整個系統設計的優秀模塊,視頻幀循環糾錯編碼通過Emulator由JTAG(Joint Test Action Group)口下載到DSP中運行,在IEEE 1149.1標準協議下進行 5409A芯片外圍器件的操作測試,芯片采用4通道高性能運放,帶寬為10 MHz。使用ADUM1201進行幀同步信號設計[5],選擇Motorola 公司高性能 MPC850/86作為自動監考系統的三維特征分析模塊,從外部16位存儲器讀取監測視頻圖像的編碼特征,引出雙排的14腳插針外接上拉或下拉電阻,選擇引腳、時鐘信號輸入引腳,數據總線LD 9054與應用電路連接,以串行E2PROM的配置電路作為I/O 初始化控制寄存器模塊單元,直接從地址0x20000000執行16位打包模式實現視頻糾錯編碼,得到視頻幀循環糾錯編碼電路設計如圖3所示。

(4) 程序加載電路。選擇Motorola 公司高性能 MPC850/86作為學生考試自動監考的可視化校驗視覺分析的程序加載電路的優秀處理芯片。在程序加載電路中,采用可編程邏輯芯片PLC進行圖像信息分析,在程序加載中,從外部16位存儲器直接執行16位打包模式,引導ROM配置異步存儲器空間,通過連續讀取0x00字節的個數來確定學生考試自動監考系統的SPI存儲器的片選[6],程序加載電路設計如圖4所示。

圖4中,在VCC和地之間并聯1個電容,滿足程序加載電路的可編程的硬件寫保護和片內的偶然性的寫保護功能。

(5) 輸出接口電路。輸出接口電路設計中,通過JTAG接口訪問CPU的內部寄存器,通過串行E2PROM進行配置校驗。使用JTAG仿真器執行12通道DMA異步串行口設計,采用分立元件構成串口復位電路,降低DSP的能耗。開關頻率也可在0~1間調節,內核電壓在0.8~1.2 V間調整,內核電源通過10 和0.1 電容濾波,以減少電源噪聲。實時時鐘電源與I/O電源采取分別供電策略,綜上分析,得到輸出接口電路見圖5。

在上述進行系統的硬件模塊化設計的基礎上,進行系統集成設計與軟件開發。

2 實驗測試分析

對上述學生考試自動監考系統進行軟件開發和系統調試分析。件開發建立在CCS 2.20開發平臺下,借助于 LabWindows/CVI,C/C++開發計算機視覺下的圖像和視頻信息處理程序。根據編寫的PCI卡驅動程序進行視頻信息采樣和監考系統的原始數據采集,得到學生考試自動監考的視頻采集分析界面如圖6所示。

從圖6可見,采用本文設計的考試自動監考系統,能有效實現計算機視覺下的監考視頻信息傳輸。為了定量測試系統的性能,圖7給出了不同方法進行監考視覺分析的視頻丟包率對比結果,從圖7得知,該系統能有效降低監考過程中的視頻丟包,從而提高監考區域的視覺覆蓋度。

3 結 語

本文提出一種基于視頻幀循環糾錯編碼的計算機視覺自動監考系統設計方法。系統設計分為硬件和軟件部分,首先進行了學生考試自動監考系統的總體設計構架分析和功能指標描述;然后以ADSP?BF537并行微處理芯片為優秀進行監考系統的硬件設計,包括A/D電路、時鐘電路、視頻幀循環糾錯編碼電路、程序加載電路和輸出接口電路;最后在Visual DSP++集成開發環境中進行自動監考系統的軟件開發設計,結合視頻幀循環糾錯編碼進行程序加載,實現計算機視覺下的自動監考。實驗測試結果表明,該系統能有效降低監考過程中的視頻丟包,提高了監考區域的視覺覆蓋度,具有優越性能。

計算機視覺論文:基于計算機視覺的疲勞駕駛檢測專利分析

摘 要 對基于計算機視覺的疲勞駕駛檢測領域的專利申請趨勢、專利申請產出國和申請人分布進行了統計分析,重點針對基于人眼、基于人臉、基于嘴巴的疲勞駕駛檢測這三個技術分支的發展脈絡進行了梳理,并對基于計算機視覺的疲勞駕駛檢測的發展趨勢進行了分析。

關鍵詞 疲勞駕駛 人眼、人臉 嘴巴 專利

0引言

造成交通事故的原因25%-30%產生于疲勞駕駛,因此疲勞駕駛已成為誘發交通事故的重要因素。國內外專家和學者針對疲勞駕駛的檢測開展了大量的研究工作,目前研究的重心主要集中在基于計算機視覺的疲勞駕駛檢測,因此對基于計算機視覺的疲勞駕駛檢測的相關專利進行分析尤為必要。

1基于計算機視覺的疲勞駕駛檢測專利申請數據分析

1.1全球專利申請量趨勢

從圖1可以看出,基于計算機視覺的疲勞駕駛檢測專利申請量從1990-2001年間處于技術研發初期,專利申請量相對較少。從2002年開始該領域的專利申請量逐漸呈現持續增長趨勢,并在2014年達到最大值153件。由此可知,隨著疲勞駕駛的增多,人們對疲勞駕駛的檢測也越來越重視,相應的研究也正不斷增加。基于此,在今后的一段時間內,相關的專利申請量有望繼續保持。

1.2專利申請產出地區分布

目前各領域的專利申請量主要集中在中國、美國、韓國、日本和歐洲,通過對該領域在中國、美國、韓國、日本和歐洲的專利申請量進行統計分析發現,中國的申請量以48%的占比雄居第一,其他幾個地區的申請量相差不大,具體如圖2所示。

1.3在華專利申請量變化趨勢

圖3為1990年至2014年基于計算機視覺的疲勞駕駛檢測在華的申請量變化趨勢圖,由該圖可以看出,1990-2002年是技術的萌芽期,在2003年以后申請量才呈現逐年增長的趨勢,并且在2012年-2014年將均維持在較高的申請量。因此,該領域國內雖然起步較晚,但是最近幾年申請量相對其他地區卻具有壓制性的優勢。

1.4在華主要申請人分析

圖4展示了在華主要申請人的申請量份額,主要以科研院所和大型汽車企業為主,其中吉利汽車公司以領先優勢排名第一。

2主要技術分支的專利申請分析

基于計算機視覺的疲勞駕駛檢測的主要技術分支有:基于人眼的駕駛疲勞檢測、基于人臉的駕駛疲勞檢測、基于嘴巴的疲勞檢測。下面從三個技術分支的發展概況、三個技術分支的主要工作原理及重點專利等方面進行分析。

2.1全球專利申請主要技術分支的申請量趨勢圖

由圖6可知,近年來基于人眼和人臉的駕駛疲勞檢測的申請量呈現較快增長,申請量也較基于嘴巴的疲勞檢測的申請量大,體現了該領域近年來的發展趨勢,并體現出基于人眼和人臉的駕駛疲勞檢測的技術分支發展已較為成熟。三個技術分支在2006年之前,申請量的差別不大且數量均較小,顯示出在2006年以前三個分支的區別并不明顯,發展也較為緩慢,這說明基于計算機視覺的疲勞駕駛檢測也是近10年才興起的一項技術,它依賴于圖像處理技術的發展水平。

2.2在華專利申請主要技術分支的申請量趨勢圖

由圖7可知,三個技術分支在2006年以前均只有零星的申請量,這與該領域在全球的發展情況相符合,基于人眼的疲勞駕駛檢測在華申請量自2006年以來呈現穩步增長,且近年來申請量最大。基于人臉的疲勞駕駛檢測申請量雖小于基于人眼的疲勞駕駛檢測,但近年來的申請量也呈現出穩步增長的勢頭。然而,基于嘴巴的疲勞駕駛檢測雖有增長趨勢,但申請量一直都較小。由此可知,在國內疲勞駕駛的檢測主要是采用人眼檢測和人臉檢測,這兩個分支是國內的研究的熱門,也是今后國內在該領域的發展趨勢。

3結語

通過對基于計算機視覺的疲勞駕駛檢測專利的申請量的總體分析,以及基于人眼、基于人臉、基于嘴巴三個技術分支的申請量趨勢分析可知,基于計算機視覺的疲勞駕駛檢測在近10年取得了較快發展,這與計算機圖像處理技術的發展密不可分;同時,科研院所作為該領域研究的主體,應加強與中小企業的合作。國內疲勞駕駛的檢測研究主要集中在人眼檢測和人臉檢測,這兩個分支是國內的研究的熱門,同時,基于人眼的疲勞檢測其發展方向明確,后續發展將集中在眼睛定位算法的研究上,并且定位精度將越來越高,越來越滿足實際的要求。

計算機視覺論文:一種基于計算機視覺的手指特征識別算法研究及其FPGA實現

摘 要: 為了提高視頻圖像中手指特征識別的精度和速度,提出一種基于矩形模板的動態閾值算法。該算法采用矩形模板平滑圖像,用灰度閾值法提取目標邊緣,實現對手指特征的準確識別。Matlab仿真結果表明,該算法受環境噪聲影響較小,能清晰準確地分割出手指邊緣。在FPGA平臺上設計了一套基于計算機視覺的手指特征識別系統,并對該系統的實時性、手指識別精度等性能進行了測試。測試結果表明,該系統的運行速度與攝像頭攝取圖像的速度基本同步,可滿足系統對實時性要求。系統對手指位置識別的坐標偏差約為3個像素,基本滿足系統對識別精度的要求。

關鍵詞: 計算機視覺; 手指特征識別; 動態閾值算法; 矩形模版

S著科學技術的飛速發展,人與計算機之間的交互活動越來越密切,并逐漸成為人們日常生活的重要組成部分。傳統觸摸屏是現階段一種最常見,也是最重要的人機交互方式,其是通過一種附加在顯示器表面的透明介質,依賴使用者的手指觸摸該介質來實現對計算機的輸入控制[1?2]。目前,這種觸摸屏技術已經相當成熟,但是,技術上不容易做到大尺寸,且成本相對較高,也易于破損。為了突破傳統觸摸屏這種人機交互方式的局限,把任何成像平面變成可用手指進行交互的系統,本文提出了一種基于計算機視覺的手指特征識別算法,并在FPGA平臺上建立了一套基于計算機視覺的手指特征識別硬件系統。這種基于計算機視覺的手指特征識別方法可為基于視覺的人機互動提供一種新的技術解決途徑。其與傳統觸摸屏的區別在于,不需要在成像屏幕上安裝任何特殊介質,使用壽命得到大幅延長,應用范圍有了很大擴展。

1 圖像采集平臺

本文所采用的圖像采集平臺如圖1所示,在任何與計算機連接的顯示設備(如投影屏幕、等離子電視等)的左上角、右上角安裝兩個攝像頭,通過這兩個攝像頭便可確定手指在屏幕上的二維坐標信息(x1,x2)。然后,將此坐標點傳至計算機,并與Windows系統的鼠標程序關聯即可實現人機交互功能。圖2是圖像采集平臺的側視圖。其中虛線框表示攝像頭視野中系統需要處理的區域,即手指出現的區域。

2 手指特征識別算法及仿真

在系統實現過程中,如何從攝像頭所拍攝的畫面中準確地識別并提取出手指信息是其難點之一。在目前的圖像處理技術中,用于識別背景圖案中目標物體的算法很多,本文在分析基于色彩聚類的膚色識別算法的基礎上,結合課題特殊需求,提出一種基于矩形模板的動態閾值算法,并在Matlab中對上述算法的處理效果進行了仿真。

從圖像采集平臺可以看出,本系統只關心距屏幕很近的小視野內是否出現區別于背景的目標物體。因此,只需從攝像頭拍攝的圖像當中截取一部分,如圖3中的小矩形框所示。

2.1 基于色彩聚類的膚色識別算法

膚色是人體區別于其他物體的一個重要特征,人體膚色特征不受位置、角度、大小等因素影響,具有較強的穩定性。因此,本文首先選定基于色彩聚類的膚色提取識別算法進行研究。在色彩聚類方法中,Anil K.Jain的Cb,Cr橢圓聚類方法最為典型[3?4]。采用非線性分段膚色分割得到的膚色區域在Cb,Cr空間中近似于橢圓,如下:

由圖5可知,利用該算法分割手指信息的效果尚可,能從比較友好的環境中迅速準確地識別出手指信息。圖6為利用橢圓聚類膚色分割算法對從圖像采集平臺讀取圖像的手指識別效果。可見,該算法在普通環境下對手指的識別效果良好。但當屏幕上的顏色影響手指膚色時,該算法的識別能力就會有所降低。可見,該算法對皮膚顏色的純度要求較高,適用范圍受限。圖7為屏幕出現大面積藍色時對手指識別造成的影響效果。

2.2 基于正方形模板的動態閾值算法

基于正方形模板的動態閾值算法,即采用灰度閾值法,用正方形模板平滑圖像[5?6]。圖8(a)是3×3模板動態閾值算法平滑圖像的過程。

應用基于3×3模板的動態閾值算法對原圖4進行邊緣提取的仿真效果如圖9(a)所示。可見,應用3×3模板可以提取出目標物體的邊緣,但不夠清晰。雖然可以通過增大模板取得比較理想的效果(圖9(b)為采用基于101×101模板的動態閾值算法的處理效果),但會使計算量劇增,同時也縮小了模板所能完全覆蓋的范圍,使圖像邊緣產生無效的白色區域。

2.3 基于矩形模板的動態閾值算法

根據課題實際需要,即所要處理的目標區域為長方形窄條區域(如圖3所示),本文提出一種基于矩形模板的動態閾值算法。該算法與基于正方形模板算法的區別在于,平滑圖像時所用的模板為窄條形,如3×5模板,3×15模板,3×41模板等。圖8(b)是3×9模板動態閾值算法平滑圖像的過程。

圖10給出了采用基于3×9模板、3×14模板、3×81模板、3×101模板動態閾值算法對原圖4進行手部邊緣提取的仿真效果。由仿真效果可知,基于矩形模板的動態閾值算法在模板取值為3×9的情況下,便能夠清晰提取出目標物體的邊緣。而且,隨著模板取值的增加,目標物體邊緣的提取效果更加清晰準確。與基于正方形模板的動態閾值算法相比,基于矩形模板的動態閾值算法計算量較小,節約了系統的計算資源。

3 基于FPGA的手指特征識別算法的系統測試

為了驗證本文所提出的基于矩形模板的動態閾值算法能否滿足屏幕交互系統的整體要求,本文通過編寫軟件程序在FPGA開發板上對這種算法進行了硬件實現和系統測試。

3.1 硬件實現

本文所采用的硬件實現系統主要是基于美國Altera公司生產的型號為EFA?CY1C12的“紅色颶風”(Red Cyclone)系列FPGA開發板,并另外集成了用Ommvison公司的型號為OV9655的CMOS數字攝像頭,以及ISSI公司的型號為IS61LV25616AL的SRAM存儲器[7?10]。最終搭建的硬件系統如圖11所示。

3.2 系統測試

本文主要對系統的實時性、手指提取精度、資源占用情況等影響系統運行的重要技術指標進行了測試。

(1) 實時性

OV9655攝像頭在1 280×1 024分辨率下,能提供15 f/s的圖像采集速率,課題所設計的軟件程序可以在一幀圖像的處理時間內完成了數據的采集、手指邊緣的識別等運算,實現了系統執行速度與攝像頭拍攝速度的同步,達到了系統對實時性要求。

(2) 手指識別精度

由于課題在軟件設計過程中編入了圖像采集防抖動處理程序,提高了圖像采集的穩定性,也提高了手指識別的精度。經過測試,本系統得到的手指位置信息的坐標偏差為3個像素,基本滿足大屏幕交互系統對識別精度的需求。

(3) 資源占用情況

從Quartus Ⅱ的編譯報告中可以看出,本系統的軟件運行已占用FPGA的9 702個邏輯單元,占邏輯單元總數的80%。可見,該硬件系統的FPGA運算資源基本能滿足系統的實際需要。

4 結 語

本文通過對基于矩形模板的動態閾值算法的研究和基于FPGA的手指特征識別硬件系統的實現,建立了一套基于計算機視覺的手指特征識別系統。該算法受環境噪聲影響較小,能清晰準確地分割出手指邊緣,且隨著矩形模版取值的增大,算法的識別效果會更加良好。該系統的實時性、手指識別精度及資源占用情況均可滿足系統要求。這種基于計算機視覺的手指識別方法成本低、靈活性好,為基于視覺的人機交互提供了一種新的技術途徑。

計算機視覺論文:基于計算機視覺的運動目標跟蹤算法

摘 要截至目前,運動目標跟蹤已經歷經了幾十年的發展研究,其作為當前社會一項至關重要的先進技術,對于人們的日常工作生活以及社會經濟、軍事政治等其他各領域均有著積極的幫助作用。特別是在計算機視覺技術逐漸發展成熟的今天,運動目標跟蹤與計算機視覺技術的融合程度也越來越高。基于此,本文將選擇當前比較常見的一種目標跟蹤算法即Kalman filter算法,并以運動的人臉作為跟蹤目標,著重圍繞基于計算機視覺的運動目標跟蹤算法進行簡要分析研究。

【關鍵詞】計算機視覺 運動目標 跟蹤算法

在計算機等現代科學技術尚未出現以前,人們在獲取外界信息時往往主要依賴視覺,而在我國計算機技術水平不斷發展提升的背景之下,計算機視覺技術的出現使得人類肉眼視覺得到了進一步的發展延伸,尤其是在各種傳感器技術的幫助之下,使得人們能夠對保持運動狀態的目標進行實時跟蹤,從而準確掌握目標的具體形態屬性。在此背景之下,本文將運動目標設定為運動的人臉,通過探究基于計算機視覺的運動目標跟蹤算法,希望能夠為相關研究人員提供相關參考和幫助。

1 Kalman filter目標跟蹤算法的簡要概述

Kalman filter目標跟蹤算法是當前眾多跟蹤算法當中使用范圍較廣、使用頻率比較集中的一種跟蹤算法,這一算法最早可以追溯至上個世紀六十年代,人們通過將濾波理論與狀態空間模型相集合,從而得到的一種遞推估計的算法也就是卡爾曼濾波理論。其通過利用上一時刻獲取的預估值以及當下獲取的實際觀測值,在信號與噪聲狀態空間模型當中不斷更新狀態變量,進而順利完成估計預測并獲得當前時刻估計預測值。經過不斷的發展,在計算機圖像處理以及其他運動目標跟蹤當中經常會使用Kalman filter算法。如果在k時刻系統下的狀態向量用xk表示,那么在t0時刻下初始化的狀態預測方程為;在tk時刻下更新系統狀態的具體方程為

,其中Hk、Zk分別表示測量矩陣m×n維以及轉移矩陣n×n維的狀態向量。但在跟蹤計算機視覺運動目標譬如說視頻目標時,由于相鄰的兩幀視頻圖像本身時間間隔非常短,因此目標在這一時間內難以發生明顯的運動狀態變化,此時我們可以通過將此間隔時間設定為單位時間,同時目標在單位時間內一直保持勻速運動狀態,這時我們可以得到一個狀態轉移矩陣且

,定義系統觀測矩陣即為

,定義噪聲Wk以及Vk協方差矩陣則可以分別用

和表示。

如果在濾波器在經過若干次卡爾曼濾波后仍然能夠恢復至原始狀態,則其具有較好的穩定性,但如果在進行運動目標跟蹤實驗的過程當中,對于處于運動狀態的被跟蹤目標,一旦出現遮擋行為則將在第一時間內暫停估計參數,并將這一參數估計值直接代入到狀態方程當中,使得運動目標無論是否被遮擋均可以對其進行精確跟蹤。

2 基于計算機視覺的運動目標跟蹤算法

2.1 建立顏色概率模型

顏色囊括了諸多的信息量光柱點,尤其是在人類的視覺世界從本質上來說也是一種用過感知自然界色彩以及明暗變化的世界,因此人們可以通過使用三基色原理獲得RGB顏色空間。考慮到顏色與計算機視覺場景當中各個場景和目標之間有著緊密的關系,同時不同于目標的大小、形態等其他視覺特征,顏色特征鮮少會受到包括觀察視角等在內各因素的干擾影響,從某種角度上來說基于顏色特征的運動目標具有較好的穩定性。為了能夠保障目標跟蹤既穩定又迅速,需要選擇合適的顏色特征,否則將極有可能導致出現跟蹤失敗。在這一環節當中人們通常使用的是RGB顏色空間以及HSI顏色空間,但由于二者均具有一定的局限性,因此本文在對人臉特征尤其是顏色特征進行選取時,選擇了rgI顏色直方圖的方法,在解決兩N顏色空間自身缺陷的同時,盡量避免目標人臉運動位置以及尺寸等變化因素對目標追蹤造成的干擾影響。在rgI顏色直方圖當中其中R、G、B就是RGB顏色空間當中的三原色,r、g、I有著相同的取值范圍即在0到1之間。保持間隔相等的情況下劃分L值即可得到rgI顏色直方圖。雖然rgI顏色直方圖與物體相對應,但如果目標只是位置以及尺寸等出現變化,rgI顏色直方圖并不會受到任何實質性影響,因此在理想情況下,利用rgI顏色直方圖能夠對視頻圖像中不同運動位置以及不同尺寸的人臉進行目標追蹤。

2.2 跟蹤算法

運動目標的不斷變化將會使得模板圖像隨之發生相應變化,因此需要不斷更新模板圖像才能夠有效完成對運動目標的連續跟蹤,本文在對運動目標的實際運動范圍進行預測過程中選擇使用卡爾曼濾波,之后利用rgI顏色直方圖在預測運動范圍之內搜索和匹配相應目標,從而通過此舉獲得與目標模板有著最小歐式距離的區域,在此過程當中存在一個特定閾值T,如果兩者的歐氏距離在進行相減時差值沒有超過這個特定閾值,那么此時該區域就是運動目標所在的實際位置,利用在這一區域當中的rgI顏色直方圖并將其充當下一幀運動目標的匹配模板,在不斷重復的過程中模板能夠實現不間斷地更新。由于相鄰的兩幀視頻圖像之間,時間間隔并不長,因此目標人臉在極短的時間間隔當中基本上不會出現突然變化,此時我們可以認為運動目標人臉的運動連續性比較強,此時利用公式

可以進行歐式距離的計算并用以衡量匹配的模板。其中匹配區域和模板的rgI顏色直方圖分別用l和l'表示,而rgI顏色直方圖中的維數則用n進行表示。根據相關視頻圖像顯示,通過不斷更新模板確實可以對目標運動人臉進行實時跟蹤顯示。

3 結束語

總而言之,本文通過選擇當前比較常見的目標跟蹤算法即Kalman filter算法,利用卡爾曼濾波以及rgI顏色直方圖完成對運動人臉的跟蹤。事實證明,Kalman filter算法確實能夠在對各目標之間的干擾進行明確區分的基礎之上,準確描述運動人臉目標,從而較好地跟蹤運動目標,但由于人臉之間本身存在一定的相似性,因此本文只是對理想狀態下的運動人臉進行跟蹤實驗,日后還需要對計算機視覺技術和Kalman filter算法進行進一步優化以妥善解決多人臉目標以及相似性問題。

作者單位

重慶電子工程職業學院軟件學院 重慶市 401331

計算機視覺論文:基于計算機視覺的室內自主移動機器人導航綜述

摘要:計算機視覺在人工智能學科占據重要地位,為自主移動機器人視覺導航做了深厚的理論鋪墊。基于計算機視覺的自主導航與路徑規劃是自主移動機器人研究的關鍵技術,計算機視覺室內導航技術主要分為3類:第一類是環境地圖事先已知;第二類是同時定位與地圖構建(simultaneouslocalization andmapping,SLAM);第三類是不依賴環境地圖。詳細闡述了每種導航模型和技術方法,探討了基于計算機視覺導航的最新技術進展,總結了目前國內外計算機視覺導航的研究進展。

關鍵詞:計算機視覺;地圖匹配;SLAM;機器人導航;路徑規劃

1概述

計算機視覺在人工智能學科占據重要地位,為自主移動機器人視覺導航做了深厚的理論鋪墊。目前,機器人導航技術有很多種,傳感器導航技術如里程計、激光雷達、超聲波、紅外線、微波雷達、陀螺儀、指南針、速度、加速度計或觸覺等得到了普遍應用,與上述非計算機視覺導航技術相比較,計算機視覺導航技術如人眼般具有靈敏度高且可捕獲的信息量大以及成本低等優點。由于室內相對室外空間比較狹小且內部環境復雜,所以普通移動機器人在作業過程中,完成躲避眼前障礙物、自主導航以及為自身找出一條可行路徑等一系列操作會相對比較困難。計算機視覺導航技術可利用本身的攝像頭獲得室內周圍的環境信息,實時對其周身的場景進行快速反饋,對視野前方障礙物進行快速識別和檢測,從而確定一條高效的可行的安全路徑。本文對計算機視覺導航技術進行分類研究,主要分為3類:第一類是環境地圖事先已知,提前對外界環境特征進行提取和處理,建立全局地圖,并將地圖信息存儲在機器人內存數據庫中,在導航的時候實時進行地圖匹配;第二類是同時定位與地圖構建,移動機器人在自身位置不確定的情況下根據自身的攝像頭獲取周圍未知環境信息,在作業時逐步構建周圍的環境地圖,根據構建的增量式地圖自主實時定位和導航;第三類是不依賴環境地圖,自主移動機器人不需要依賴任何的環境地圖,其在作業活動時的可行區域主要取決于攝像頭實時識別和檢測的環境相對信息。

2環境地圖的表示方法

目前,計算機視覺導航技術多采用柵格地圖、幾何地圖、拓撲地圖和混合地圖構建環境地圖信息。

2.1柵格地圖

柵格地圖,將柵格圖像考慮為一矩形,均分為一系列柵格單元,將每個柵格單元賦予一個平均概率值,并利用傳感信息估計每個單元內部內存障礙物的概率。構建柵格地圖的優點是其地圖表達形式直觀,創建和維護比較容易;但當劃分的柵格單元數量不斷增多時,實時性就會慢慢變差;當劃分的柵格單元越大時,環境地圖的分辨率越低。

2.2幾何地圖

幾何地圖利用幾何特征如點、直線、平面等來構成環境主要框架,需要知道這些特征在環境中信息的具體位置,所以幾何地圖通常使用其對應的三維空間坐標來表示。幾何地圖構建過程相對簡單,保留了室內環境的各種重要信息,是基于計算機視覺的定位與地圖構建算法中最常用的一種表示方式。但是為了完成環境的建模需要標記大量的特征,從而計算量也非常的大,降低了實時性,其重建的地圖也容易出現與全局不一致的情況。

2.3拓撲地圖

拓撲地圖用許多節點和連接這些節點的曲線來表示環境信息。其中,每個節點相對應真實環境中的特征點(如門角、窗戶、椅子、桌子角及拐角等),而節點之間的曲線表示兩個節點對應的地點是相聯通的。拓撲地圖把環境信息表上在一線圖上,不需要精確表示不同節點間的地理位置關系,圖像較為抽象,表示起來方便且簡單。機器人首先識別這些節點進而根據識別的節點選擇節點與節點間的曲線作為可作業的路徑。

2.4混合地圖

混合地圖主要包括3種形式:柵格一幾何地圖、幾何一拓撲地圖以及柵格一拓撲地圖。混合地圖采用多種地圖表示,可結合多種地圖的優勢,與單一的地圖表示相比更具有靈活性、準確性和魯棒性,但其不同類別的地圖結合起來管理會比較復雜,難以協調,增加了地圖構建的難度。文獻針對室內環境所建立的模型分為全局拓撲和局部幾何表述部分,整體環境通過拓撲節點串連起來,維護了整體環境表述的全局一致性;而以每個拓撲節點為優秀所采用的幾何表述則可確保局部精確定位的實現,這樣建立的幾何一拓撲混合環境模型可將二者的優勢都表現出來,使得移動機器人定位和地圖構建同時進行,實現容易。

3基于計算機視覺的室內導航

基于計算機視覺的室內導航技術可利用攝像頭捕獲機器人周圍環境的全部信息,對其周身的場景進行反饋,對障礙物進行快速識別和檢測,從而確定一條高效的可行的安全路徑。本文將計算機視覺室內導航技術主要分為3類:第一類是環境地圖事先已知;第二類是定位與地圖構建同時進行;第三類是不依賴環境地圖。

3.1環境地圖事先已知

提前對外界環境特征進行提取和處理,建立全局地圖,并將地圖信息存儲在機器人內存數據庫中,在導航的時候實時進行地圖匹配,即預存環境地圖。在環境地圖事先已知的導航中,路標信息保存在計算機內存的數據庫中,視覺系統中心利用圖像特征直接或間接向移動機器人提供一系列路標信息,一旦路標被確定后,通過匹配觀察到的圖像和所期望圖像,機器人借助地圖實現自身精確定位和導航。該導航技術過程可分為以下步驟:

a)圖像獲取:攝像頭獲取其周圍的視頻圖像;

b)路標識別及檢測:利用相關圖像處理算法對圖像進行一系列預處理如進行邊緣檢測和提取、平滑、濾波、區域分割;

c)路標匹配標志:在觀察到的圖像和所期望圖像之間進行匹配,搜索現有的路標數據庫進行標志路標;

d)位置計算:當有特征點進行匹配時,視覺系統會根據數據庫中的路標位置進行自身精確定位和導航。

在基于計算機視覺的地圖匹配定位過程中,主要有2種地圖匹配較為典型。

①已知起點,已知地圖。這種條件下的定位稱為局部定位,采用的是一種相對定位的方法,如圖1所示為其位姿估計過程,這種情況目前導航技術研究得最多。

②不知起點,已知地圖。這種條件下的定位稱為全局定位。當機器人需要重置時,通常使用這種定位方法來檢索機器人的當前位置(即姿態初始化)。常用的輔助方法是在環境中添加一些人造信標,如無線收發器,幾何信標,條碼技術,紅外或超聲波接收系統進行位置識別,利用視覺系統識別自然標志,自主定位。

3.2定位與地圖構建同時進行

不知起點,不知地圖。SLAM技術最早由Smith等人于1986年提出,移動機器人在自身位置不確定的情況下根據自身的攝像頭獲取周圍未知環境信息,在作業時逐步構建周圍的環境地圖,根據構建的增量式地圖自主實時定位和導航。在日后的導航研究中,混合地圖中的幾何一拓撲混合環境模型被得到廣泛應用,主要用來解決SLAM問題。

2003年,在解決SLAM技術難題上,Arras等人采用基于Kalman濾波器和最鄰近(nearest neighbor)匹配策略的隨機地圖創建方法。下面是該算法步驟:

a)數據采集:首先初始化系統,從攝像頭傳感器采集距離數據;

b)狀態預測:視覺系統預測機器人運動狀態,實時返回新位姿信息和協方差矩陣,預測地圖;

c)觀測:從原始捕獲的信息中提取主要特征信息并將此信息返回給局部地圖;

d)測量預測:預測機器人當前位姿的全局地圖;

e)位置匹配:應用最鄰近濾波器匹配局部地圖中的觀測點和預測點;

f)估計:使用擴展Kalman濾波器更新地圖;

g)創建:將非相關的觀測點加入地圖,對機器人返回增量式地圖;

h)輸出地圖。

制約機器人視覺系統性能的重要因素是信息實時處理的計算復雜度和處理效率,SLAM算法需要在地圖密度與計算效率之間取得權衡。

3.3無環境地圖

在這類系統中,機器人不需要依賴任何的環境地圖信息,機器人的活動取決于其當時識別和提取出來的環境信息,這些環境信息可能是桌子、椅子和門等,不需要知道這些環境元素的絕對位置。無環境地圖的導航技術典型的技術有3大類:基于光流的導航技術、基于外觀信息的導航技術、基于目標識別的導航技術和基于目標跟蹤的導航技術。

3.3.1基于光流的導航技術

光流是三維空間運動物體在觀測成像面上的像素運動的瞬時速度,也是圖像亮度的運動信息描述。光流法計算最初是由Horn和Schunck于1981年提出的,其利用二維速度場與灰度,引入光流約束方程,得到光流計算的基本算法。光流計算基于物體移動的光學特性提出了2個假設:①運動物體的灰度在很短的間隔時間內保持不變;②給定鄰域內的速度向量場變化是緩慢的。如Santos-Victor等人研發了一種基于光流的robee視覺系統,該系統模擬了蜜蜂的視覺行為。在robee視覺系統中,使用單獨的雙目視覺方法來模擬蜜蜂的中心反射(Centering Reflex):當機器人移動到走廊兩側的墻壁中心時,左眼捕獲場景的瞬時速度與右眼捕獲場景的瞬時速度是相同的,幾乎沒有差別,那么機器人就可以知道他們在走廊的中心。如果眼睛兩側的眼睛的瞬時變化速度不同,則機器人移動到較慢的速度。在自動機器人導航的實現中,基于這個想法是測量攝像機捕獲圖像場景瞬時速度差異。這種導航技術只能用于室內單通道直走道導航,不能引導機器人改變方向,具有一定的局限性。

3.3.2基于外觀信息的導航技術

基于外觀的機器人導航方法,不需要構建真實的地圖導航,機器人通過自身所攜帶的攝像頭和傳感器感知周圍目標的外觀信息進行自主定位和導航。其中,所述的外觀信息多為目標信息的顏色、亮度、形狀、空間大小和物理紋路等。機器人在導航時存儲連續視頻幀的環境圖像信息,并將連續視頻幀與控制指令相關聯,從而再執行指令規劃有效路徑到達目的地。

3.3.3基于目標識別導航技術

為了達到目標點或是識別目標,機器人很多時候只能獲取少量的圖像信息。Kim等人提出了一種用符號代替導航各個位置的賦值方法。該賦值方法中,機器人執行命令如“去窗邊”“去你后面的椅子旁”等。這樣,通過相關的符號命令,機器人自動識別并建立路標,通過符號指令到達目標點。例如“去你后面的椅子旁”,這樣的命令就是告訴機器人路標是椅子、路徑向后。該導航技術的難點在于目標是否可以準確實時識別路標。第一,識別大量不同類別的物體,室內環境有許多不同類別的物體,需要將它們組織到一個在給定的容易搜索圖像數據結構中去,起到容易識別是用什么度量來區分物體;第二,識別大量不同背景下的物體,一個合適的物體表達式有助于將圖像組織成片斷,而這些片斷來自于物體的種類且與物體無關的;第三,在抽象層次上識別物體,機器人可以不需要在看到一個具體的杯子之前便能知道它是一個杯子,相關程序能夠類似的物體進行識別和區分。

3.3.4基于目標跟蹤的導航技術

基于目標跟蹤的導航技術,為機器人構造一個虛擬地圖,機器人通過攝像頭獲取連續的視頻序列確定一個跟蹤的目標,為了達到對目標的精確定位和實時跟蹤,可以利用粒子濾波算法對需要跟蹤的目標進行建模。基于粒子濾波的目標跟蹤主要包含四個階段,分別是初始化目標區域,概率轉移,目標區域權重計算,目標區域重采樣。在機器人導航之前,通過視頻序列的當前幾幀標注機器人所需要跟蹤的目標,在導航時,機器人通過連續的視頻幀感知周圍的待跟蹤目標,同時對所需要跟蹤的目標散播粒子,當獲取的視頻幀對目標區域重采樣后足以讓機器人確定所需要跟蹤的目標時,機器人通過確定的目標為自己規劃最有效的路徑到達目的地。獲取視頻序列目標跟蹤是算機視覺領域中的重要分支,它在工業生產、交通導航、國防建設、航空導航等各個領域有著廣泛的應用。

4結論

本文對近三十年來基于計算機視覺的室內自主式移動機器人導航技術進行了詳細的分類介紹,對于移動機器人是否需要地圖匹配的導航系統進行了詳細的綜述。目前,在做導航和面向任務的決策時,自主機器人尚未能夠準確地綜合考慮真實環境空間中的各種不確定性,當路徑前方突然出現動態場景變化、目標運動、遮檔障礙物時便會顯得一無所措,無法及時把握室內環境變化的動態信息進行實時導航,而這將是未來計算機視覺研究的一大難點和熱點。所以,室內自主移動機器人仍在發展中,還有很多的問題值得研究和探索,現有的機器人大多數都需要人為定期去進行清理和維護,直到今天還沒有產生一臺真正意義上完全自主的移動機器人。

計算機視覺論文:探討計算機視覺技術在圖書館工作中的應用

摘要:隨著科技的不斷發展,計算機視覺技術的發展越來越迅速,它的研究和應用范圍不斷的擴大,已經涉及到制造業、農業、醫療診斷以及軍事領域。本文通過對計算機視覺技術在圖書館工作應用中的探討,了解計算機視覺技術在圖書館實行的效果。

關鍵詞:計算機;視覺技術;圖書館;應用探討

引言

俗話說“書是人類進步的階梯”,各大高校以及各大城市都建有圖書館,圖書館可以滿足人們對各種知識的需求,因此對圖書館的管理工作也是十分重要。如今科技不斷的發展,計算機視覺技術被運用到圖書館管理中。計算機視覺是用攝影機和電腦來代替人眼進行檢測、監控、識別和測量等的機器視覺,它能夠對收集來的圖片和視頻進行處理,然后獲得相應的三維信息。計算機視覺是一門綜合性的學科也是一個富有挑戰性的領域,它已經被應用到各個領域中,它的重要性不言而喻。

一、計算機視覺技術的特點

(一)檢測范圍廣泛

人眼的檢測范圍畢竟有限,有些細微的方面人眼是檢測不到的,比如紅外線、超聲波等,但是計算機視覺技術卻是可以檢測到人眼所檢測不到的范圍。計算機視覺技術可以將紅外線和超聲波處理成圖像呈現出來,它的檢測范圍十分廣泛而且是不加選擇的進行檢測,可以說它的使用大大拓展了人眼的視野。

(二)檢測安全可靠

我們都知道電子產品如果接觸使用必然是會受到一定輻射的,但是計算機視覺與以往的檢測機器不同,它是不需要與被測者進行接觸的,觀測者和被測者都是十分安全不會受到絲毫損傷的,而且它在使用的過程中并不會像人眼一樣感到疲憊,它可以一直進行高效率的工作,因此對其檢測結果也是十分的可靠的。

二、視覺技術在圖書館工作中的應用分析

(一)圖書剔舊和修補

圖書館是人們知識的殿堂,是思想文化知識不斷擴展的地方,因此圖書館的剔舊是一項十分重要的工作。圖書館的空間畢竟有限,一些相對陳舊而利用率較低的參考文獻是需要不定期的進行篩選的,這些資料通常都是表面發黃、布滿灰塵和封面破舊等,而圖書館的剔舊工作大多是由工作人員親自到書庫中進行挑選,這樣不僅工作量大、耗時長還有可能會存在遺漏的現象,而且資料上的灰塵也會給工作人員的身體健康帶來影響。

圖書館會收藏一些珍貴的古籍和字畫,但是時間一長,受到溫度、濕度等的影響會造成古籍和字畫表面發黃、紙張變脆甚至會出現蟲眼,這時候就需要對古籍字畫進行修補工作。這項工作大多由工作人員親力親為,會給工作人員帶來一定的健康影響,如果使用計算機視覺技術代替人們來進行工作,會大大減少工作人員的工作強度,同時也保證了工作效率。

(二)管理職工人員

圖書館中職工人員的正常有序的工作是保證圖書館正常運行的關鍵之處,在進行圖書館職工人員的管理上可以引用計算機視覺技術。以往的職工簽到可能會出現代簽現象,而計算機視覺技術可以采用圖像視覺處理技術對職員進行磁卡、眼膜、人臉識別等進行簽到,杜絕了以往簽到工作所存在的弊端。同時,在圖書館工作處理中,計算機視覺技術也可以幫助職工人員處理一些難題,讓圖書館工作能夠有序高效的進行。

(三)監控檢測系統

如今圖書館的書籍是完全向人們開放的,人們可以自由進行借閱,以往的人工檢測會造成猜疑和尷尬,也會加大圖書館管理人員與讀者之間的磨擦。計算機視覺技術的使用可以全自動化進行監控和檢測,避免了以往人工監測所出現的問題。圖書館的書籍借閱管理工作異常重要,計算機視覺技術可以全程自動化進行高效工作,可以進行無人看管檢測讀者進出攜帶書籍文獻和借閱空間的監控等,大大提高了工作效率,讓圖書館的借閱工作順利有序的進行。

三、視覺技術在圖書館工作中的應用問題的研究

(一)循序漸進的結合

計算機視覺作為一個新興技術,雖然已經被運用到各個領域內,但是在引進入圖書館的管理中,如果想要快速的取代傳統的管理模式,無論是工作人員還是工作理念都不可能及時接受這種改變的。新技術的融入必須要循序漸進,找到與傳統的管理模式的結合點,然后進行慢慢磨合,達到與傳統相結合的效果,這樣人們才能夠接受一種新技術的使用,不僅提高了工作效率減輕了工作人員的工作負擔,也能夠更好的發揮出計算機視覺技術的真正作用。

(二)提高專業人員的業務水平

新的技術需要新的業務水平來支持,如果沒有相應的業務水平是沒有辦法發揮出新技術應有的作用。計算機視覺技術通過計算機成像系統來代替人類的視覺感官,能夠自主適應環境、自主工作的能力。計算機視覺技術在不斷的更新中,它的使用功能也是越來越多,操作方法越來越復雜,這時就需要圖書館的工作人員對計算機視覺技術有細的了解,能夠熟練操作和運用計算機視覺技術。圖書館管理階層應該組織工作人員進行培訓工作,讓他們接收新的知識掌握新的技術,不斷的提高圖書館工作人員的業務水平,才能夠保證圖書館工作高效進行。

(三)讀者素質和應用手段的提高

現代化圖書館要想實現工作和服務的全面自動化,就需要有現代化技術的支持,計算機視覺技術的引用雖然是一個現代化技術的支持,但是如今僅停留在生物特征的識別領域。比如圖書館如今普遍有門禁系統,這也僅停留在計數功能和監控可沖消磁條的識別和認定上,如果有些讀者素質不高故意去掉這些生物識別,圖書館的門禁系統就沒有辦法阻止這些讀者的進入進出。因此,提高讀者的素質和計算機視覺技術的應用手段,才能夠保證計算機視覺技術在圖書館被廣泛的進行使用。

結束語

計算機視覺技術作為新興的綜合性技術,被運用到工業、農業、醫學、軍事、體育等各個領域,它的出現代替了人類去完成不可能的工作,開拓了人類的視野,提高了工作效率和深度,讓人類從不適應的工作環境中解放出來。計算機視覺被稱為自動化的眼睛,對周圍的空間物體有著傳感、抽象、判斷的能力,它能夠從根本上改變人們的思維方式。

雖然如今計算機視覺技術在圖書館的應用中僅處于初始層面,但是每項新的技術的引用不都是循序漸進需要一個過渡時段嗎?計算機視覺技術雖然進入了瓶頸時期,但是相信在不斷的提高和完善下,一定會突破瓶頸期進入到迅猛發展的時期。計算機視覺技術的提高,能夠讓圖書館更好的發揮其作用,讓人們能夠更快更方便的利用圖書館汲取不同的知識,同時也能夠加快學術的發展和社會的進步。

計算機視覺論文:計算機視覺圖像精密測量下的關鍵技術

摘 要近代測量使用的方法基本上人工測量,但人工測量無法一次性達到設計要求的精度,就需要進行多次的測量再進行手工計算,求取接近設計要求的數值。這樣做的弊端在于:需要大量的人力且無法精準的達到設計要求精度,對于這種問題在現代測量中出現了計算機視覺精密測量,這種方法集快速、精準、智能等優勢于一體,在測量中受到了更多的追捧及廣泛的使用。

【關鍵詞】精密測量 計算機視覺圖像 關鍵技術

在現代城市的建設中離不開測量的運用,對于測量而言需要精確的數值來表達建筑物、地形地貌等特征及高度。在以往的測量中無法精準的進行計算及在施工中無法精準的達到設計要求。本文就計算機視覺圖像精密測量進行分析,并對其關鍵技術做以簡析。

1 概論

1.1 什么是計算機視覺圖像精密測量

計算機視覺精密測量從定義上來講是一種新型的、非接觸性測量。它是集計算機視覺技術、圖像處理技術及測量技術于一體的高精度測量技術,且將光學測量的技術融入當中。這樣讓它具備了快速、精準、智能等方面的優勢及特性。這種測量方法在現代測量中被廣泛使用。

1.2 計算機視覺圖像精密測量的工作原理

計算機視覺圖像精密測量的工作原理類似于測量儀器中的全站儀。它們具有相同的特點及特性,主要還是通過微電腦進行快速的計算處理得到使用者需要的測量數據。其原理簡單分為以下幾步:

(1)對被測量物體進行圖像掃描,在對圖像進行掃描時需注意外借環境及光線因素,特別注意光線對于儀器掃描的影響。

(2)形成比例的原始圖,在對于物體進行掃描后得到與現實原狀相同的圖像,在個步驟與相機的拍照原理幾乎相同。

(3)提取特征,通過微電子計算機對掃描形成的原始圖進行特征的提取,在設置程序后,儀器會自動進行相應特征部分的關鍵提取。

(4)分類整理,對圖像特征進行有效的分類整理,主要對于操作人員所需求的數據進行整理分類。

(5)形成數據文件,在完成以上四個步驟后微計算機會對于整理分類出的特征進行數據分析存儲。對于計算機視覺圖像精密測量的工作原理就進行以上分析。

1.3 主要影響

從施工測量及測繪角度分析,對于計算機視覺圖像精密測量的影響在于環境的影響。其主要分為地形影響和氣候影響。地形影響對于計算機視覺圖像精密測量是有限的,基本對于計算機視覺圖像精密測量的影響不是很大,但還是存在一定的影響。主要體現在遮擋物對于掃描成像的影響,如果掃描成像質量較差,會直接影響到對于特征物的提取及數據的準確性。還存在氣候影響,氣候影響的因素主要在于大風及光線影響。大風對于掃描儀器的穩定性具有一定的考驗,如有稍微抖動就會出現誤差不能準確的進行精密測量。光線的影響在于光照的強度上,主要還是表現在基礎的成像,成像結果會直接導致數據結果的準確性。

2 計算機視覺圖像精密測量下的關鍵技術

計算機視覺圖像精密測量下的關鍵技術主要分為以下幾種:

2.1 自動進行數據存儲

在對計算機視覺圖像精密測量的原理分析,參照計算機視覺圖像精密測量的工作原理,對設備的質量要求很高,計算機視覺圖像精密測量儀器主要還是通過計算機來進行數據的計算處理,如果遇到計算機系統老舊或處理數據量較大,會導致計算機系統崩潰,導致計算結果無法進行正常的存儲。為了避免這種情況的發生,需要對于測量成果技術進行有效的存儲。將測量數據成果存儲在固定、安全的存儲媒介中,保證數據的安全性。如果遇到計算機系統崩潰等無法正常運行的情況時,應及時將數據進行備份存儲,快速還原數據。在對于前期測量數據再次進行測量或多次測量,系統會對于這些數據進行統一對比,如果出現多次測量結果有所出入,系統會進行提示。這樣就可以避免數據存在較大的誤差。

2.2 減小誤差概率

在進行計算機視覺圖像精密測量時往往會出現誤差,而導致這些誤差的原因主要存在于操作人員與機器系統故障,在進行操作前操作員應對于儀器進行系統性的檢查,再次使用儀器中的自檢系統,保證儀器的硬件與軟件的正常運行,如果硬軟件出現問題會導致測量精度的誤差,從而影響工作的進度。人員操作也會導致誤差,人員操作的誤差在某些方面來說是不可避免的。這主要是對操作人員工作的熟練程度的一種考驗,主要是對于儀器的架設及觀測的方式。減少人員操作中的誤差,就要做好人員的技術技能培訓工作。讓操作人員有過硬過強的操作技術,在這些基礎上再建立完善的體制制度。利用多方面進行全面控制誤差。

2.3 方便便攜

在科學技術發展的今天我們在生活當中運用到東西逐漸在形狀、外觀上發生巨大的變大。近年來,對于各種儀器設備的便攜性提出了很高的要求,在計算機視覺圖像精密測量中對設備的外形體積要求、系統要求更為重要,其主要在于人員方便攜帶可在大范圍及野外進行測量,不受環境等特殊情況的限制。

3 計算機視覺圖像精密測量發展趨勢

目前我國國民經濟快速發展,我們對于精密測量的要求越來越來高,特別是近年我國科技技術的快速發展及需要,很多工程及工業方面已經超出我們所能測試的范圍。在這樣的前景下,我們對于計算機視覺圖像精密測量的發展趨勢進行一個預估,其主要發展趨勢有以下幾方面:

3.1 測量精度

在我們日常生活中,我們常用的長度單位基本在毫米級別,但在現在生活中,毫米級別已經不能滿足工業方面的要求,如航天航空方面。所以提高測量精度也是計算機視覺圖像精密測量發展趨勢的重要方向,主要在于提高測量精度,在向微米級及納米級別發展,同時提高成像圖像方面的分辨率,進而達到我們預測的目的。

3.2 圖像技術

計算機的普遍對于各行各業的發展都具有時代性的意義,在計算機視覺圖像精密測量中運用圖像技術也是非常重要的,在提高圖像處理技術做以提高。同時工程方面遙感測量的技術也是對于精密測量的一種推廣。

4 結束語

在科技發展的現在,測量是生活中不可缺少的一部分,測量同時也影響著我們的衣食住行,在測量技術中加入計算機視覺圖像技術是對測量技術的一種革新。在融入這種技術后,我相信在未來的工業及航天事業中計算機視覺圖像技g能發揮出最大限度的作用,為改變人們的生活做出杰出的貢獻。

作者單位

常州信息職業技術學院 江蘇省常州市 213164

計算機視覺論文:基于計算機視覺的人臉檢測與識別技術初探

隨著計算機技術和網絡技術的飛速發展,計算機已深入到社會的各個領域,并深刻的改變人們的工作、學習和生活方式。信息的獲取、分析、處理、、應用能力已經成為社會中人們的一個必備的技能。多媒體技術也在發生著日新月異的變化,包括這多媒體技術的基本概念、圖像、音頻、視頻、動畫的常用處理工具等。其中人臉檢測與識別技術在計算機視覺方面也是尤為重要的,人臉檢測與識別技術主要是用于身份信息的識別,也可以用來對個人的隱私信息通過識別來進行保護。

誕生于20世紀40年代的電子計算機是人類最偉大的發明之一。并且一直以飛快的速度發展著。進入21世紀的現代社會,計算機已經進入各個行業,并成為各行業必不可少的工具。如今的計算機發展的更加智能化,就如今來說,人們最什么事情都非常重視信息,人類和社會的發展,時刻都離不開信息。計算機如今重視的方面就是對信息的閱讀和控制,人臉檢測與識別技術也是應運而生。

人臉識別的論述

人臉識別是人類視覺中的一大特色,因為能對身邊的人進行識別,才不會對身邊的信息進行混淆,簡單來說,根據人臉可以對人的年齡,性別進行初步判斷。隨著計算機技術的智能化,計算機業已經通過視覺能進行人臉的識別。其中在對人臉識別的同時進行有關信息的收集、識別、提取、變換、存儲、傳遞、處理、檢索、檢測、分析和利用等技術。如今人臉識別已經應用于很多的領域,但是要人臉檢測與識別是需要基于本來已經收集和整理的信息本庫才能進行。再加上現在計算機技術雖然已經接近成熟,然而在人臉識別方面的表情傳達出什么信息還是無從下手進行編程和設計。所以,基于計算機視覺的人臉檢測與識別技術還是會有很廣的發展空間,再加上人臉識別還可以維護人們的財產安全和隱私保護,必然會引起社會各界人士的廣泛關注。

從19世紀末開始就已經有人對人臉識別進行了研究,因為當時沒有先進的科學技術做后盾,所以經過了數百年的研究仍然沒有什么顯著的進展和成果。直到20世紀90年代人臉識別才成立了自己的學科,在加上當時的科技發展水平已經達到了不錯的水平,人臉識別這個學科得到了快速的發展。如今,我國的計算機技術也已經居于世界的前列,我國也已經擁有比較完善的一套東方面孔的人臉數據庫。

人臉識別在發展過程中大概經歷了三個階段:第一階段就是對人臉特征進行整理,整理出所需要的數據庫,并且應用當時的計算機技術做出一套質量不錯的人臉灰度模型,這個階段的識別工作全部由操作人員來完成;第二階段比第一階段要先進,有了基礎人機互交,將人臉的特征經過多維度的矢量在模型上表示出來,并也可以設計出一套人臉識別的系統,這個階段的識別不再是僅僅依靠操作人員,而是操作者和計算機一起完成;第三個階段是計算機智能識別的最高峰,一切操作和識別都依靠機器全自動化進行,在人臉識別過程中也不再是每臺計算機都需要完成一整套的工作,也實現了計算機與計算機之間的互聯,多臺計算機一起完成人臉識別的過程,都人力也是一種解放。

積極踐行人臉檢測識別技術

人臉檢測識別技術是計算機實現智能化特征后的又一重要發展方向之一,它已經在世界范圍內得到了廣泛的普及與應用。人們可以通過人臉識別來進行定位,來起到保護人們財產安全的作用,通過人臉識別來抵制社會中的造假率,之前曾經有一些不法分子利用假身份來做損害公共利益和侵犯人們隱私權的事情,有了人臉識別讓不法分子沒有可乘之機,也應用人臉識別來對財務密碼進行聯系,起到對人們的財產有絕對的保護作用,對社會的安定何嘗不是一項有意義的發明。

人臉識別一直是計算機智能化發展過程中的一個重要領域,因為人臉的識別與檢測是一個很難做到完善的項目,由于人類的面部表情豐富,要對人類的面部表情做出判斷和分析會存在一定的困難。再加上人臉識別的過程中,每個獨立存在的個體都有一張專屬于自己的臉。它的輪廓沒有明顯的特征界限,同時對眼、鼻子、嘴等器官在臉上的分布情況也沒有明確的界限,這就使得對人臉識別來進行算法設計有一定的困難,所以只有通過輪廓特征來進行初步的判斷,分辯出各種器官,再根據器官來完成人臉的分布情況設計灰度模型的完成工作。

隨著紅外光的可利用率提高,也應用到了人臉識別的領域,在人臉識別過程中也加入不同光的效果來識別人臉,使得如今的人臉識別的準確度有了明顯的提高。但是光的效果是不可控的,在環境不適宜和用戶不配合的情況下,利用紅外光技術來進行人臉識別又會將準確度拉到很低的成度。因此,在人臉檢測與識別方面仍然有一些尚未解決的問題,值得人們關注和探索。

科學的進步、時代的進步,必將給發展賦予新的內容。這個社會已經成為了一個信息化社會,信息化代表了一種信息技術被高度重視,信息資源被高度共享,從而使得人的智力和潛力以及社會物質資源潛力被充分發揮。在這個信息化社會中最重要的就是信息。個人信息已經成為在社會中必備的物質。如此看來信息的保護也成為了發展的頭等大事,基于計算機視覺的人臉檢測與識別技術也有了發展的獨特性,它的獨特性由這個時代所決定。

計算機視覺論文:計算機視覺創新研究的探索者

人類正在進入后信息時代,計算機越來越廣泛地進入到幾乎所有的科技和生活領域。現代計算機具有強大的功能和運行速度,但與人腦相比,其智能化程度仍有待提高。如何讓計算機具有類人腦的學習與分析能力,擁有“視覺”“聽覺”,并可通過“思考”與人類溝通交流,是當今世界計算機視覺研究領域各國科學家不斷追求和探索的目標。

計算機視覺是人工智能領域的優秀之一,其研究的終極目標是讓機器具有人一樣的視覺功能。西安交通大學電子與信息工程學院楊國安教授在計算機視覺領域沉心研究多年,為計算機視覺的發展提供了豐富的理論基礎。

“西安交通大學鄭南寧院士是圖像處理、計算機視覺和模式識別領域的國際知名專家,是他2001年把我從日本引進回來的。”這是楊國安選擇計算機視覺和圖像處理領域的契機。在該領域,楊國安主要研究新型的小波變換、多尺度幾何分析和壓縮感知理論,對這些最前沿的理論進一步地改進,以提高圖像分析與理解的能力、計算機視覺模型的精度、大數據的模式分類的效率以及互聯網圖像檢索的正確識別率。

留學回國后,楊國安在鄭南寧院士團隊參與完成了多項國家項目,包括國家自然科學基金創新研究群體項目“智能化視覺信息處理理論與實現技術”,國家自然科學基金重點項目“高效可伸縮視頻編解碼基礎理論與方法研究”,國家重點基礎研究發展計劃項目“視覺信息環境感知與識別關鍵技術”,國家科技支撐計劃項目“數字媒體內容互通共用關鍵技術”,國家高技術研究發展計劃項目“基于離散小波變換的JPEG2000圖像處理及場景數據實時傳輸”等。其中,在國家科技支撐計劃項目中,楊國安取得國家發明專利“一種分布式多格式數字視頻轉碼結構設計方法”的正式授權。該項專利開發出了一種分布式多格式數字視頻轉碼結構設計新方法:對源視頻文件解復用后將視頻進行快速無縫分割,通過動態調度程序,將視頻片段以及音頻文件發送到各個轉碼計算機上進行快速多格式轉碼,在輸入某一種格式的視頻后只需解碼一次,便能輸出多種格式的碼流,并且能對輸出碼流進行很好的碼率控制,最后收集轉碼后的視頻片段進行無縫拼接并與轉碼后的音頻文件復用。該項專利不僅改善了像素域級聯轉碼器的轉碼效率,也增強了視頻轉碼后的質量,并在我國相關電視廠家得到實際應用,取得了良好的社會和經濟效益。

目前,罟安正在主持國家自然科學基金項目“基于生物視覺稀疏編碼特性和顯著性特征的多尺度幾何分析紋理模型研究”。他介紹說,今后的研究重點將是進一步研究基于多尺度幾何分析和脈沖耦合神經網絡的生物視覺模型,并將其應用到大數據的模式識別以及互聯網圖像檢索上。

學術方面,楊國安有木哿Γ砥礪前行。他長期兼任IEEE Transactionson Signal ProcessingENeural Networks等世界頂級期刊的通信評審專家,并在IEEE,Elsevier和springer等知名期刊和國際會議上發表SCI和EI收錄論文30余篇,其中SCI收錄8篇,EI收錄21篇,取得國家專利2項,出版“十一五”至“十三五”規劃教材各1部,為碩士和博士研究生開設課程,培養碩士研究生和博士研究生30余名,2016年2月又培養出交通大學歷史上第一位日本博士留學生。

在科研的世界里,只有腳踏實地,持續奮斗與攀登,才可能收獲點點星光。在20余年的研究工作中,楊國安亦是如此勉勵自己,不斷創新,突破傳統。相信在未來,他一定能收獲一片屬于他的星空。

亚洲精品无码久久久久久久性色,淫荡人妻一区二区三区在线视频,精品一级片高清无码,国产一区中文字幕无码
日本性爱视频观看久久 | 亚洲视频中文字幕更新 | 女同欧洲亚洲一区二区 | 亚洲日本在线在线看片 | 亚洲AV综合色一区在线 | 在线精品免费看国产 |