【導讀】在人們從自然界獲取的各種信息中,視覺獲取量最高,約占總信息量的80%。隨著信息技術的發(fā)展,人類的視覺功能逐步被賦予計算機、機器人或其他智能機器。目前正處在行業(yè)風口的機器視覺就是這樣一種技術,它通過圖像處理實現(xiàn)自動檢測和分析應用,包括自動檢測、過程控制和機器人導航等。目前,機器視覺(MV)技術已經實現(xiàn)產品化。視覺傳感器、鏡頭、高速相機、光源、視覺軟件、圖像采集卡、視覺處理器等都變得越來越完善。在工業(yè)自動化環(huán)境中,機器視覺越來越受到行業(yè)的關注,并被大量用于諸如自動駕駛汽車、食品生產、包裝和物流、機器人和無人機等。
機器視覺
在人們從自然界獲取的各種信息中,視覺獲取量最高,約占總信息量的80%。隨著信息技術的發(fā)展,人類的視覺功能逐步被賦予計算機、機器人或其他智能機器。目前正處在行業(yè)風口的機器視覺就是這樣一種技術,它通過圖像處理實現(xiàn)自動檢測和分析應用,包括自動檢測、過程控制和機器人導航等。目前,機器視覺(MV)技術已經實現(xiàn)產品化。視覺傳感器、鏡頭、高速相機、光源、視覺軟件、圖像采集卡、視覺處理器等都變得越來越完善。在工業(yè)自動化環(huán)境中,機器視覺越來越受到行業(yè)的關注,并被大量用于諸如自動駕駛汽車、食品生產、包裝和物流、機器人和無人機等。
當提到機器視覺時,技術人員可能會很多理解,本文嘗試著從四個方面逐一解釋有關機器視覺應了解的真相。
真相一:機器視覺≠計算機視覺
機器視覺是一種通過光學設備和非接觸傳感器自動接收和處理真實物體圖像的設備,以獲取所需信息或控制機器人的運動。自20世紀50年代開始運行,從1980年到1990年,這項技術真正開始起飛并逐漸普及。經過數(shù)十年的發(fā)展,機器視覺已經為它是什么以及它是如何工作的積累了各種定義。
自動化成像協(xié)會(AIA)給出了一個更具廣義意味的定義,即:機器視覺包括所有工業(yè)和非工業(yè)應用,其中硬件和軟件的組合為設備執(zhí)行基于圖像捕獲和處理的功能提供操作指導。而SearchEnterpriseAI則給出了機器視覺的狹義定義,將其稱之為“計算機的視覺能力”,該系統(tǒng)使用一個或多個攝像機、模數(shù)轉換(ADC)和數(shù)字信號處理(DSP),將產生的數(shù)據(jù)傳輸?shù)接嬎銠C或機器人控制器。
在實際應用中,機器視覺通常需要與其他先進的技術協(xié)同工作,包括自然語言處理、機器人過程自動化(RPA)、人工智能(AI)和機器學習(ML)等,以實現(xiàn)自動化所需的“視覺”功能。你可以把機器視覺看作是自動化的眼睛,AI和ML是大腦,RPA提供了完成工作所需的“鍵盤手”。近年來,自動化的采用速度不斷加快,這對企業(yè)保持行業(yè)競爭力至關重要。如果把自動化想象成“數(shù)字化員工”在工作,假如不增加機器視覺,那么所有這些“數(shù)字化員工”都會處于失明狀態(tài)。
計算機視覺也是近年來的行業(yè)大熱門,那么它與機器視覺又有什么關聯(lián)呢?宏觀來講,機器視覺是一種以新的方式與現(xiàn)有技術集成并應用于解決現(xiàn)實世界問題的技術能力,是一門系統(tǒng)工程學科。而計算機視覺是計算機科學的一種形式,不是通過固定在機器人上的視覺設備如攝像頭等有形硬件來實現(xiàn)的。
更具體來說,機器視覺是一個系統(tǒng)的主體,而計算機視覺是系統(tǒng)的智能,是處理信息的大腦。沒有計算機視覺,機器視覺將無法工作。機器學習、深度學習和神經網絡是通過機器視覺系統(tǒng)以更快的速度處理項目的三種技術。這三種技術可用于擴大機器視覺對要定位的內容的理解,使其成為機器視覺的寶貴資產。隨著計算機視覺技術的進步,機器視覺潛在應用的可能性也相應增加。
值得注意的是,機器視覺與圖像處理同樣是兩個不同的概念,圖像處理是一個輸出圖像的過程,而機器視覺系統(tǒng)可以檢測和分類廣泛行業(yè)中的各種物體和項目,包括汽車、電子和半導體、食品和飲料、道路和車輛交通或智能運輸系統(tǒng)(ITS)、醫(yī)療成像、包裝、標簽和印刷、制藥、電視廣播等,基于機器視覺的技術正在成為自動化創(chuàng)建的核心。
真相二:
硬件和軟件的發(fā)展促成了機器視覺的進步
機器視覺是工業(yè)自動化的眼睛。其主要工作流程是:系統(tǒng)通過機器視覺產品(如攝像頭、CMOS或CCD)將拍攝的目標轉換為圖像信號,然后將圖像信號傳輸?shù)綄S脠D像處理系統(tǒng)。根據(jù)像素分布、亮度和顏色等信息,再將圖像信號轉換為數(shù)字化信號,最終使機器(機器人或其他工業(yè)工具)能夠完成制造和質量驗證等工業(yè)任務。
機器視覺是工業(yè)4.0的關鍵要素,它正以多種方式幫助工業(yè)自動化系統(tǒng),例如通過改善庫存、檢測故障產品和提高制造質量來提高效率。若要準確地模擬人類的感知,機器視覺需要一系列設備和軟件的幫助。而這些軟硬件技術的不斷發(fā)展進一步推動了機器視覺技術的演進。
#01
智能攝像頭
攝像頭(camera)是機器視覺系統(tǒng)中檢查物體或物品的主要設備。有時,一個特定的檢查點可能需要安裝多個攝像頭,以確??梢哉_檢查每一個細節(jié)。當機器視覺系統(tǒng)需要從圖像中捕獲和提取特定應用程序的信息時,這時就需要智能攝像頭的支持。智能攝像頭通常包含所有必要的通信接口,并可連接到Wi-Fi或服務器,以便傳輸捕獲的圖像數(shù)據(jù)。作為一種強大工具,深度學習能使系統(tǒng)設計師快速實現(xiàn)復雜且主觀決策的自動化,同時有效提高產品質量和產能。由Teledyne Flir公司提供的FLIR Firefly DL攝像頭,內建的深度學習推斷使得該產品不再需要任務分類的主機系統(tǒng),大大降低了系統(tǒng)的成本和復雜性。Firefly DL攝像頭尺寸小巧、重量輕且功耗低,非常適合嵌入移動、桌面和手持系統(tǒng)。
圖1:Teledyne公司FLIR Firefly DL攝像頭,具有尺寸小巧、功耗低等特點
(圖源:Teledyne)
Omron Industrial Automation公司的S133 UVC彩色CMOS攝像頭同樣是一款智能攝像頭產品,它內置CMOS傳感器,采用超緊湊結構,即插即用,是尋找具有機器視覺功能攝像頭的理想選擇。由于使用方便,S133 UVC彩色CMOS攝像頭深受工業(yè)/機器視覺應用、汽車、生命科學等領域的歡迎。
圖2:S133 UVC彩色CMOS攝像頭
(圖源:Omron)
#02
3D攝像頭
3D攝像頭可以在圖像中顯示被檢測物的深度,以顯示圖像的不同角度。通過在機器視覺系統(tǒng)中使用3D攝像頭,將帶來不同的視角和深度感知。飛行時間(ToF)攝像頭是使用飛行時間原理測量距離的3D攝像頭。ToF成像技術允許它在不掃描物體的情況下進行3D成像,該技術通??筛采w幾米到約40米的距離,每秒最多100張圖像,距離分辨率約為5到10毫米,橫向分辨率約為200 x 200。
歷史上,因對ToF的準確性存在一些質疑,人們通常將其視為精度較低的3D傳感技術。當然,近些年很多頭部企業(yè)已經開發(fā)出高達130萬像素的高分辨率產品,用于機器視覺系統(tǒng)的高精度ToF攝像頭能顯著提高生產的靈活性和自動化程度。索尼公司的IMX556 DepthSense ToF傳感器采用CAPD和背面照明(BSI)技術,與市場上現(xiàn)有的ToF解決方案相比,能夠提供精確到毫米的精度,在6米工作距離下,以30fps的速度提供640 x 480的分辨率。
圖3:索尼IMX556 DepthSense ToF傳感器能夠更可靠地以3D格式,更詳細更快速的幀率重建被測物體
(圖源:Sony)
Texas Instruments的OPT8241飛行時間 (ToF) 傳感器,將ToF傳感與模數(shù)轉換器和可編程定時發(fā)生器(TG)相結合,該器件能以高達150幀/秒的幀速率提供320 x 240分辨率的圖像。內置的TG可控制復位、調制和讀出數(shù)字化序列。同時,TG具備可編程性,可靈活優(yōu)化各項深度感知性能指標,例如功率、運動穩(wěn)健性、信噪比和環(huán)境消除等。
圖4:TI公司OPT8241 ToF傳感器系統(tǒng)框圖
(圖源:TI)
#03
視覺傳感器
視覺傳感器是機器視覺系統(tǒng)的核心,是最大化環(huán)境特性的來源,其核心設備是CCD、CMOS等圖像傳感器。這些分辨率較高的視覺傳感器通常能夠生成包含更多像素的圖像,非常有助于提高圖像質量,更容易識別視覺細節(jié)。
長期以來,CCD傳感器是捕獲高質量、低噪聲圖像的主流技術。但是CCD傳感器的制造成本很高,因此價格普遍較高,功耗也要比CMOS傳感器高很多。如今,CMOS傳感器技術已經發(fā)展到可以快速接近CCD技術的質量和功能,并且價格更低,體積更小,功耗更低。CMOS相機的幀速率通常要高于CCD相機,對于那些依賴實時圖像處理進行自動化或圖像數(shù)據(jù)分析的機器視覺系統(tǒng)而言,此功能至關重要。另外,CMOS傳感器比CCD傳感器對紅外波長更敏感,CMOS芯片和相機制造商利用這一優(yōu)勢可捕獲紅外線,為圖像識別提供了額外的成像能力。兩相權衡,CMOS傳感器可能更加適合機器視覺應用。
安森美(onsemi)AR0130是一款1/3英寸CMOS數(shù)字圖像傳感器,有源像素陣列為1280H x 960V,使用滾動快門讀數(shù)捕獲圖像。該產品包括復雜的相機功能,如自動曝光控制,窗口,以及視頻和單幀模式。AR0130能夠拍攝非常清晰的數(shù)字圖像,并且能夠捕獲連續(xù)視頻和單幀,尤其適合高性能機器視覺應用。
#04
光源
作為一種輔助成像設備,光源對成像質量往往起到至關重要的作用。以LED照明產品為例,它們具有更高的靈活性,具有可調角度和附加波長,更一致的光譜響應。市場上有多種波長和形狀的光源可供選擇,產品的選擇并不難。
#05
圖像采集卡
圖像采集卡通常以電腦插卡的形式存在,它的主要工作是將圖像輸出傳送到計算機主機。圖像采集卡需要將來自相機的模擬或數(shù)字信號轉換為特定格式的圖像數(shù)據(jù)流,還可以控制相機的一些參數(shù),例如觸發(fā)信號、曝光/積分時間、快門速度等。圖像采集卡通常針對不同類型的相機具有不同的硬件結構,同時也具有不同的總線形式,如PCI、PCI64、Compact PCI、PC104、ISA等。
#06
視覺處理軟件
機器視覺軟件用于完成輸入圖像數(shù)據(jù)的處理,然后通過一定的計算就可以得到需要的結果。通用機器視覺軟件以C/C++圖像庫、ActiveX控件和基于圖形的編程環(huán)境等形式出現(xiàn),可以專用,例如僅用于LCD檢測、BGA檢測、模板對齊等,或通用,包括定位、測量、條形碼/字符識別、斑點檢測等。
真相三:
機器視覺市場發(fā)展迅速,汽車行業(yè)功不可沒
機器視覺在自動化方面的價值在于它能夠快速高效地捕獲和處理大量文檔、圖像和視頻,其數(shù)量和速度遠遠超過人類的能力。
廣闊的應用前景和巨大的市場潛力決定了機器視覺必將是一個不斷增長的市場,Markets and Markets的數(shù)據(jù)表明,機器視覺的市場規(guī)模預計將從2020年的107億美元增長到2025年的147億美元,復合年增長率為6.5%。
根據(jù)grand view research的數(shù)據(jù),2021年,全球機器視覺市場規(guī)模為132.3億,預計2022年至2030年將以7.7%的復合年增長率(CAGR)增長。汽車、食品和飲料、制藥和化工以及包裝領域對視覺引導機器人系統(tǒng)的需求是推動市場增長的主要動力。其中,汽車行業(yè)依然是全球最大的機器視覺系統(tǒng)采用者,在2021年,來自汽車行業(yè)的收入份額超過了15.0%,預計未來幾年仍將繼續(xù)穩(wěn)步增長。
圖5:按照行業(yè)劃分,2020年--2030年美國機器視覺市場發(fā)展趨勢
(圖源:grand view research)
真相四:
機器視覺在機器人應用中將大顯身手
在市場范圍和應用方面,機器視覺有很多機會可以擴展。這些機會需要一些想象力,這意味著機器視覺不僅僅是取代技術人員的眼睛,而是充分利用機器人完成技術人員無法完成的任務。機器視覺使得機器人擁有實時、高細節(jié)地“看到”的能力,它允許機器人根據(jù)對象或環(huán)境的綜合視圖做出決策。如今,機器人在世界上的使用越來越多。當機器人配備機器視覺時,會給它們帶來更高的精確度、方向感和理解力,能夠更準確地抓取物品,以更高的精度放置物品,并更快地執(zhí)行更復雜的任務。
機器視覺在機器人應用中正變得越來越重要,根據(jù)自動化促進協(xié)會(A3)最近的一份報告,與2020年相比,機器人和機器視覺市場在2021年第二季度取得了實質性增長。工業(yè)機器人已經被廣泛使用,隨著協(xié)作機器人的出現(xiàn)和3D機器視覺的快速發(fā)展,它們將被更多地結合使用。
機器視覺體現(xiàn)的是一種技術能力,自動化、機器學習、深度學習和神經網絡等其他能力也是如此。這是一種可以集成到其他技術和流程中的能力,用以造福行業(yè)并提高業(yè)務效率?,F(xiàn)在的機器人已經越來越多地內置機器視覺,機器視覺使機器人能夠執(zhí)行更復雜的任務。如果沒有機器視覺告訴機器人物品的確切位置,這些任務是不可能完成的。機器視覺是釋放自動化全部潛力的關鍵,為智能自動化添加了更多智能。
來源:Mouser
免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯(lián)系小編進行處理。
推薦閱讀:
基于傳感器內神經網絡的模擬-信息轉換技術,可顯著降低傳感器功耗