【導(dǎo)讀】在更快的連接速度、更高的自動化程度和更智能系統(tǒng)的推動下,工業(yè)4.0加快了視覺技術(shù)在制造業(yè)中的應(yīng)用,并將智能化引入到以往簡單的數(shù)據(jù)采集系統(tǒng)中。上一代視覺系統(tǒng)負責(zé)捕捉圖像,對其進行封裝以供傳輸,并為后續(xù)的FPGA、ASIC或昂貴的SoC等器件提供圖像數(shù)據(jù)進行處理。如今,工業(yè)5.0更進一步,通過在整個數(shù)據(jù)通路中融入人工智能(AI)與機器學(xué)習(xí)(ML),實現(xiàn)大規(guī)模定制化。攝像頭變得智能化,具備在應(yīng)用層面處理的圖像數(shù)據(jù),僅輸出用于決策的元數(shù)據(jù)。
在更快的連接速度、更高的自動化程度和更智能系統(tǒng)的推動下,工業(yè)4.0加快了視覺技術(shù)在制造業(yè)中的應(yīng)用,并將智能化引入到以往簡單的數(shù)據(jù)采集系統(tǒng)中。上一代視覺系統(tǒng)負責(zé)捕捉圖像,對其進行封裝以供傳輸,并為后續(xù)的FPGA、ASIC或昂貴的SoC等器件提供圖像數(shù)據(jù)進行處理。如今,工業(yè)5.0更進一步,通過在整個數(shù)據(jù)通路中融入人工智能(AI)與機器學(xué)習(xí)(ML),實現(xiàn)大規(guī)模定制化。攝像頭變得智能化,具備在應(yīng)用層面處理的圖像數(shù)據(jù),僅輸出用于決策的元數(shù)據(jù)。
這兩代之間的關(guān)鍵發(fā)展是關(guān)注邊緣端發(fā)生的變化。我們世界本質(zhì)上以模擬為主,許多幫助我們?nèi)粘I畹碾娮优c機電(EEM)系統(tǒng)都是由各類感知輸入驅(qū)動的。視覺(光)、溫度(熱)、音頻(聲)、距離與位置、壓力(觸覺)等系統(tǒng)邊緣端的電子傳感器采集這些物理輸入,并將其轉(zhuǎn)化為處理后的數(shù)據(jù),以實現(xiàn)智能化并方便決策制定。工業(yè)4.0提出了對這類傳感器智能和高效的需求。如今,非工業(yè)及商業(yè)應(yīng)用領(lǐng)域的眾多傳感器不斷發(fā)展,從基礎(chǔ)類型發(fā)展到符合工業(yè)自動化流程和標準的增強版本。
在大規(guī)模采用傳感器的同時,人們也在推動更低功耗的電池驅(qū)動智能設(shè)備廣泛應(yīng)用。功耗給視覺系統(tǒng)帶來了不同的挑戰(zhàn),而圖像傳感器如何以創(chuàng)新的方法解決這些挑戰(zhàn),同時提供卓越的性能,將成為視覺系統(tǒng)的差異化因素。
圖像傳感器--視覺感知的輸入機制
視覺感知已成為在邊緣端采集數(shù)據(jù)的重要方式之一,收集到的圖像數(shù)據(jù)能夠被快速且高效地用于決策制定。例如,若無視覺傳感器,場景中的物體需要無數(shù)個特定的傳感器來傳達場景的構(gòu)成。這會產(chǎn)生大量數(shù)據(jù)并需要龐大的處理工作,或許還得靠好運氣,才能得到場景的真實呈現(xiàn)。另外,在高效的系統(tǒng)中,一張圖像就可以在一幀數(shù)據(jù)中傳達場景中的所有信息。
這種簡便的數(shù)據(jù)表現(xiàn)形式使圖像傳感器得以加速發(fā)展,為智能手機等消費類移動產(chǎn)品提供支持,其分辨率超過一億像素,在硬件和軟件的支持下,為靜態(tài)圖像和視頻流提供卓越的細節(jié)特征。由于移動產(chǎn)品主要服務(wù)于娛樂和個人應(yīng)用,因此其制定決策的目標略有不同。然而,面向汽車、工業(yè)和商業(yè)應(yīng)用的視覺系統(tǒng)服務(wù)于高度以目標為導(dǎo)向的需求,其中許多系統(tǒng)使用(傳感器)輸出進行基于機器的決策,并要求在分辨率、幀率和功耗之間達到精細平衡。
隨著邊緣智能的重要性日益增強,這些應(yīng)用必須適應(yīng)不同用例需求?,F(xiàn)在,許多應(yīng)用都需要更高的分辨率和更出色的整體性能,以輔助計算機視覺、機器視覺和自動化決的策系統(tǒng)。很多情況下,人們非??释@得更豐富的細節(jié),因為這些細節(jié)有助于減少錯誤決策。隨著分辨率的提高,圖像傳感器中的像素數(shù)量也會增加,相應(yīng)地,傳感器向圖像信號處理器(ISP)或系統(tǒng)芯片(SoC)提供的圖像數(shù)據(jù)量也會增加。傳感器產(chǎn)生的大量圖像數(shù)據(jù)以及ISP/SoC對這些數(shù)據(jù)的處理會導(dǎo)致高功耗,從而給視覺系統(tǒng)設(shè)計帶來巨大負擔(dān)。
圖1 圖像傳感器產(chǎn)生的數(shù)據(jù)隨分辨率和幀速率成指數(shù)增長
現(xiàn)在,設(shè)計人員需要應(yīng)對高功率電子元件帶來的高功率傳輸、功耗和系統(tǒng)物料清單(BOM)成本等問題。雖然降低功耗是大勢所趨,但熱管理也是一個挑戰(zhàn),因為大多數(shù)視覺系統(tǒng)都依賴對流氣流來散發(fā)系統(tǒng)中產(chǎn)生的熱量。圖像傳感器對熱量高度敏感,如果不能選擇適當?shù)脑O(shè)計并有效管理上述因素,就會產(chǎn)生不可靠的視覺系統(tǒng)。
一切始于量子效率
圖像傳感器的量子效率(QE)是指光電二極管最大限度地將入射光子轉(zhuǎn)換成電子的能力。眾所周知,QE 越高,圖像亮度越好。更高的 QE 值在弱光條件下非常重要,這通常通過使用更大的像素尺寸或在場景中添加可見光或不可見光來實現(xiàn)。無論哪種方法,都會增加視覺系統(tǒng)必須支持的成本、功耗和空間,并可能會根據(jù)圖像傳感器的性能和場景條件呈指數(shù)級增長。
圖2 不同波長下可比較像素尺寸的歸一化量子效率曲線
這在通常使用紅外發(fā)光二極管(IR LED)的不可見照明情況下尤其嚴重,其產(chǎn)生的光波長為850nm和940nm。這些波長能被圖像傳感器探測到,但人眼無法察覺。在行業(yè)中,這通常被稱為 "主動照明"。 紅外發(fā)光二極管需要供電并產(chǎn)生功耗,占用大量空間,并顯著增加系統(tǒng) BOM成本。在近紅外光譜中具有高量子效率的圖像傳感器能夠在不犧牲圖像質(zhì)量的前提下,減少其使用數(shù)量、降低光照強度以及總體BOM成本。
圖像質(zhì)量更高,總體擁有成本更低
重要的是要確保圖像傳感器像素提供的高 QE 不會受到數(shù)據(jù)通路其他部分噪聲的影響,從而影響整體圖像質(zhì)量。例如,如果像素結(jié)構(gòu)沒有足夠的像素間隔,像素間串擾就會降低調(diào)制傳遞函數(shù)(MTF)和對圖像的對比度/清晰度,最終影響圖像質(zhì)量。另一個可能造成損害的因素是讀出電路性能不佳導(dǎo)致的高讀取噪聲。
圖像質(zhì)量不佳會給ISP/SoC帶來不必要的負擔(dān),使其需要處理更多的數(shù)據(jù),從而降低視覺系統(tǒng)的整體幀率,或者以更高的時鐘頻率運行來維持相同的端到端時序。在前一種情況下,視覺系統(tǒng)的效率會大大降低,而無論哪種情況,系統(tǒng)最終都會產(chǎn)生更多的功耗。為了應(yīng)對處理負擔(dān),可能需要配備更先進資源的ISP/SoC,這將進一步增加總體BOM成本。而優(yōu)秀的圖像輸出質(zhì)量能夠緩解上述種種不足,降低視覺系統(tǒng)的總體擁有成本。
子采樣模式
安森美(onsemi)公司的圖像傳感器(例如HyperluxTM LP產(chǎn)品系列)已經(jīng)意識到這些操作需求,并集成了多種子采樣模式。這些模式,如合并(Binning)、裁剪(Cropping)和跳采(Skipping),能夠大大減少生成和傳輸所需的帶寬。
安森美Hyperlux LP系列產(chǎn)品
這些功能使視覺系統(tǒng)變得非常智能,能夠根據(jù)用例需求選擇最優(yōu)的功耗/性能配置。例如,在生物識別掃描儀中,現(xiàn)在可以利用配備500萬像素傳感器陣列的單個系統(tǒng),以逐漸增強的掃描方式,完成子采樣模式下的單個指紋掃描到全分辨率面部掃描。最重要的是,ISP/SoC接收到的數(shù)據(jù)量減少,從而降低了其自身及整個視覺系統(tǒng)的功耗。
縮減數(shù)據(jù)規(guī)模
高分辨率圖像傳感器會占用大量帶寬來輸出數(shù)據(jù)。例如,以60幀/秒速度工作的2000萬像素傳感器將傳輸12 Gbps圖像數(shù)據(jù),這些數(shù)據(jù)不僅需要在傳感器內(nèi)部的高速接口中妥善處理,還需要由接收這些數(shù)據(jù)的ISP/SoC進行處理。處理如此龐大的數(shù)據(jù)需要在這些處理引擎中投入昂貴且專用的資源和電力,并可能導(dǎo)致大量的功耗/熱管理問題。此外,接口速度的限制也增加了這一挑戰(zhàn)。
在大多數(shù)應(yīng)用中,可能只有小部分時間需要在全分辨率下全速運行,其余時間則僅需較低分辨率。雖然子采樣模式可以降低帶寬并有其自身優(yōu)勢,但在分辨率選擇或場景完整性方面會受到一定的限制。
傳感器內(nèi)的縮放器有助于克服這些限制,有效滿足低分辨率操作的需求。它們能夠在源頭控制帶寬,而不是由 ISP/SoC 管理。它們能夠在最大程度上提供精細的粒度控制,同時保持完整的視場角(FOV)。安森美 AR2020 圖像傳感器(Hyperlux LP 產(chǎn)品系列的 2000萬像素成員)的圖像縮放算法非常復(fù)雜,即使在分辨率大幅縮放的情況下,也能提供出色的圖像質(zhì)量。舉例來說,雖然獲取遠距離物體的細節(jié)確實需要 2000 萬像素,但可能只需要圖像的某個特定區(qū)域,而不是整個圖像。通過對這一動態(tài)定義的區(qū)域進行裁剪或縮放,就可以獲得 2000萬像素傳感器的優(yōu)勢,而無需持續(xù)處理相當于 2000萬像素的數(shù)據(jù)。
圖4 scaling比binning產(chǎn)生的偽影更少,從而提高圖像輸出效果
盡可能休眠,按需喚醒
傳感器可以處于極低的工作狀態(tài),在大多數(shù)工作時間內(nèi)以低分辨率、最低幀速率運行。當檢測到運動時,它會切換到預(yù)定的配置--運動喚醒(WOM)模式。圖像傳感器有能力處理這些變化,并讓 ISP/SoC 將其切換到所需的模式/配置。它還能進一步屏蔽與應(yīng)用無關(guān)的運動區(qū)域,從而使傳感器和視覺系統(tǒng)更加精準、高效。以前,這一功能是在處理器中完成的,但在傳感器上實現(xiàn)這一功能可減少系統(tǒng)資源和功耗。
圖5 運動喚醒等功能使視覺系統(tǒng)具有高度的目標驅(qū)動性
我們可以看到這些功能在電池供電的應(yīng)用、智能門禁系統(tǒng)、零售掃描儀、醫(yī)療監(jiān)測系統(tǒng)等類似應(yīng)用中產(chǎn)生的深遠影響。電池供電的應(yīng)用從這些傳感器中獲得了最大的好處,因為它們可以最大限度地降低系統(tǒng)功耗。在4K視頻門鈴應(yīng)用中,像安森美AR0830這樣的800 萬像素圖像傳感器在滿負荷狀態(tài)下會傳輸6G數(shù)據(jù),但現(xiàn)在它可以在WOM模式下運行超過98%的工作時間。在預(yù)檢測階段,它產(chǎn)生/傳輸?shù)臄?shù)據(jù)量極低,整個視覺系統(tǒng)的運行功耗僅為全工作模式下的一小部分。
迄今為止,圖像傳感器作為數(shù)據(jù)捕捉和數(shù)據(jù)傳輸器件一直表現(xiàn)出色。正如安森美 Hyperlux LP 產(chǎn)品系列中所展現(xiàn)的那樣,上述趨勢和進步使這些傳感器成為內(nèi)置智能應(yīng)用的強大邊緣器件。通過集成更好的像素技術(shù)、可配置的智能關(guān)注區(qū)域、運動檢測等功能,現(xiàn)在可以被設(shè)計用來滿足特定的用例需求,從而打造出性能卓越且功耗極低的差異化高效視覺系統(tǒng)。
(作者:Onsemi公司 Ganesh Narayanaswamy)
免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請聯(lián)系小編進行處理。
推薦閱讀:
電源轉(zhuǎn)換器熱阻特性分析開架式與基板式密封式的對比
常見的傳統(tǒng)電源還能再戰(zhàn)智能邊緣時代嗎?