你的位置:首頁 > RF/微波 > 正文

毫米波雷達半精度浮點存儲格式分析

發(fā)布時間:2023-08-01 來源:英飛凌 責任編輯:wenwei

【導(dǎo)讀】雷達信號處理需要使用大量內(nèi)存進行中間結(jié)果和最終結(jié)果的保存,而內(nèi)存大小直接影響處理芯片的成本。選擇合適的數(shù)據(jù)存儲格式,既保留較高的信號分辨率和動態(tài)范圍,又不占用太大的存儲空間是相當重要的。本文介紹了TC3xx單片機雷達信號處理單元SPU支持的半精度浮點格式,將其和32bit整型數(shù)格式進行比較,分析了兩者的動態(tài)范圍及實際處理誤差,發(fā)現(xiàn)半精度浮點格式是“性價比”較高的存儲方式。另外,Tricore? CPU還有專用硬件指令支持半精度和單精度浮點格式的相互轉(zhuǎn)換,便于信號的后期處理,并縮短數(shù)據(jù)格式轉(zhuǎn)換時間。


英飛凌技術(shù)專家 錢偉喆


背景介紹


毫米波雷達在較短時間內(nèi)(比如50ms每幀)需要處理大量數(shù)據(jù),數(shù)據(jù)量和收發(fā)天線個數(shù),每個發(fā)波的采樣點數(shù),以及發(fā)波個數(shù)成正比。下面簡單舉個例子,方便量化數(shù)據(jù)大小,使大家有感性認識。比如,采樣點數(shù)為512,發(fā)波個數(shù)為128,典型的3T4R前端射頻芯片,采用碼分調(diào)制方式,實采樣ADC轉(zhuǎn)換結(jié)果為14bit,但考慮到后期便于信號處理,實際上一般使用16bit(2Byte)內(nèi)存空間來存儲。表1列出了各處理階段的數(shù)據(jù)占用內(nèi)存空間大小,由此可見,雷達信號處理對內(nèi)存空間的需求較大,而內(nèi)存大小直接影響芯片成本,所以,能采用一種合理的數(shù)據(jù)格式,既保留較高的信號分辨率和動態(tài)范圍,又不占用太大的存儲空間是相當重要。


1688030457994340.jpg

表1.  各處理階段的數(shù)據(jù)所占內(nèi)存空間大小


數(shù)據(jù)格式


TC3xx單片機的雷達信號處理單元SPU,其輸出支持多種數(shù)據(jù)格式,包括16位、32位整型復(fù)數(shù)或?qū)崝?shù),16位半精度浮點等。其中16位半精度浮點既能保持數(shù)據(jù)的精度又不失較寬的動態(tài)范圍,并且占用內(nèi)存相對較少。根據(jù)IEEE 754標準【1】,16位半精度浮點數(shù)(binary16)的二進制位分為三部分,定義分別如下:


1. 最高一位是符號位。


2. 最高位后面的5位表示2的指數(shù),該值要減去固定值15,才是最終指數(shù)。


3. 剩下的10位(位于小數(shù)點右側(cè))再補上一位非顯性位(該位在小數(shù)點左側(cè)第一位)合成的11位是有效數(shù)。


以下定義摘自Wikipedia【2】。如果忽略subnormal以及無限數(shù)值,半精度浮點有效數(shù)值(normal value)為正的最小值是 2^(-14) ≈ 6.10 × 10^(-5)。數(shù)值為正的最大值是 (2?2^(-10)) × 2^15 = 65504。


1688030443540992.png

表2.  IEEE754半精度浮點的數(shù)值范圍,摘自Wikipedia.


下面我們比較一下32位整型數(shù)和16位半精度浮點數(shù)的動態(tài)范圍,假設(shè)兩者符號都為正。


1688030428533494.jpg

表3. 不同格式數(shù)據(jù)動態(tài)范圍比較


從以上比較發(fā)現(xiàn),兩者的動態(tài)范圍差別是3dB,而使用16位半精度浮點占用的內(nèi)存存儲空間卻是采用32位整型數(shù)的一半,對于所選處理器芯片有較強成本優(yōu)勢。


為了進一步驗證SPU用16位半精度浮點數(shù)和32位整型數(shù)的實際誤差,用Matlab代碼將半精度浮點格式歸一化處理成32位整型格式,之后和SPU實際計算所得32位數(shù)據(jù)做比較。圖1所示是(a) 第一維FFT結(jié)果和 (b)兩者誤差。兩者最大誤差是0.0021dB,而第一維FFT結(jié)果中最大值是78.828dB,該誤差相當小。


1688030413293507.jpg

圖1. (a) SPU 1st FFT計算結(jié)果(dB);(b) 16位半精度浮點數(shù)和32位整型數(shù)的結(jié)果誤差(dB)


格式轉(zhuǎn)換


SPU處理完數(shù)據(jù)后,通常用Tricore? CPU進行下一階段計算。Tricore? CPU集成了硬件指令【3】,可以方便進行單精度浮點和半精度浮點數(shù)格式之間的轉(zhuǎn)換。這兩條指令是:


12.jpg


兩款常用編譯器,Tasking 和Hightec Gnuc 編譯器都支持以上數(shù)據(jù)格式轉(zhuǎn)換指令。


1. 在Tasking環(huán)境中,當指定C編譯選項 --fp-model=-soft,C編譯器會自動生成CPU硬件指令,進行半精度浮點類型(_Float16)和單精度浮點類型(float)之間的格式轉(zhuǎn)換。


2. 在Hightec Gnuc環(huán)境中,__float16 是半精度浮點的格式類型,在編譯時會自動生成格式轉(zhuǎn)換指令。例如以下代碼:


13.jpg


總結(jié)


雷達信號處理需要使用大量內(nèi)存進行中間結(jié)果和最終結(jié)果的保存,而內(nèi)存大小直接影響處理芯片的成本。選擇合適的數(shù)據(jù)存儲格式,既保留較高的信號分辨率和動態(tài)范圍,又不占用太大的存儲空間是相當重要的。本文介紹了TC3xx單片機雷達信號處理單元SPU支持的半精度浮點格式,將其和32bit整型數(shù)格式進行比較,分析了兩者的動態(tài)范圍及實際處理誤差,發(fā)現(xiàn)半精度浮點格式是“性價比”較高的存儲方式。另外,Tricore? CPU還有專用硬件指令支持半精度和單精度浮點格式的相互轉(zhuǎn)換,便于信號的后期處理,并縮短數(shù)據(jù)格式轉(zhuǎn)換時間。


參考文獻


1.  IEEE Standard for Floating-Point Arithmetic


2. https://en.wikipedia.org/wiki/Half-precision_floating-point_format


3. TriCore_TC162P_core_architecture_vol2of2_Instruction_set



免責聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請聯(lián)系小編進行處理。


推薦閱讀:


海康威視在湖北,為 “綠電守護者”搭把手

重新定義的同步整流天花板

倉儲自動化:大趨勢下的小元件

英特爾高級首席AI工程師張宇:發(fā)揮技術(shù)之力釋放邊緣AI市場廣闊機遇

聯(lián)手5G,LPWAN正在成為智慧城市無線連接中的新勢力

特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索
?

關(guān)閉

?

關(guān)閉