123,123,123

探秘嵌入式工程師的百寶箱！高可靠性嵌入式系統(tǒng)的7大技巧

發(fā)布時(shí)間：2015-03-25 責(zé)任編輯：echolady

【導(dǎo)讀】高可靠性代碼并非一蹴而就的，這是每個(gè)嵌入式開發(fā)工程師都需要經(jīng)歷的艱難過程。設(shè)計(jì)過程中，開發(fā)人員需要維護(hù)并管理系統(tǒng)的每個(gè)比特和字節(jié)。本文就探秘嵌入式工程師的百寶箱，揭秘嵌入式系統(tǒng)設(shè)計(jì)的7大技巧。

從規(guī)范完善的開發(fā)周期到嚴(yán)格執(zhí)行和系統(tǒng)檢查，開發(fā)高可靠性嵌入式系統(tǒng)的技術(shù)有許多種。本文介紹了7個(gè)易操作且可以長(zhǎng)久使用的技巧，它們對(duì)于確保系統(tǒng)更加可靠地運(yùn)行并捕獲異常行為大有幫助。

技巧#1——用已知值填充ROM

軟件開發(fā)人員往往都是非常樂觀的一群人，只要讓他們的代碼忠實(shí)地長(zhǎng)時(shí)間地運(yùn)行就可以了，僅此而已。微控制器跳出應(yīng)用程序空間并在非預(yù)想的代碼空間中執(zhí)行這種情況似乎是相當(dāng)少有的。然而，這種情況發(fā)生的機(jī)會(huì)并不比緩存溢出或錯(cuò)誤指針失去引用少。它確實(shí)會(huì)發(fā)生！發(fā)生這種情況后的系統(tǒng)行為將是不確定的，因?yàn)槟J(rèn)情況下內(nèi)存空間都是0xFF，或者由于內(nèi)存區(qū)通常沒有寫過，其中的值可能只有上帝才知道。

不過有相當(dāng)完備的linker或IDE技巧可以用來幫助識(shí)別這樣的事件并從中恢復(fù)系統(tǒng)。技巧就是使用FILL命令對(duì)未用ROM填充已知的位模式。要填充未使用的內(nèi)存，有很多不同的可能組合可以使用，但如果是想建立更加可靠的系統(tǒng)，最明顯的選擇是在這些位置放置ISR fault handler。如果系統(tǒng)出了某些差錯(cuò)，處理器開始執(zhí)行程序空間以外的代碼，就會(huì)觸發(fā)ISR，并在決定校正行動(dòng)之前提供儲(chǔ)存處理器、寄存器和系統(tǒng)狀態(tài)的機(jī)會(huì)。

技巧#2——檢查應(yīng)用程序的CRC

對(duì)嵌入式工程師來說一個(gè)很大的好處是，我們的IDE和工具鏈可以自動(dòng)產(chǎn)生應(yīng)用程序或內(nèi)存空間校驗(yàn)和(Checksum)，從而根據(jù)這個(gè)校驗(yàn)和驗(yàn)證應(yīng)用程序是否完好。有趣的是，在許多這些案例中，只有在將程序代碼加載到設(shè)備時(shí)，才會(huì)用到校驗(yàn)和。

然而，如果CRC或校驗(yàn)和保持在內(nèi)存中，那么驗(yàn)證應(yīng)用程序在啟動(dòng)時(shí)(或甚至對(duì)長(zhǎng)時(shí)間運(yùn)行的系統(tǒng)定期驗(yàn)證)是否仍然完好是確保意外之事不會(huì)發(fā)生的極好途徑?，F(xiàn)在一個(gè)編程過的應(yīng)用程序發(fā)生改變的概率是很小的，但考慮每年交付的數(shù)十億個(gè)微控制器以及可能惡劣的工作環(huán)境，應(yīng)用程序崩潰的機(jī)會(huì)并不是零。更有可能的是，系統(tǒng)中的一個(gè)缺陷可能導(dǎo)致某一扇區(qū)發(fā)生閃存寫入或閃存擦除，從而破壞應(yīng)用程序的完整性。

技巧#3——在啟動(dòng)時(shí)執(zhí)行RAM檢查

為了建立一個(gè)更加可靠和扎實(shí)的系統(tǒng)，確保系統(tǒng)硬件正常工作非常重要。畢竟硬件會(huì)發(fā)生故障。(幸運(yùn)的是軟件永遠(yuǎn)不會(huì)發(fā)生故障，軟件只會(huì)做代碼要它做的事，不管是正確的還是錯(cuò)誤的)。在啟動(dòng)時(shí)驗(yàn)證RAM的內(nèi)部或外部沒有問題，是確保硬件可以如預(yù)期般運(yùn)作的一個(gè)好方法。

有許多不同的方法可用于執(zhí)行RAM檢查，但常用的方法是寫入一個(gè)已知的模式，然后等上一小段時(shí)間再回讀。結(jié)果應(yīng)該是所讀就是所寫。真相是，在大多數(shù)情況下RAM檢查是通過的，這也是我們想要的結(jié)果。但也有極小的可能性檢查不通過，這時(shí)就為系統(tǒng)標(biāo)示出硬件問題提供了極好的機(jī)會(huì)。

技巧#4——使用堆棧監(jiān)視器

對(duì)許多的嵌入式開發(fā)者而言，堆棧似乎是一股相當(dāng)神秘的力量。當(dāng)奇怪的事情開始發(fā)生，工程師終于被難倒了，他們開始思考，也許堆棧中發(fā)生了什么事。結(jié)果是盲目地調(diào)整堆棧的大小和位置等等。但該錯(cuò)誤往往是與堆棧無關(guān)的，但怎能如此確定？畢竟，有多少工程師真的實(shí)際執(zhí)行過最壞情況下的堆棧大小分析？

堆棧大小是在編譯時(shí)就靜態(tài)分配好的，但堆棧是以動(dòng)態(tài)的方式使用的。隨著代碼的執(zhí)行，應(yīng)用程序需要的變量、返回的地址和其它信息被不斷存儲(chǔ)在堆棧中。這種機(jī)制導(dǎo)致堆棧在其分配的內(nèi)存中不斷增長(zhǎng)。然而，這種增長(zhǎng)有時(shí)會(huì)超出編譯時(shí)確定的容量極限，導(dǎo)致堆棧破壞相鄰內(nèi)存區(qū)域的數(shù)據(jù)。

絕對(duì)確保堆棧正常工作的一種方法是實(shí)現(xiàn)堆棧監(jiān)視器，將它作為系統(tǒng)“保健”代碼的一部分(有多少工程師會(huì)這樣做？)。堆棧監(jiān)視器會(huì)在堆棧和“其它”內(nèi)存區(qū)域之間創(chuàng)建一個(gè)緩沖區(qū)域，并填充已知的位模式。然后監(jiān)視器會(huì)不斷的監(jiān)視圖案是否有任何變化。如果該位模式發(fā)生了改變，那就意味著堆棧增長(zhǎng)得太大了，即將要把系統(tǒng)推向黑暗地獄！此時(shí)監(jiān)視器可以記錄事件的發(fā)生、系統(tǒng)狀態(tài)以及任何其它有用的數(shù)據(jù)，供日后用于問題的診斷。

大多數(shù)實(shí)時(shí)操作系統(tǒng)（RTOS）或?qū)崿F(xiàn)了內(nèi)存保護(hù)單元(MPU)的微控制器系統(tǒng)中都提供有堆棧監(jiān)視器?？膳碌氖?，這些功能默認(rèn)都是關(guān)閉狀態(tài)，或者經(jīng)常被開發(fā)人員有意關(guān)閉。在網(wǎng)絡(luò)上快速搜尋一下可以發(fā)現(xiàn)，很多人建議關(guān)閉實(shí)時(shí)操作系統(tǒng)中的堆棧監(jiān)視器以節(jié)省56字節(jié)的閃存空間。等等，這可是得不償失的做法！

技巧＃5 - 使用MPU

在過去，是很難在一個(gè)小而廉價(jià)的微控制器中找到內(nèi)存保護(hù)單元（MPU）的，但這種情況已經(jīng)開始改變?，F(xiàn)在從高端到低端的微控制器都已經(jīng)有MPU，而這些MPU為嵌入式軟件開發(fā)人員提供了一個(gè)可以大幅提高其固件(firmware)魯棒性(robustness)的機(jī)會(huì)。

MPU 已逐漸與操作系統(tǒng)耦合，以便建立內(nèi)存空間，其中的處理都分開，或任務(wù)可執(zhí)行其代碼，而不用擔(dān)心被stomped on。倘若真有事情發(fā)生，不受控制的處理會(huì)被取消，也會(huì)執(zhí)行其他的保護(hù)措施。請(qǐng)留意帶有這種組件的微控制器，如果有，請(qǐng)多加利用它的這種特性。

技巧＃6 - 建立一個(gè)強(qiáng)大的看門狗系統(tǒng)

你經(jīng)常會(huì)發(fā)現(xiàn)的一種總是最受喜愛的看門狗（watchdog）實(shí)現(xiàn)是，在看門狗被啟用之處（這是一個(gè)很好的開始），但也是可以用周期性定時(shí)器將該看門狗清零之處；定時(shí)器的啟用是完全與程序中出現(xiàn)的任何情況隔離的。使用看門狗的目的是協(xié)助確保如果出現(xiàn)錯(cuò)誤，看門狗不會(huì)被清零，即當(dāng)工作暫停，系統(tǒng)會(huì)被迫去執(zhí)行硬件重設(shè)定（hardware reset），以便恢復(fù)。使用與系統(tǒng)活動(dòng)獨(dú)立的定時(shí)器可以讓看門狗保持清零，即使系統(tǒng)已失效。

對(duì)應(yīng)用任務(wù)如何整合到看門狗系統(tǒng)中，嵌入式開發(fā)人員需要仔細(xì)考慮和設(shè)計(jì)。例如，有種技術(shù)可能可以讓每個(gè)在一定時(shí)期內(nèi)運(yùn)行的任務(wù)標(biāo)示它們可以成功地完成其任務(wù)。在此事件中，看門狗不被清零，強(qiáng)制被復(fù)位。還有一些比較先進(jìn)的技術(shù)，像是使用外部看門狗處理器，它可用來監(jiān)視主處理器如何表現(xiàn)，反之亦然。

對(duì)一個(gè)可靠的系統(tǒng)而言，建立一個(gè)強(qiáng)大的看門狗系統(tǒng)是很重要的。由于有太多的技術(shù)，難以在這幾個(gè)段落中完全涵蓋，但針對(duì)此一議題，筆者未來還會(huì)發(fā)表相關(guān)的文章。

技巧＃7 - 避免易失存儲(chǔ)器分配

不習(xí)慣在資源有限環(huán)境下工作的工程師，可能會(huì)試圖使用其編程語(yǔ)言的特性，這種語(yǔ)言讓他們可以使用易失存儲(chǔ)器分配。畢竟，這是一種常在計(jì)算器系統(tǒng)中使用的技術(shù)，在計(jì)算器系統(tǒng)中，只有在有必要時(shí)，內(nèi)存才會(huì)被分配。例如，以C開發(fā)時(shí)，工程師可能傾向于使用malloc來分配在堆（heap）上的空間。有一個(gè)操作會(huì)執(zhí)行，一旦完成，可以使用free將被分配的內(nèi)存返回，以便堆的使用。

在資源受限的系統(tǒng)，這可能是一場(chǎng)災(zāi)難！使用易失存儲(chǔ)器分配的其中一個(gè)問題是，錯(cuò)誤或不當(dāng)?shù)募夹g(shù)可能會(huì)導(dǎo)致內(nèi)存泄漏或內(nèi)存碎片。如果出現(xiàn)這些問題時(shí)，大多數(shù)的嵌入式系統(tǒng)并沒有資源或知識(shí)來監(jiān)視堆或妥善地處理它。而當(dāng)它們發(fā)生時(shí)，如果應(yīng)用程序提出對(duì)空間的要求，但卻沒有所請(qǐng)求的空間可以使用，會(huì)發(fā)生什么事呢？

使用易失存儲(chǔ)器分配所產(chǎn)生的問題是很復(fù)雜的，要妥善處理這些問題，可以說是一個(gè)噩夢(mèng)！一種替代的方法是，直接以靜態(tài)的方式，簡(jiǎn)化內(nèi)存的分配。例如，只要在程序中簡(jiǎn)單地建立一個(gè)大小為256字節(jié)長(zhǎng)的緩沖區(qū)，而不是經(jīng)由malloc請(qǐng)求這樣大小的內(nèi)存緩沖區(qū)。此一分配的內(nèi)存可在整個(gè)應(yīng)用程序的生命周期期間保持，且不會(huì)有堆或內(nèi)存碎片問題方面的顧慮。

結(jié)語(yǔ)

這些都只是一些可以讓開發(fā)人員開始建立更可靠嵌入式系統(tǒng)的方法。另外還有很多其他技術(shù)，例如利用良好的編碼標(biāo)準(zhǔn)、位翻轉(zhuǎn)的監(jiān)測(cè)、執(zhí)行數(shù)組和指針邊界檢查，及使用斷言等。所有這些技術(shù)都是讓設(shè)計(jì)者可以開發(fā)出可靠性更高嵌入式系統(tǒng)的秘訣。

相關(guān)閱讀：

QNX無線架構(gòu)為嵌入式系統(tǒng)帶來智能手機(jī)的連接性
 選型必備：嵌入式應(yīng)用中存儲(chǔ)器的選型秘籍
 電路天天讀：CAN總線與以太網(wǎng)的嵌入式網(wǎng)關(guān)電路的設(shè)計(jì)與實(shí)現(xiàn)

要采購(gòu)微控制器么，點(diǎn)這里了解一下價(jià)格!

上一篇：英飛凌擴(kuò)充GaN技術(shù)和產(chǎn)品組合，大幅度縮減電源尺寸和重量

下一篇：倍捷連接器公司將在中國(guó)設(shè)全新工廠，為進(jìn)軍新區(qū)域市場(chǎng)

特別推薦

噪聲中提取真值！瑞盟科技推出MSA2240電流檢測(cè)芯片賦能多元高端測(cè)量場(chǎng)景
10MHz高頻運(yùn)行！氮矽科技發(fā)布集成驅(qū)動(dòng)GaN芯片，助力電源能效再攀新高
失真度僅0.002%！力芯微推出超低內(nèi)阻、超低失真4PST模擬開關(guān)
一“芯”雙電！圣邦微電子發(fā)布雙輸出電源芯片，簡(jiǎn)化AFE與音頻設(shè)計(jì)
一機(jī)適配萬端：金升陽(yáng)推出1200W可編程電源，賦能高端裝備制造

技術(shù)文章更多>>

技術(shù)白皮書下載更多>>

熱門搜索

探秘嵌入式工程師的百寶箱！高可靠性嵌入式系統(tǒng)的7大技巧

友情鏈接(QQ：317243736)

探秘嵌入式工程師的百寶箱！高可靠性嵌入式系統(tǒng)的7大技巧