(點(diǎn)擊查看大圖)
你的位置:首頁(yè) > 測(cè)試測(cè)量 > 正文
工程師筆記|我是如何排除服務(wù)器磁盤陣列故障的?
發(fā)布時(shí)間:2021-03-29 責(zé)任編輯:lina
【導(dǎo)讀】服務(wù)器支撐著整個(gè)企業(yè)的信息數(shù)據(jù),在日常運(yùn)轉(zhuǎn)過(guò)程中,服務(wù)器也會(huì)因?yàn)槠鋸?fù)雜的硬件結(jié)構(gòu)、繁瑣的運(yùn)行原理而出現(xiàn)一些大大小小的故障,而如如何快速排查診斷并修復(fù)服務(wù)器的故障事關(guān)整個(gè)公司業(yè)務(wù)正常開(kāi)展與運(yùn)作。
服務(wù)器支撐著整個(gè)企業(yè)的信息數(shù)據(jù),在日常運(yùn)轉(zhuǎn)過(guò)程中,服務(wù)器也會(huì)因?yàn)槠鋸?fù)雜的硬件結(jié)構(gòu)、繁瑣的運(yùn)行原理而出現(xiàn)一些大大小小的故障,而如如何快速排查診斷并修復(fù)服務(wù)器的故障事關(guān)整個(gè)公司業(yè)務(wù)正常開(kāi)展與運(yùn)作。
今天分享一篇讀者來(lái)稿,一起來(lái)看看他是如何排除和應(yīng)對(duì)工控服務(wù)器磁盤陣列常見(jiàn)故障問(wèn)題的?
工控服務(wù)器磁盤陣列故障排除法
我們生產(chǎn)線有兩個(gè)服務(wù)器機(jī)房,由于一年四季運(yùn)行,出現(xiàn)服務(wù)器宕機(jī)問(wèn)題也是常有的事,不過(guò)我們生產(chǎn)線服務(wù)器都是雙備份冗余配置,一臺(tái)出現(xiàn)問(wèn)題對(duì)生產(chǎn)影響不是太大。這么多年來(lái)就遇到的問(wèn)題和排查方法及注意事項(xiàng)個(gè)人做了一些記錄和匯總,正好看到威剛工控舉辦相關(guān)主題征文,在此與大家一起分享。
(點(diǎn)擊查看大圖)
硬盤每時(shí)每刻都在讀取數(shù)據(jù),不間斷的工作使得出現(xiàn)故障的可能性也比較大,而硬盤發(fā)生故障的時(shí)候,通常會(huì)有一系列表現(xiàn):
1、故障提示:這是最直接的一種故障表現(xiàn)方式,硬盤也具備自我監(jiān)測(cè)的能力,當(dāng)硬盤中的部件與我們?cè)O(shè)置的正常范圍值不同時(shí),就會(huì)自動(dòng)發(fā)出提示信息。我們就可以根據(jù)這個(gè)提示信息,進(jìn)行相應(yīng)的維護(hù)。整理一下服務(wù)器,檢查內(nèi)部安裝和接口,再觀察一段時(shí)間,仍然出現(xiàn)故障提示,更換硬件。雖然有可能是背板或者主板問(wèn)題引起一般,但這種情況不太多。
2、運(yùn)行報(bào)錯(cuò):硬盤運(yùn)行出錯(cuò)表現(xiàn)在掃描時(shí)自身出現(xiàn)錯(cuò)誤,顯示壞道等情況,這個(gè)時(shí)候表示硬盤部件出現(xiàn)問(wèn)題,需要將其修復(fù)或隔離。我們發(fā)現(xiàn)此類錯(cuò)誤一般都是更換硬盤,因?yàn)榧词剐迯?fù)隔離也說(shuō)明硬盤帶病工作,很容易罷工,對(duì)生產(chǎn)線產(chǎn)品和質(zhì)量會(huì)造成損失。
3、硬盤無(wú)法讀取或識(shí)別: 啟動(dòng)服務(wù)器時(shí),硬盤無(wú)法正常被讀取,或者被識(shí)別后,系統(tǒng)仍然無(wú)法顯示硬盤,這就證明硬盤出現(xiàn)錯(cuò)誤。更換硬盤至原先可以正常檢測(cè)到的槽位,根據(jù)現(xiàn)象排查故障,如果故障現(xiàn)象一樣,再繼續(xù)排查一下硬盤背板是不是故障,最后硬盤更換一般都是原廠備件更換,避免硬件出現(xiàn)兼容性不匹配問(wèn)題,運(yùn)行不穩(wěn)定。這個(gè)現(xiàn)象我們也遇到過(guò),著實(shí)讓工程師們頭疼。
4、初始化死機(jī): 一旦初始化就出現(xiàn)死機(jī),雖然也有可能是內(nèi)存、病毒感染等問(wèn)題,但最可能的還是硬盤故障,出現(xiàn)這種情況時(shí),先通過(guò)清除CMOS,恢復(fù)資源初始配置,擴(kuò)展第三方I/O卡屬于該機(jī)型兼容列表TPL,仍然不行考慮更換硬盤。
5、藍(lán)屏、頻繁重啟:內(nèi)存和主板是導(dǎo)致硬件藍(lán)屏的主要原因,可對(duì)內(nèi)存進(jìn)行校驗(yàn)排查,其他的還有殺毒軟件、驅(qū)動(dòng)問(wèn)題等。分析日志記錄排查故障是工程師朋友常用的方法。
6、外設(shè)故障引發(fā)故障:鍵盤會(huì)導(dǎo)致開(kāi)機(jī)報(bào)錯(cuò)、顯示器會(huì)導(dǎo)致黑屏…
學(xué)會(huì)利用狀態(tài)指示燈,高端服務(wù)器一般都有狀態(tài)指示燈,不同的機(jī)器指示燈含義不同,通過(guò)指示燈的顏色、閃爍、亮滅排查故障結(jié)合本身日志記錄確定問(wèn)題,是工程師人員基本要求。
總的來(lái)說(shuō),在服務(wù)器安全運(yùn)行管理中,可能造成服務(wù)器安全運(yùn)行的威脅因素遠(yuǎn)不止以上幾個(gè)方面,要保障服務(wù)器安全運(yùn)行,工程師人員要有一定的技術(shù)能力和維護(hù)經(jīng)驗(yàn),給企業(yè)營(yíng)造一個(gè)安全穩(wěn)定的運(yùn)行平臺(tái)。
如何避免服務(wù)器出現(xiàn)上述的存儲(chǔ)故障,選對(duì)合適耐用的存儲(chǔ)產(chǎn)品很關(guān)鍵。對(duì)此,威剛科技推出一系列高品質(zhì)、高性能存儲(chǔ)解決方案。
PCIe M.2 2280固態(tài)硬盤
● PCIe超高速界面,短時(shí)間內(nèi)處理海量數(shù)據(jù),充分滿足IoT物聯(lián)網(wǎng)/云計(jì)算/邊緣運(yùn)算的需求;
● 總擦寫次數(shù)(P/E cycles)達(dá) 3K次,耐用可靠;
● LDPC ECC糾錯(cuò)機(jī)制,確保數(shù)據(jù)傳輸準(zhǔn)確穩(wěn)定。
(點(diǎn)擊查看大圖)
DDR4 2666/3200超高速內(nèi)存
● 高效能、低延遲,充分滿足IoT物聯(lián)網(wǎng)/云計(jì)算/邊緣運(yùn)算的需求;
● 高達(dá)32GB的大容量,輕松存儲(chǔ)海量數(shù)據(jù);
● 嚴(yán)選原廠顆粒,質(zhì)量?jī)?yōu)異,耐用可靠。
(點(diǎn)擊查看大圖)
免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問(wèn)題,請(qǐng)電話或者郵箱聯(lián)系小編進(jìn)行侵刪。
特別推薦
- 協(xié)同創(chuàng)新,助汽車行業(yè)邁向電氣化、自動(dòng)化和互聯(lián)化的未來(lái)
- 功率器件熱設(shè)計(jì)基礎(chǔ)(八)——利用瞬態(tài)熱阻計(jì)算二極管浪涌電流
- 用于模擬傳感器的回路供電(兩線)發(fā)射器
- 應(yīng)用于體外除顫器中的電容器
- 將“微型FPGA”集成到8位MCU,是種什么樣的體驗(yàn)?
- 能源、清潔科技和可持續(xù)發(fā)展的未來(lái)
- 博瑞集信推出高增益、內(nèi)匹配、單電源供電 | S、C波段驅(qū)動(dòng)放大器系列
技術(shù)文章更多>>
- 模擬信號(hào)鏈的設(shè)計(jì)注意事項(xiàng)
- 熱烈祝賀 Andrew MENG 晉升為 ASEAN(東盟)市場(chǎng)經(jīng)理!
- 邁向更綠色的未來(lái):GaN技術(shù)的變革性影響
- 集成電阻分壓器如何提高電動(dòng)汽車的電池系統(tǒng)性能
- 帶硬件同步功能的以太網(wǎng) PHY 擴(kuò)大了汽車?yán)走_(dá)的覆蓋范圍
技術(shù)白皮書下載更多>>
- 車規(guī)與基于V2X的車輛協(xié)同主動(dòng)避撞技術(shù)展望
- 數(shù)字隔離助力新能源汽車安全隔離的新挑戰(zhàn)
- 汽車模塊拋負(fù)載的解決方案
- 車用連接器的安全創(chuàng)新應(yīng)用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索