數(shù)十年專注企業(yè)數(shù)字化轉(zhuǎn)型、智能化升級、企業(yè)上云解決方案服務(wù)商
工單提交 騰佑科技咨詢熱線咨詢熱線: 400-996-8756
百度云服務(wù)中心騰佑科技公司
云服務(wù)器活動 服務(wù)器租用 服務(wù)器托管 機柜租賃 帶寬租賃
  • 最新資訊
  • 熱門資訊
  • 最熱資訊
智能建站

現(xiàn)代化數(shù)據(jù)中心服務(wù)器維護清單

發(fā)布時間:2019-04-10 作者:admin

簡述:即使是擁有高性能和冗余功能的現(xiàn)代服務(wù)器,增加的工作負載整合與可靠性期待,也能讓服務(wù)器忙得不可開交。究竟該怎么維護服務(wù)器呢?答案是,需要為服務(wù)器列出維護清單,包括物理配件以及系統(tǒng)關(guān)鍵配置。就現(xiàn)代化數(shù)據(jù)中

  即使是擁有高性能和冗余功能的現(xiàn)代服務(wù)器,增加的工作負載整合與可靠性期待,也能讓服務(wù)器忙得不可開交。究竟該怎么維護服務(wù)器呢?答案是,需要為服務(wù)器列出維護清單,包括物理配件以及系統(tǒng)關(guān)鍵配置。就現(xiàn)代化數(shù)據(jù)中心服務(wù)器維護做以下清單。

檢查本地硬盤

許多服務(wù)器依賴內(nèi)部硬盤,用于承載工作量和存儲,保存用戶數(shù)據(jù)以及其他功能。硬盤介質(zhì)出現(xiàn)問題會嚴重影響負載性能和穩(wěn)定性,最終會導致硬盤故障。

磁盤介質(zhì)是不完美的,常見問題包括壞道和碎片化。RAID可以比較穩(wěn)定地確保出現(xiàn)磁盤故障時數(shù)據(jù)穩(wěn)定與一致性,但更小型的服務(wù)器,如1U的機架式服務(wù)器可能無法提供足夠的空間來實施RAID。使用如CHKDSK(Check Disk)這樣的工具來檢查硬盤完整性,還可以嘗試修復其中損壞的扇區(qū)。Windows Server 2012最新版的CHKDSK可以快速分析并修復文件系統(tǒng)結(jié)構(gòu)的磁盤問題。

磁盤碎片不會消失,只要使用NFS并且文件分配表或FAT,文件系統(tǒng)會使用首個可用集群的磁盤空間。碎片可能會降低服務(wù)器磁盤速度并引發(fā)故障。諸如Windows Server 2012自帶的卷組優(yōu)化工具,可以安排每個文件集群,并確保數(shù)據(jù)連續(xù)。

確保服務(wù)器可以呼吸

一旦服務(wù)器關(guān)機,目視檢查其內(nèi)部和外部的空氣流動路徑。清除任何積累的灰塵和雜物,確保冷卻空氣通行順暢。

從外部空氣出入口開始,然后繼續(xù)到系統(tǒng)機箱CPU散熱器和風扇組件,內(nèi)存模塊和所有冷卻風扇葉片與風道路徑。防靜電工作區(qū)用清潔、干燥的壓縮空氣去除塵和碎屑。不要在機架中清潔服務(wù)器。

除塵是個歷史悠久的傳統(tǒng)過程,但這并不意味著它已經(jīng)過時?;覊m是一種熱絕緣體,需要清除掉,現(xiàn)代的替代冷卻方案以及ASHARE建議已經(jīng)提出了調(diào)高數(shù)據(jù)中心工作溫度?;覊m和其他空氣流動的障礙物會導致服務(wù)器使用更多能源,甚至沉淀積累導致某些組件過早出現(xiàn)故障。

定期安裝補丁與更新

服務(wù)器軟件棧——BIOS、操作系統(tǒng)、虛擬機管理程序、驅(qū)動程序、應(yīng)用程序、支持工具——必須確保所有互動與協(xié)作。不幸的是,軟件代碼很少完美或沒有任何問題,所以此類軟件問題需要經(jīng)常通過修補或更新來修復錯誤、提高安全性、簡化操作性、提高性能等。

不是所有軟件都可以自動更新,管理員需要確認哪些補丁或升級包是必要的,然后評估和測試更新效果。如果更新包修復的是服務(wù)器不存在的問題,那么無須多此一舉冒這個險。

軟件開發(fā)者無法測試到每個軟硬件兼容性以及補丁、更新的潛在問題,因此可能會導致更多的問題,這種情況可能在特定的服務(wù)器或軟件集中發(fā)生。例如監(jiān)控軟件的代理補丁可能導致某個重要應(yīng)用程序的性能問題,因為新代理需要比預期更高的帶寬。

轉(zhuǎn)換到DevOps后,更小、更頻繁的更新過程加劇了潛在的問題。在部署之前仍然要在實驗室環(huán)境內(nèi)測試任何補丁或更新。始終要確保可以撤銷原來的更改,并可以恢復修改前的軟件配置。

堅持例行維護

服務(wù)器管理員往往忽視計劃好的例行維護。不要等到實際出現(xiàn)故障才進行維護,預留時間進行日常維護可以防止問題。

維護頻率取決于設(shè)備年齡、數(shù)據(jù)中心環(huán)境、待維護的服務(wù)器容量和其他因素。例如,放置在設(shè)備間的舊設(shè)備會比放置在配有HEPA過濾器、良好冷卻設(shè)施數(shù)據(jù)中心里的設(shè)備需要更頻繁的檢查。組織可以根據(jù)供應(yīng)商或第三方的例行巡檢策略來安排日常維護表,如果供應(yīng)商合同中約定沒4個月或6個月檢查,那就按該時間表執(zhí)行。

虛擬化之前,設(shè)備維護打亂了工作量,迫使IT員工在夜間或周末做保養(yǎng)。使用虛擬化服務(wù)器進行工作負載遷移,替代中斷時間是個好方法,這樣每當服務(wù)器維護時,應(yīng)用程序是安全的。

檢查事件日志輸出

服務(wù)器事件日志中記錄著豐富的信息,尤其是細節(jié)問題。如果沒有仔細審查系統(tǒng)日志,惡意軟件日志和其他日志,服務(wù)器維護是不完整的。當然,關(guān)鍵的系統(tǒng)問題應(yīng)該引起IT管理員和技術(shù)人員注意,但也有無數(shù)的非關(guān)鍵問題,可能是慢性或嚴重問題的信號。

如果你在維護服務(wù)器,那么請檢查報告設(shè)置,并驗證告警與告警接收人地址正確。例如,如果某個技術(shù)人員離開服務(wù)器組,你需要更新服務(wù)器的報告系統(tǒng)。雙重檢查聯(lián)系名單和聯(lián)系方式也很重要,僅僅將關(guān)鍵錯誤報告發(fā)送到技術(shù)人員公司電子郵箱地址是完全不夠的,需要確保其在非工作時間也能聯(lián)系的上。

要積極主動的分析日志數(shù)據(jù)。當日志檢查發(fā)現(xiàn)慢性或反復出現(xiàn)的問題,積極主動的尋找解決這個問題的方案,避免問題升級。例如,如果服務(wù)器日志顯示一些內(nèi)存模塊的可恢復報告,那么不會觸發(fā)嚴重告警。但報告說明了某個模塊的問題,IT人員可以進行更詳細的診斷程序以識別即將發(fā)生的故障。

如果問題影響輕微,無須關(guān)閉服務(wù)器,那么它可以返回到線上繼續(xù)服務(wù),直至需要更換硬件的時候。

數(shù)據(jù)中心服務(wù)器是復雜的機器。就如任何機器一樣,它們需要定期維護以保持最佳狀態(tài)。執(zhí)行簡單的維護操作可以降低呼叫故障服務(wù)電話次數(shù),并延長服務(wù)器工作壽命。

由騰佑科技網(wǎng)絡(luò)轉(zhuǎn)載 侵權(quán)請聯(lián)系我們刪除

點擊展開全文

鄭州騰佑科技有限公司(以下簡稱“騰佑科技”)成立于2009年, 總部位于鄭州,是 一家致力于互聯(lián)網(wǎng)服務(wù)業(yè)的高新技術(shù)企業(yè),公司主營業(yè)務(wù)以互聯(lián)網(wǎng)數(shù)據(jù)中心、云計算、人 工智能、軟件開發(fā)、安全服務(wù)“互聯(lián)網(wǎng)+”行業(yè)解決方案及行業(yè)應(yīng)用等相關(guān)業(yè)務(wù)。

售前咨詢熱線:400-996-8756

備案提交:0371-89913068

售后客服:0371-89913000

熱門活動

百度云服務(wù)中心
  • 熱門資訊
  • 隨便看看
  • 彈性云主機的“彈性”體現(xiàn)哪些方面?鄭州高電機柜租用價格?
  • 虛擬機了解多節(jié)點服務(wù)器?
  • 鄭州短視頻服務(wù)器帶寬價格,服務(wù)器租用
  • 棋牌游戲高防服務(wù)器的四大優(yōu)勢
  • 企業(yè)及個人如何選擇國外服務(wù)器?