簡述:容錯(cuò)的概念一、按時(shí)間劃分的故障分類1.永久性失效(permanent),永久持續(xù)下去直至修復(fù)為止。2.間歇性故障(intermittent),短暫的,但是卻是斷續(xù)的,既有其偶然性,又有其不定期的重復(fù)性
容錯(cuò)的概念
一、按時(shí)間劃分的故障分類
1.永久性失效 (permanent),永久持續(xù)下去直至修復(fù)為止。
2.間歇性故障 (intermittent),短暫的,但是卻是斷續(xù)的,既有其偶然性,又有其不定期的重復(fù)性。
3.偶然性故障 (transient),暫時(shí)的,且可能是非重復(fù)的。
二、間歇性故障和偶然性故障
1.占所有現(xiàn)場失效的90%
容錯(cuò)的含義: 容錯(cuò)的含義比較寬泛,這種不確定性容易引發(fā)歧義,增加理解上的難度。從概念上來說,容錯(cuò)是指服務(wù)器對(duì)于錯(cuò)誤的容納能力,是應(yīng)用過程中對(duì)于服務(wù)器穩(wěn)定性追求的一個(gè)目標(biāo)。為了這樣一個(gè)目標(biāo),有幾種技術(shù)上的實(shí)現(xiàn)方法,目前國內(nèi)談?wù)撟疃嗟氖侨N:服務(wù)器集群技術(shù)、雙機(jī)冗余服務(wù)器方案和單機(jī)容錯(cuò)技術(shù)。
實(shí)際上,服務(wù)器集群和雙機(jī)冗余的技術(shù)比較類似,雙機(jī)冗余是最簡單的集群,是其一個(gè)特例,也可以把服務(wù)器集群技術(shù)視為雙機(jī)冗余的延伸,可以理解為一種多機(jī)容錯(cuò)的方案。在一般的討論之中,集群技術(shù)是為了解決計(jì)算性能不足的問題,通過多臺(tái)服務(wù)器的集群計(jì)算,為高性能計(jì)算領(lǐng)域應(yīng)用提供所需要的高性能。采用集群技術(shù),通過多臺(tái)服務(wù)器之間的負(fù)載均衡,可以解決服務(wù)器單點(diǎn)故障所引發(fā)的系統(tǒng)不穩(wěn)定,提高系統(tǒng)的可靠性,因此集群具有更好的容錯(cuò)能力,但是在實(shí)際的應(yīng)用中,集群技術(shù)多用于高性能計(jì)算。
單機(jī)容錯(cuò)技術(shù)以Stratus公司的ftServer、惠普公司的NonStop服務(wù)器和NEC公司的Express5800/ft為代表。這種技術(shù)具有比雙機(jī)冗余方案更高的容錯(cuò)能力。據(jù)查閱有關(guān)技術(shù)資料,雙機(jī)冗余系統(tǒng)的可靠性可以達(dá)到99.9%,也就是3個(gè)9的能力,而Stratus公司的方案,其可靠性可以達(dá)到5個(gè)9?;萜展酒髽I(yè)服務(wù)器,其NonStop服務(wù)器作為目前惠普公司最高檔的服務(wù)器,其可靠性可以達(dá)到7個(gè)9的水平。雙機(jī)冗余與單機(jī)容錯(cuò)有很多的差異,絕不是3個(gè)9和5個(gè)9的區(qū)別。
容錯(cuò)服務(wù)器的必要性:
進(jìn)入21世紀(jì)以來,制造、中小企業(yè)、能源、交通等領(lǐng)域?qū)Ψ?wù)器,特別是中低端IA服務(wù)器的需求激增,過去僅僅可以應(yīng)用在RISC平臺(tái)、HP-UX環(huán)境下的容錯(cuò)產(chǎn)品也面臨著新的挑戰(zhàn)。另一方面,企業(yè)越來越依賴信息系統(tǒng)來完成關(guān)鍵業(yè)務(wù)的應(yīng)用,同時(shí)他們不可能配備更多的專業(yè)人員來進(jìn)行專職維護(hù)。雙機(jī)熱備、集群服務(wù)器遇到難題。尤其對(duì)24小時(shí)不間斷,長期工作負(fù)責(zé)核心的服務(wù)系統(tǒng),需要具備容錯(cuò)服務(wù)。
騰佑科技IDC服務(wù)有雙線服務(wù)器租用、網(wǎng)通服務(wù)器租用、電信服務(wù)器租用。
搜索詞
熱門產(chǎn)品推薦