服務器集群故障怎樣檢測?現(xiàn)在有很多的企業(yè)為了安全或者為了網站優(yōu)化能有一個更好的效果選擇使用站群服務器進行網站搭建,那么服務器集群出現(xiàn)故障怎么辦?該如何檢測呢?這里為大家具體介紹一下服務器集群故障怎樣檢測。
服務器集群故障怎樣檢測?現(xiàn)在有很多的企業(yè)為了安全或者為了網站優(yōu)化能有一個更好的效果選擇使用站群服務器進行網站搭建,那么服務器集群出現(xiàn)故障怎么辦?該如何檢測呢?這里為大家具體介紹一下服務器集群故障怎樣檢測。
在集群節(jié)點之間的通信允許集群服務檢測節(jié)點故障和狀態(tài)改變并且將集群作為一個實體進行管理??梢詾檫@種節(jié)點到節(jié)點的通信設立多重網絡以便于消除單一點的故障。在集群節(jié)點上運行的集群服務跟蹤集群中節(jié)點的當前狀態(tài),并且確定組及其資源何時故障轉移到備用節(jié)點。這種通信采用在每個節(jié)點的集群服務之間定期發(fā)送消息的形式進行。這些消息被稱為“檢測信號”,或稱“心跳氣”。
通過心跳通信,每個節(jié)點可以恰查其他節(jié)點及它們的應用程序的可用性。如果服務器設有對心跳通信;做出響應,則正常工作的服務器會啟動故障轉移過穩(wěn)(包括對故障服務器擁有的資源和應用程序的所有權進行仲裁)。仲裁是使用質詢和辯護協(xié)議來執(zhí)行的。換而言之,如果某個節(jié)點似乎發(fā)生了故障,則會在給定的時間內允許它以幾種方式中的任何一種表明它仍處于正常運行當中,并且可以向其他正常的節(jié)點通信。如果它無法證明自己正在正常運行,則此時會將它移出集群。
多種事件都可能導致節(jié)點無法響應心跳消息,如計算機故障、網絡接口故障、網絡放障,甚于在可能是由于少有的高峰活動期。通常來說,當所有節(jié)點進行通信時,配置數據庫管理器會向每個節(jié)點發(fā)送全局性的配置數據庫更新。當心跳通信失敗時,日志管理錦還會將配置數據庫的變更保存到仲裁資源中。這保證了幸存的節(jié)點可以在恢復過程中訪問最新的集群配置和本地節(jié)點的注冊表數據。
服務器集群故障怎樣檢測?以上文章為大家介紹的是檢測節(jié)點故障的方式檢測服務器集群故障,提醒大家的是故障檢測算法比較保守,所以我們要盡量多的給那些明顯發(fā)生故障的節(jié)點有質詢的機會,才能進入故障轉移過程。
下一篇: 服務器集群故障是什么
免責聲明:本文內容由互聯(lián)網用戶自發(fā)貢獻自行上傳,本網站不擁有所有權,也不承認相關法律責任。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內容,請發(fā)送郵件至:operations@xinnet.com進行舉報,并提供相關證據,一經查實,本站將立刻刪除涉嫌侵權內容。