我們都知道叢集角色為預防FailOver Ping-Pong情況產生,可以至屬性中修改某時間區間可FailOver次數。
某日好友Alexis在做新架構測試時發現如下情況。他的問題是兩Node(A和B) Windows Cluster連接到Storage,將Node A連接到Storage的兩隻腳都斷開時,Node A上的SQL及Quorum都會移轉至Node B。復原Node A的接線後,此時如果再反過來做,斷開Node B連接到Storage的兩隻腳,則SQL還是會轉到Node A,但是Quorum卻留在Node B且狀態是OffLine。
SQL可以順利再次轉移所以沒問題(Alexis有調整過SQL時間區間內可FailOver次數),但Quorum卻轉不過去,此時我的直覺也應該是FailOver Ping-Pong設定值問題,導致第一次可以順利由Node A轉移至Node B,而接下來的Node B轉移至Node A就出問題。(預設兩Node在6小時內只能FailOver 1 次)
我們都知道叢集中其他角色該到哪調整(如下圖所示,我們是調整SQL時間區間內可FailOver次數)。
那Quorum的區間內可FailOver次數該到哪裡設定呢? 我們可以知道的是Quorum是Windows Cluster的資源,所以它會跟著Windows Cluster的角色跑,所以我們應該針對叢集的設定內容來找。(設定方式如下圖所示)
完成上面設定後,這樣Windows Cluster也不受預設6小時FailOver 1 次的限制了。
我是ROCK
rockchang@mails.fju.edu.tw