2008年11月15日 星期六

挫折感很重的 Cluster setup



  由於一些說不清理還亂的因素,我幫公司接下了幫某金控建置 HA SQL 2005 Cluster Failover infrastucture 的建置工作。
  完全沒經驗的我,想盡辦法取得所有可用的資源,跟 MS 要了本 MCITP Training Book 和 White paper 來 K ,竟然意外地發現我長久以來受到 Consulter Sales 漫天吹牛所得到的 Cluster & Failover 的認知是完全錯誤的!

  這些人總是說:Cluster Failover 讓交易 100% 不會失敗,即使交易走了一半遇到其中一台機器掛了,另一台也會取而代之完成交易。
  整個屁!
  MCITP Training Kit 針對 Cluster 開宗明義就說道,部分 Sales 以訛傳訛的說法是錯誤的,以上這些通通做不到。
  瞭解到 Failover 所使用的機制 - LookAlive ( 每 5 秒 ping 一次機器通訊 ) 和 IsAlive ( 每分鐘發一次 query 檢查服務運作 ) ,加上切換機制,很容易故算出轉換的空窗期。然後所有進行到一半的交易其實全部都會 Rollback,這更是讓人跳腳 ( 原本我就很佩服說怎麼做到跨機器完成做一半的交易? 這麼神奇! 原來是流言! )。一整個我過去對客戶的 Credit 毀於一旦的感覺。
  下載了 Virtual Server,花了好幾個小時建置了三個 VM 做 Lab,一路上踩到不少坑洞,非常不順利。按照 Training Kit Step by Step 建置,最後連 OS 層的 Cluster 都設定不起來,過了一關來有一關,完全照著書上做還建不起來,很挫折啊!難怪當初連原廠看到這個工作都想能閃就閃...。
  明天早上面對這件事情開環境設定會議,我整個有個很不好的預感...。
  看看落健的廣告,鄭重地在此呼籲大家:不要再相信關於 Failover 那些沒有根據的說法了!

Google+ Badge