原文:《淺談ITIL之SLA》

在二十世紀六十年代,服務品質協議(service-level agreement)(SLA)是用于達到已定義的服務品質和響應服務問題的一般操作程序,而這些服務問題是用戶組織在購買或租用大型機上的機器時間時就已經同意過的。 超大型計算機(big iron)是缺省的企業系統,其它任何技術的處理能力都無法與它相比。當客戶機的服務器和網絡桌面系統進入計算機世界時,人們就構思出了分布式網絡系統這個概念。這些系統后來發展成了跨網絡運行企業資源規劃(ERP),供應鏈管理(SCM)和客戶關系管理(CRM)系統的企業范圍的系統。
 
在這個發展過程中,企業對因特網的依賴已經使得公司的應用程序套件的網絡延遲影響越來越明顯。同時,用戶已經委托一定品質的服務質量保證相關的可用性、可靠性和響應時間以確保業務運轉不被中斷,并且依賴外部服務提供者來提供應用程序、因特網、網絡,受管服務和其它服務。結果,SLA變得更復雜,范圍更廣,一個用戶可以有與不同提供者簽定的幾個SLA。反過來,提供者自己的SLA也可以是與其它提供者簽定的,每個SLA都有一套不同的需求、衡量標準和例外情況。
 
SLA是服務提供者和客戶之間的一個正式合同,用來保證可計量的網絡性能達到所定義的品質。SLA為服務提供者提供了一種在當今多變而又競爭激烈的市場中勝過對手的方法。服務提供者可能是一個國內的IT組織、一個應用程序服務提供者(ASP)、一個網絡服務提供者(NSP)、一個因特網服務提供者(ISP)、一個受管服務提供者(MSP)或者任何其它類型的服務提供者。
 
SLA可以非常籠統或者極度詳細,它一般都包含出現故障時服務提供者和客戶應采取的步驟。服務提供者保證它提供的服務在一定百分比的時間內(例如,99.9%)是可用的。提供者還能夠強制向客戶通知SLA當機時間的最長和平均響應時間,或者在網絡接口發生改變之前的最長和平均響應時間,并利用基于因特網的工作流自動化、分發和報告技術。如果經過指定的一段時期后提供者無法達到所定義的性能品質,客戶就可以獲得一些權利和賠償。各個SLA的權利、賠償和例外情況是不同的。客戶還同意接受協議一般條款的指定例外情況。
 
在每個SLA中都必須精確定義服務品質;否則各方關于SLA將以哪種品質衡量什么服務或性能標準將無法達成一致。例如,一個客戶可能認為一個雙方同意的服務品質將衡量網絡A、網絡B和網絡C,同時后兩者連接到第一個,而服務提供者卻認為它只衡量網絡A。還有一點很重要的是正常運行時間可用性百分比的小數位數:例如,一年中的當機小時數和當機天數比,99.999%的正常運行時間所允許的當機時間比99.9%的正常運行時間所允許的當機時間還少。SLA應該為客戶包含進一個退出條款;當因為不能圓滿解決經常發生的可用性、可靠性和安全性問題而使客戶的業務運轉頻繁中斷時,客戶希望他有終止協議的權利。
 
像任何協議或保險單一樣,SLA通常會指定其條款中的例外情況。IT服務的SLA應該包含關于例外情況的詳細信息。我將隨意將它們分為四類:故障、不受服務提供者直接控制的問題、拒絕服務和預訂的維護。只要客戶公司可以得到當機期間的適當賠償,還可以添加其它一些例外情況來適應提供者的情況。通過在SLA中包含進例外情況,提供者可以在出現問題或網絡損耗時免負責任。另一方面,如果競爭的服務提供帶有極少例外情況的SLA,客戶可以選擇那些在業務運轉中提供更長正常運行時間并且有更好的服務保障的協議。即使99.5%99.9%99.999%這幾個正常運行時間可用性保證之間的差別也可以影響選擇SLA的決策者。
 
我們去細化SLA,去定義SLA,寫明例外情況,如同去餐館吃飯享受到的服務一樣,我們正是通過SLA去購買有保障的IT服務。對甲方而言,SLA可以降低風險,明確廠商、服務提供商、供應商要承擔的責任;對乙方而言,SLA是對甲方的承諾,按照SLA菜單提供相應的有償服務,確保服務持續有效。風險是不確定的,而SLA是去消除不確定的風險,機房的UPS電源、空調、服務器和網絡設備,都要有維保合同,廠商提供5*7或是7*24服務,正是由于SLA合同的執行來確保服務的品質。用戶的期望值從SLA得出的,SLA承諾提供KFC漢堡,最后供應的是必勝客披薩,那么用戶的期望值大大滿足,反之,給用戶的是麥當勞的豬柳蛋漢堡,用戶感覺吃虧了,對服務多半不滿意。我們給用戶提供SLA的同時,傳達給用戶SLA能夠達到什么樣的級別,讓用戶能夠清楚付費的SLA價值多少,3959服務支持差別很大,最終達成雙贏。