共享式災備平台方案
來源:AG环亚集团 政務網 更新時間:2016-04-21


一、項目概況

災備中心共享化是一種符合政府信息化需求特點的建設趨勢,即建成後將用一個災備中心同時滿足多個政府部門的數據備份保護需求。同時,災備是一項長效的、專業的系統工程,只有專業的管理和服務才能將產品、技術、運維、演練有機結合,才能真正將災備落到實處。然而各政府部門用戶普遍“人少事多”,在規劃和建設災難故障備份和恢復系統時,經常面臨著許多同樣的困惑,例如對災難故障恢復建設不熟悉、沒經驗,管理、技術、運維都面臨調整、垂直行業無標准或標准混亂;投資保護和長遠規劃難於兼顧等等。因此,集中建立一個共享的災備平台,實現專業人員集中管理,將災備作為一種既統一管理、又可自主選擇災備級別的服務提供給各委辦單位使用,能從根本上避免“建而不管,備未無患”的尷尬,采用共享式災備,能極大的節約災備中心的軟硬件重復性投入。

上海市電子政務災備中心是目前國內最大的政府災備中心,機房在張江高科技園區,機房面積達到12000多平方米。災備中心提供了數據級災備、應用級容災、介質異地存放等災備功能。目前數據級災備接入37家,應用級容災自行建設4家,介質存放單位幾十家。

二、項目建設模式

上海市電子政務災備中心是上海市政府投資建設,自行運營的項目。數據級災備由政府統一采購災備平台、為單位提供定時、實時、異地備份等服務;應用級容災則為各大關乎國計民生的重要部門提供了場地,由接入用戶自行申報災備經費、自行運營;介質存放層提供了封閉、全年恆溫恆濕的場所,供各委辦單位存放重要介質。數據級的傳輸網絡是政務外網,應用級則是由接入單位自行決定,使用政務外網或自建光纖網絡。

三、項目建設歷程

在規劃和建設統一的災備平台,上海市政府綜合考慮技術路線、運維管理、投資保護、長遠規劃等方面,做到統籌規劃、分批實施。2012年,第一期作為試點接入9家單位,為了確保災備技術的可靠性,接入單位采用了不同的災備技術,其中包括了華三的存儲層復制技術及浪擎的軟件備份技術。經過兩年試點,浪擎基於軟件為核心的災備解決方案在可靠性、穩定性及用戶體驗等方面以絕對的優勢,獲得了各接入單位的好評。2014年作為推廣階段的第二期項目,在通過兩輪嚴謹的技術測試認證後浪擎憑借 “完善的產品架構——同時具備成熟的定時、實時及高端雙活解決方案;創新的災備中心端共享式、兩級管理災備平台;滿足兩不一致的技術要求”三大亮點獲得了專家與客戶的高度贊賞,二期計劃接入的28家單位全部采用浪擎災備解決方案,至2015年末,所有單位的項目實施已正式完成並順利通過驗收。

四、浪擎共享式災備平台解決方案

1、設計思路

統一災備平台的建立,其最重要的目的是能高質量地滿足數據恢復可用的需求。災備中心信息系統將面對整合所有主流品牌的異構平台的挑戰,而且用戶應用系統規模、用戶技術力量差異較大的現狀。鑒於此次建設的目的,並根據制定的原則以及明確的災備等級要求、業務連續性要求,在對各個業務系統進行科學、合理地分類和歸並後,采用模塊化方式,建立一套面向全市的、多系統的通用解決方案。其總體設計思路就是,災備中心建立一個共享式的災備管理平台來統一管理災備中心的存儲與計算資源,每個委辦局單位作為平台的一個接入用戶;這個共享式的災備管理平台建立標准的、菜單式的備份容災技術方式,滿足各類用戶、信息系統的差異化需求;接入用戶按照其信息系統的實際狀況來管理其備份策略、計劃、作業、虛擬存儲空間。

2、方案架構

方案架構拓撲圖

接入用戶根據業務對容災等級的不同需求選擇浪擎不同技術路線的災備軟件,生產端可通過備份軟件將業務數據傳輸到前置存儲,按照中心端的調度策略同時也將數據復制到中心端;也可由前置存儲自行定時、實時復制數據到中心端。

在用戶端發生停電、火災等較大故障時,在災備中心端,通過災備中心的軟件可手工恢復數據到用戶服務器或磁盤陣列,但恢復時間較漫長;當某台服務器或存儲發生故障時,在用戶端,通過前置存儲的軟件實時或定時恢復到備用服務器,優點在於備用服務器與生產服務器數據基本同步,RTO、RPO指標較優;當接入單位業務系統發生故障時,從災備中心的存儲實時恢復數據到災備中心的容災服務器或虛擬服務器上,實現應急容災。數據恢復期間需根據實際環境來配置網絡連接等讓接入用戶能訪問容災服務器的業務系統。

共享式的備份管理平台將每個委辦局作為系統的一個接入用戶,所有用戶共享這個統一的備份管理平台和資源。每個用戶擁有獨立的虛擬存儲、備份策略、計劃、帳號等資源。橫向擴展可做到災備中心備份能力的堆疊,災備中心只需配置更多的服務器和存儲加入到共享式備份管理平台中來不斷擴充災備中心的備份支撐能力。當新增一個接入用戶時,只需為該用戶新增用戶端接入子系統即可,無需再購買中心端軟件平台。

而傳統的備份系統是針對一個用戶單位的備份需求來設計其系統架構的。因此,采用這種架構來解決備份中心的需求時,有多少家政府部門要做備份,就需要購買多少套備份系統,這樣從技術上無法做到共享管理,管理上則需要維護很多備份軟件,從而增加大量的維護工作,造成大量的重復投入。

3、方案功能

浪擎制定了定時備份、CDP備份、數據庫雙活復制三種技術來構建統一的、適用於全市各異構應用系統的災備平台。平台規定容量、由用戶自行定時復制所有需要保護的業務數據,以實現數據級災備。定期演練,確保災備數據可恢復性。首創共享式災備平台 電子政務災備中心


l 定時數據備份

浪擎D系定時備份是指對業務系統數據進行定時備份保護業務系統的數據。當業務系統的生產數據發生丟失時,備份數據可以恢復成可用數據進行使用,適合於一些低等級的容災方案,對RTO和RPO要求相對比較低。D系對備份服務器硬件和網絡等無特殊要求,可實現低成本、高保障的數據備份。其支持主流的數據庫和文件的備份以及恢復,具有全面保護、安全可靠、功能強大、簡單易用等產品特色。

l CDP(可持續數據保護)備份容災技術

浪擎D系DataBackup實時備份是對業務系統數據進行實時在線備份,持續保護業務系統的數據。當業務系統的生產數據發生丟失時,可以實現任意版本、任意時間點的數據恢復、裸機異機恢復,達到RTO、RPO趨於零的保護。

D系實時備份支持定時、實時備份功能;支持本地、異地、遠程備份容災,對備份服務器硬件和網絡等無特殊要求,可實現低成本、高保障的熱備份和熱容災。其支持主流的數據庫、操作系統和文件的備份以及恢復,具有全面保護、安全可靠、功能強大、簡單易用等產品特色。

#FormatImgID_2#l 雙活容災

浪擎AgileMirror鏡像系統是數據庫級別的實時復制容災產品,將生產端的業務數據實時復制到容災端服務器上,當生產端業務系統發生故障時,容災端的備用系統可以無需恢復直接接替生產端的業務系統使用,以保證業務連續運行。鏡像系統首倡雙活容災與在線式應用級容災理念。在線式是指容災端的備用數據庫是在線的,處於可讀可查詢的狀態;應用級是指鏡像系統復制的數據是數據庫事務,是屬於應用層的。具備“零丟失、零恢復、零窗口”三大容災優勢。

基於數據庫的雙活復制

零恢復:恢復指的是當主服務器系統發生故障到備用系統代替使用的過程。備用數據庫是在線的,無需恢復,僅需恢復業務系統即可。所以整個備用系統替換主系統的過程非常快,比其他容災系統要快。

零丟失:采用實時增量數據復制技術將數據復制到備用系統上,復制延時秒級別,數據丟失量極少,趨於零。只有沒被復制到備用系統的數據才會丟失。

零窗口:備份窗口是備份開始到備份結束的一個時間段。鏡像系統采用的是實時增量復制,復制的數據量非常小,而且非常快,其備份窗口趨於零,對主服務器性能影響很小。

鏡像系統的“容災、容錯、查詢”三大核心功能,超越容災的技術範疇,能盤活用戶的容災投資,從而為用戶帶來增值的效益。查詢功能為用戶帶來了一個極為實在的用處——創建備用數據庫可以用來實現查詢統計功能,分流主數據庫的性能壓力,容錯功能防止數據被損壞,保護業務數據。

4、運維與管理特點

l 接入用戶管理和電子政務災難備份中心兩級監管

共享式災備管理平台設計方案的“兩級監管”使備份事務和存儲管理獨立,兩級管理各司其職。電子政務災難備份中心提供通用備份和存儲服務,負責存儲、備份作業、各用戶狀態、網絡等的監管。接入單位作為共享式災備管理平台的一個邏輯用戶,擁有可以配置的存儲限額,邏輯獨立的存儲空間。各接入委辦局單位也可根據業務應用特點選擇不同備份服務類型,或者數據定時備份,或者數據實時備份,或者更重要業務系統的容災接管,且各自負責本單位各應用的備份策略、計劃、代理管理以及日常運營等。

l 策略管理

某些委辦局重要的業務系統需要實現容災接管的策略功能,則可通過共享式災備管理平台分配合理的計算點,實現容災服務器的接管。對於那些不需要容災接管的委辦局業務系統則采取數據定時/實時的備份策略,並通過共享式災備管理平台的分布式存儲技術把數據備份到存儲設備上。

l 統一監控、WEB管理平台

用戶端可以安裝Web模塊負責本區委辦單位用戶的監控管理,監控整個災備中心服務設備、網絡運行、容災業務等。無論在用戶端還是在中心端,相關的運行監管、備份策略、故障報警等配置都可以通過Web平台界面方便操作和維護。

l 強大的橫向擴展功能

備份中心面臨越來越多需要備份的區委辦單位,橫向擴展可以做到備份中心備份能力的堆疊。備份中心只需添置更多的服務器和存儲加入到共享式備份管理平台中,再將新增的用戶指派給這些服務器。這種模式無需再購買共享式災備管理平台的備份管理軟件即可不斷擴充中心的接入能力。

5、針對性設計

l 優化的備份技術

共享式災備管理平台要解決如何支持更多接入單位的問題,優化的備份技術顯得尤為重要。浪擎把每個接入單位作為共享平台的一個用戶,且分配不同的用戶在不同備份服務器。數據備份過程中,采用了一次性全量和追逐式增量復制技術,保證備端數據的完整性;“備份任務”、“備份目錄”兩級引索加快備份速度。

l 優化的網絡傳輸

通過WEB端的統計報表可以對某個特定時間段系統運行速率、流量進行監控、分析、優化。為了避免網絡堵塞的情況發生,可以通過調配用戶端的備份計劃運營時間及備份時間段來保障網絡的通暢。

l 優化的數據捕獲與復制

優化的實時復制/雙活復制技術,僅復制改變的數據塊,或僅復制數據塊變化日 志塊,大大減少了數據傳輸量從而保障了網絡的通暢;旁路IO復制、異步復制技術,不會造成因復制發生故障而影響用戶生產系統。

l 兩層監管

備份中心負責所有用戶與存儲設備管理、規劃、監控全網運營,並為每個用戶開設定額虛擬存儲池,配置存儲策略。各接入單位單位負責本單位各應用的備份策略、計劃、代理管理以及日常運營等。?兩級管理可清晰劃分兩級的職責、工作內容,減少後期運營的糾紛、運維成本。

6、方案特色

l 一對多的統一管理平台

建立統一備份管理平台,實現一(中心)對多(用戶)的菜單式備份服務,每個接入單位作為系統的一個獨立用戶,同一用戶可有多個應用同時備份且可根據應用特點選擇不同備份服務。所有用戶共享一個災備平台,無需購買單獨的備份系統,節約投入成本。

l 每個接入單位作為獨立用戶

每個接入單位作為系統的一個獨立用戶,擁有獨立的存儲、備份策略、計劃等資源;擁有限額的、虛擬的、邏輯獨立的存儲。接入單位可根據應用特點選擇不同備份服務類型,在同一應用單位裡允許有多個應用備份。災備中心為每個用戶提供虛擬、透明的存儲池,根據每個用戶的實際業務備份需求分配不同的存儲限額,無需用戶參與管理。

l 統一備份門戶

浪擎制定了定時備份、CDP備份、數據庫雙活復制三種技術來構建統一的、適用於全市各異構應用系統的災備平台。接入單位可根據自己對業務連續性要求來選擇不同技術路線的產品,對實時性、可用性、可靠性要求較高的業務系統采用雙活容災、實時復制方式;對非重要業務系統采用定時備份。平台規定容量、由用戶自行定時復制所有需要保護的業務數據,以實現數據級災備,且定期演練,確保災備數據可恢復性。

l 良好的擴展性

共享式的備份管理平台將每個委辦局作為系統的一個接入用戶,所有用戶共享這個統一的備份管理平台和資源。橫向擴展可做到災備中心備份能力的堆疊,災備中心只需配置更多的服務器和存儲加入到共享式備份管理平台中來不斷擴充災備中心的備份支撐能力。當新增一個接入用戶時,只需為該用戶新增用戶端接入子系統即可,無需再購買中心端軟件平台。