在《云時代的數(shù)據(jù)保護(hù)(上):一體機(jī)與軟硬解耦》一文中,我們討論了將數(shù)據(jù)備份到云這個話題,本文的主題則是另一個方向——備份云中的數(shù)據(jù)。
如果是接近于傳統(tǒng)數(shù)據(jù)中心的私有云,最近幾年這一領(lǐng)域的主要挑戰(zhàn)來自虛擬機(jī)。流行的老牌企業(yè)級數(shù)據(jù)備份軟件,基本都加強(qiáng)了對虛擬化環(huán)境備份的支持;同時也涌現(xiàn)出好幾家的專注于虛擬機(jī)備份的新興廠商(有的已被收購),大家的宣傳點(diǎn)也有些大同小異。在這里我想從用戶的環(huán)境出發(fā),談一些共性的問題,包括價值點(diǎn)和挑戰(zhàn)。
虛擬機(jī)備份VMware一支獨(dú)秀
首先是虛擬化Hypervisor和管理平臺在數(shù)據(jù)保護(hù)方面的支持程度,包括無代理、熱備份(在線備份)、增量備份、合成備份、一致性處理、單文件恢復(fù)、即時恢復(fù)等方面。在這些中VMware做得最好,他們提供了一個強(qiáng)大的VADP(vStorage APIs for Data Protection)接口,備份軟件只要遵循它來做就可以實(shí)現(xiàn)以上多數(shù)功能。
我們來挑幾個要點(diǎn)簡單說一下:
?更改塊跟蹤(CBT):無需花費(fèi)時間在vSphere虛擬機(jī)管理程序系統(tǒng)上掃描客戶機(jī)鏡像中的更改塊,從而加快備份和復(fù)制作業(yè)的速度。這個就是用來實(shí)現(xiàn)增量、合成備份的,重要的是不需要依賴虛擬機(jī)快照。
?無用空間排除:以戴爾vRanger為例,相應(yīng)的功能描述如下“獲得專利的活躍塊映射(ABM) - 從受保護(hù)的Windows客戶機(jī)鏡像中消除Windows頁面文件、休眠文件和非活躍塊及空白塊,以加快備份、復(fù)制和恢復(fù)速度。”
?一致性處理:利用VMware Tools,配合Windows VSS(卷影副本)快照實(shí)現(xiàn)虛擬機(jī)中SQL Server、Exchange等應(yīng)用數(shù)據(jù)的一致性備份,或者Linux文件系統(tǒng)類似的靜默處理。
?單文件恢復(fù):我覺得這一點(diǎn)的前提,主要是要保持源磁盤格式(vmdk)不變,就能瀏覽解析出其中的數(shù)據(jù)而無需整體恢復(fù),不能再像磁帶備份格式那樣打包處理。
?重復(fù)數(shù)據(jù)刪除:這一點(diǎn)和VMware沒有直接關(guān)系,把它補(bǔ)充進(jìn)來是因為虛擬機(jī)備份通常重復(fù)內(nèi)容多,可實(shí)現(xiàn)的重刪比對于節(jié)約備份容量的意義較大。
簡單談下重復(fù)數(shù)據(jù)刪除的分類:目標(biāo)端(包括介質(zhì)服務(wù)器)處理不增加生產(chǎn)主機(jī)負(fù)擔(dān);源端能夠節(jié)約網(wǎng)絡(luò)帶寬;還有一種源端代理與磁盤備份設(shè)備協(xié)同處理的混合模式。
還是拿vRanger舉個例子,它提供了3種支持:
?提供NetVault SmartDisk(vRanger版本附加組件),實(shí)現(xiàn)企業(yè)級重復(fù)數(shù)據(jù)刪除,可將備份存儲占用空間減少多達(dá)90 %。——目標(biāo)端重刪
?EMC Data Domain Boost支持 - 通過DD Boost API使用EMC Data Domain設(shè)備支持分布式重復(fù)數(shù)據(jù)刪除。——混合式全局重刪
?Dell DR RDA支持 - 在Dell DR中通過RDA API支持客戶端重復(fù)數(shù)據(jù)刪除。——混合式全局重刪
盡管Hyper-V這些年有不少進(jìn)步,但VMware已經(jīng)成了行業(yè)標(biāo)桿,Hyper-V在虛擬機(jī)備份接口下的功夫也沒有VMware多。主要的備份軟件大多提供了Hyper-V支持,最常用的基礎(chǔ)功能也可以實(shí)現(xiàn)。
對于有分支機(jī)構(gòu)虛擬機(jī)備份,加上異地集中備份需求的用戶,可以考慮采用戴爾DR2000v to DR4100/6000系列這樣的多對一方案。DR2000v一款純軟件的虛擬設(shè)備,支持運(yùn)行在VMware ESXi或者微軟Hyper-V環(huán)境。它的許可證綁定在物理Dell DR系列設(shè)備上并提供完全相同的功能,包括重復(fù)數(shù)據(jù)刪除、壓縮和雙向復(fù)制,以確保數(shù)據(jù)始終可恢復(fù)。我們看到在惠普和昆騰的磁盤備份產(chǎn)品線中,也提供類似的虛擬設(shè)備。
這樣的復(fù)制一方面減少了實(shí)體設(shè)備,另外經(jīng)過重刪的數(shù)據(jù)也能夠節(jié)省遠(yuǎn)程復(fù)制的帶寬,有助于降低數(shù)據(jù)保護(hù)的總擁有成本。
開源虛擬機(jī)和OpenStack可靠備份如何做?
對于Xen、KVM這些開源項目,以及在此基礎(chǔ)上研發(fā)、包裝的各種虛擬機(jī)產(chǎn)品,就沒有備份VMware這么樂觀了。盡管有些商業(yè)軟件也宣稱提供支持,但能夠達(dá)到的水平可以看看我們下面的簡單分析。
從最基礎(chǔ)的看起,首先是熱備,為了保證虛擬機(jī)磁盤(鏡像文件)的一致性,快照是要有的,VMware也是如此。然而做增量備份就沒有那么簡單了,沒有CBT技術(shù),下圖是使用qcow2格式虛擬機(jī)磁盤文件的一種增量備份方法。
如上圖,有一個鏈?zhǔn)皆隽靠煺瘴募诿看卧隽總浞輹r上次的快照也需要保留。然而從性能和管理復(fù)雜度上這個文件鏈最好不要太長,需要做一些后臺合并的操作。VMware在這方面比較成熟了,而且通常只是為了備份臨時打一個快照;qcow2據(jù)我了解沒有這么成熟,一方面是快照合并時的性能影響,另外I/O復(fù)雜性的增加使它的快照合并存在可靠性上的隱患。
不同虛擬機(jī)平臺更多的差異在于管理功能,這方面VMware有強(qiáng)大的vCenter、微軟有System Center。開源領(lǐng)域廣受關(guān)注的OpenStack,如今也蓋過大數(shù)據(jù)熱潮中的Hadoop成為一個新熱點(diǎn)。一些企業(yè)的大型私有云、云平臺咨詢/服務(wù)提供商等,紛紛投入它的懷抱。我們也來看看OpenStack里的組件對備份支持如何。
Cinder是OpenStack中通用的塊存儲管理接口,上圖中是Cinder的備份功能。每一次增量備份,虛擬機(jī)的全部數(shù)據(jù)都要做切塊Hash計算和比對,以確定新增數(shù)據(jù)。這樣做可以不用快照了,但無法合成備份,但是我覺得效率還是不夠高。
還有些OpenStack的用戶不使用傳統(tǒng)商業(yè)存儲,選擇開源的分布式文件系統(tǒng),調(diào)用文件系統(tǒng)的快照來做備份也是一種辦法。根據(jù)從業(yè)內(nèi)專家朋友處的了解,比如Ceph和GlusterFS都可以通過一個網(wǎng)關(guān)節(jié)點(diǎn)來復(fù)制快照,理論上你可以把某個虛擬機(jī)備份到本地或者遠(yuǎn)程目標(biāo)。但增量備份/恢復(fù)的實(shí)現(xiàn)可能沒有想象中完善,或者還有些限制條件。而且如果想用傳統(tǒng)的重復(fù)數(shù)據(jù)刪除設(shè)備、磁帶作為目標(biāo)介質(zhì),應(yīng)該還有一些工作要做。
有那么一句話“選擇開源項目本身就意味著折騰”,而且KVM/Xen和OpenStack這些在備份方面的考慮本來就不多。所以對于一些關(guān)鍵的虛擬機(jī),比如說運(yùn)行數(shù)據(jù)庫的,我們還是建議用傳統(tǒng)方式——也就是當(dāng)成物理機(jī)來備份。
凡是有過數(shù)據(jù)丟失經(jīng)歷的用戶,對備份容災(zāi)方面的投入一定會更加重視,選擇商業(yè)數(shù)據(jù)保護(hù)產(chǎn)品的另外一個重要價值就是服務(wù)。在沒有理想的開源虛擬機(jī)備份方案的情況下,使用戴爾NetVault、AppAssure這類傳統(tǒng)優(yōu)秀備份、復(fù)制軟件可以局部保護(hù)重點(diǎn)的虛擬機(jī),不失為一種最合適企業(yè)的選擇??梢愿鶕?jù)數(shù)據(jù)量選擇使用備份服務(wù)器本地磁盤,或者像戴爾DR4100/6000系列那樣的重刪磁盤備份設(shè)備。
戴爾與VMware、微軟和RedHat等ISV都是長期合作關(guān)系,在AnyCloud任意云中,可以采用商業(yè)虛擬化產(chǎn)品,或者部署KVM、OpenStack這些開源方案及其衍生產(chǎn)品。對于各種云中的數(shù)據(jù)保護(hù)需求,戴爾是一位您可信賴的專家。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!