網絡存儲設備
隨著計算機及其網絡的應用發展與普及,信息的存儲與管理已經成為核心問題。受這種變化的影響,計算機和網絡系統的設計也在發生結構方面的變化。
早期的計算機系統把數據作為應用的附屬,著眼點是從功能服務的角度為每一位用戶提供數據集合的管理服務,即便是中央處理機直接管理的存儲器也會被分割成若干部分后提供給各個終端用戶。此時存儲器只是系統附屬的外部設備,中央處理機十分繁忙,數據的使用效率不高,而系統開銷卻很大。具有代表性的存儲管理方式是直接存儲,簡稱DAS(Direct Attached Storage)。
隨著數據地位的提升,信息設備制造者和系統集成設計者將數據存儲設備與網絡系統中的各種服務器同等對待,使用戶群按數據服務器進行分類管理。在這種系統中,數據處理較為方便,系統資源得到較為合理的分配,不過仍存在數據資源較為分散的問題,使數據的一致性、安全性、有效性的保證比較復雜。與此相對應的是檔案信息管理與文件管理結合而出現的信息跨部門流動的文檔一體化的應用模式。具有代表性的存儲管理方式是網絡附屬存儲,簡稱NAS(Network Attached Storage)。
隨著信息網絡應用的擴展,信息處理量的進一步擴大,信息處理本身已經占據了系統運行的主要位置。于是以信息存儲設備為中心的計算網絡系統應運而生。在這種系統中,數據成為系統的主角,用戶群的分類和管理是圍繞著數據處理設備進行的。在這種系統中,數據的真實性、完整性和安全性等都可以得到很好的保證,數據的管理效率很高,且系統資源的配置和使用更為合理。與此相對應的是檔案信息化工作中的多種信息的整合,以及數字檔案館的建設與應用。具有代表。性的存儲管理方式是存儲域網絡,簡稱SAN(Storage Area Network)。
以下分別對上述幾種存儲管理結構或模式的特點進行介紹和比較,以利于在此基礎上進行檔案信息化系統的規劃、設計和應用。
1 直接連接存儲(DAS)
直接連接存儲是最為常見的在線存儲方式。在這種方式決定的存儲結構下,存儲設備通過集成電路設備(IDE/SCSI)等I/O總線與通用文件服務器相連,客戶機的數據訪問必須通過服務器,然后經過其I/O總線訪問相應的存儲設備,服務器實際上起到一種存儲轉發的作用,安全性比較高。IDE是集成電路設備的縮寫,微機中的標準IDE設備有兩種:硬盤和光驅。SCSI是小型計算機系統接口的縮寫,這個設備可以提高I/O性能,同時又消除外設連接上的困難,減少軟件問題的PC接口。當同時提到IDE/SCSI時,常是指兩種硬盤的數據傳輸方式。
這種存儲結構的缺陷是,客戶機(用戶終端)訪問的所有數據都需要通過通用文件服務器存儲轉發,較多地占用了服務器的內存、CPU和I/O總線等系統資源,當客戶連接數增多時,I/O 總線將會成為一個潛在的瓶頸,并且會影響到服務器本身的功能,嚴重時甚至會導致系統的崩潰。此外,這種結構的可擴展性差,其擴充網絡存儲容量的方法是為服務器增加更新、更快速的存儲器。如服務器上可供掛接的驅動器已滿,就只有考慮另買一臺昂貴的服務器來擴容了。隨之而來的是響應時間變長,復雜性、維護及管理負載增加以及數據可用性等問題。另外增加幾個存儲器,其價格雖不昂貴,但是關掉服務器安裝存儲盤所造成的停工時間使用戶的服務得不到保障,也會給用戶帶來一定的損失。
因而,這種存儲結構不適用于信息量或業務量較大的用戶對信息的存取處理,而多用于數據量不大、信息處理不頻繁的中小用戶。
2 網絡附加存儲(NAS)
網絡附加存儲是從傳統的文件服務器發展起來的一種專有系統,它和其他節點設備一樣直接連接在局域網上,可以像網絡打印機一樣被其他節點共享。 NAS設備包括存儲器件(如磁盤陣列RAID、CD或DVD驅動器、磁帶驅動器或可移動的存儲介質)和功能服務器。也就是說,采用NAS結構時,存儲系統不再通過I/O總線附屬于某個特定的服務器或客戶機,而是直接通過網絡接口與網絡直接相連,由用戶通過網絡訪問。可見在NAS中,存儲器已經提升到“用戶”的位置,也就是說用戶與數據可融為一體,這樣系統對用戶的數據處理效率自然提高了很多。與DAS相比,NAS具有一些明顯的優勢。這種存儲設備的優點體現在:
(1)易于安裝。一般通用服務器的安裝和配置較復雜,而NAS具有安裝容易、快速的特點,只需將它與網絡相連,通過Web瀏覽器即可完成其配置和管理。
(2)成本較低。由于NAS設備專為文件共享功能設計,不需要鍵盤、顯示器、光驅等通用服務器所需部件,其價格比通用服務器便宜。使用NAS較其他解決方案,可節約成本1/3.
(3)易于維護。在需要增加存儲空間時,只需在網絡上增加新的NAS設備即可,不影響網絡中的其他任何節點。
對于信息量不斷增大,數字化檔案數量不斷增長的一些中小型用戶來說,NAS是DAS更新換代時的較好的選擇,因為增加NAS設備并不僅僅是以較低的成本擴大了網絡的存儲空間。NAS設備可以與原有的文件服務器配合使用,較好地保護了用戶的前期投資, NAS也可以與多功能服務器配合使用,這樣可以減輕服務器的工作壓力,節省更多的時間進行其他應用,從而提高網絡的性能。
但同時NAS也有一些不足之處,對于信息量很大的數字化檔案來說,也許更為明顯。如它的安全性較差,由于NAS的存儲設備直接與以太網連接,其安全性較DAS大大降低,通常必須設置防火墻;它的數據備份能力較差,通常NAS 設備不能直接備份在設備(如專用磁帶機或磁帶庫)上,只能采用基于網絡的備份,增加了網絡信息流量,同時也給災難恢復造成困難。
對于NAS 的應用也有一些爭議。有人指出,1996年以來 NAS開始成為最佳的網絡存儲解決方案。對廣大的政府部門及學校等事業單位和中小型企業來說,NAS將是較好的選擇。在檔案信息管理的文檔一體化應用階段,NAS的確是很好的應用模式,但對數據量更大的情況,應用NAS就不一定適用了,這也就是在NAS開始大展身手的時候,出現了強有力的競爭對手,即存儲域網絡(SAN)的原因。
3 存儲域網絡(SAN)
存儲域網絡是一種類似于普通局域網的一種高速存儲網絡。它通過專用的集線器、交換機和網關建立起與服務器和存儲設備(如磁盤陣列和磁帶庫)之間的直接連接,但其接口通常不是以太網,而是ESCON企業系統連接)、SCSI、SSA(串行存儲區域)、HIPPI(高性能并行接口)或FC(光纖通道)。從某種意義上說,與其把SAN當作一種產品,倒不如把它看作配置網絡化存儲的一種模式。SAN這種網絡技術使存儲設備不再附屬于某個服務器,而允許存儲設備脫離服務器,從而組成與計算網相對應的存儲區域網絡,由此產生了通常所說的前端網和后端網。在SAN中不同平臺的服務器可以對多個存儲設備進行存儲,使存儲成為可由所有服務器共享的資源。SAN還能在存儲設備之間傳輸、復制數據,實現無主機備份。可以說,在SAN中,存儲設備是網絡的核心,這對于以數據處理為主要業務對象的用戶來說,是非常合適的。與其他存儲結構相比,SAN具有一些明顯的優勢:
(1)在可擴展性方面,SAN比傳統的存儲架構具有更明顯的優勢,傳統的服務器連接存儲通常難以更新或集中管理,必須關閉服務器才能增加和配置新的存儲,而SAN不必宕機和中斷與服務器的連接即可增加存儲容量,SAN還可以集中管理數據,從而降低了總體成本。同時,它還克服NAS了在擴展中對IP地址的依賴,達到了真正的易于擴展性。
(2)在SAN結構出現以前,服務器與存儲設備之間一般采用SCSI總線連接,連接距離以往最長為15米,連接設備數目最大為16個,局限性很大。SAN結構采用光纖連接,其連接距離最長可達10公里,如果與數據通訊網絡連接,距離可達數千公里以上,連接設備的數量幾乎不受限制。利用光纖連接距離長的特點,可以提高容災的遠程實時備份能力。將存儲設備同時部署在本地和數公里外的其他地點,本地和遠程存儲設備中的數據完全一致,在發生災害時,部署在遠程地點的網絡設備可以接管各種應用,為用戶提供不中斷的服務。
(3)以太網及其他局域網技術是基于不可靠介質而設計的,在計算機中需要對每個網絡包進行傳輸校驗及重發,消耗大量的CPU資源,增加服務器的負擔,而光纖通道比傳統網絡的可靠性提高了數個數量級,傳輸誤碼率極低。目前光纖的傳輸速度為100MB/s,很快將會發展到200MB/s和400MB/s。在光纖通道上以SCSI協議進行大規模數據傳輸時,在如此高的傳輸速度下,對CPU資源的占用卻極小。
(4)備份操作是將磁盤陣列中的數據復制到磁帶庫上,在傳統的DAS和NAS結構中,數據須經由局域網傳輸,服務器先將數據從磁盤陣列中讀出,再通過LAN傳送到另一服務器,由該服務器將數據備份到磁帶庫中。
在SAN結構中,服務器可同時訪問磁盤陣列和磁帶庫,因此可由同一臺服務器來完成備份,將數據從磁盤陣列中讀出后備份到磁帶庫中。由于備份操作不需要經過局域網,而直接通過光纖傳輸,備份速度很高,而且不占用局域網的帶寬,因此SAN備份也被稱作獨立于局域網的備份(LAN – free Backup)。SAN備份的一個發展趨勢是Serve-Free備份,可以做到在備份操作中不需要服務器參與,數據直接在磁盤陣列和磁帶庫之間傳輸。SAN在推廣應用中也有一些問題或缺陷:
(1)系統造價較高,實現SAN需要在原有網絡設施外另外組建一個光纖網絡。SAN部件的價格較高,根據統計,平均每GB數據,NAS的費用為20-50美元,而SAN則是150-200美元。
(2)SAN的硬件、軟件之間目前還存在兼容性問題,所以它雖然實現了SAN環境中數據的集中存儲,但要實現數據完全共享還受到較大限制,需要客戶端的操作系統對其他操作系統的數據格式有較好的支持。
SAN主要用于電信、銀行、保險等數據量較大的用戶。在數字檔案館的建設中,SAN有很好的應用前景。
在檔案信息化建設中上述幾種存儲模式和相應的設備都可以獲得適當的應用,選擇要點有以下一些:已經保有的數據量;每年的數據增加量;數據的使用頻率;需要聯機存儲的數據量;數據的重要程度;數據的種類多少;數據來源和采集方法;數據的安全等級;數據的容災等級等。