數字檔案館關鍵技術
數字檔案館建設是一項綜合性強、技術應用復雜、建設周期長的系統工程,其中需要運用許多先進的計算機編程技術、網絡技術、安全技術等。這里簡要介紹幾種關鍵技術。
1 XML技術
XML(Extensible Markup Language)叫做可擴展置標語言,在數字檔案館的數據管理中占有重要位置,用這種語言來組織管理數據,能夠實現通用、開放、生命周期長等目標。
1. XML的基本概念
XML本身不是一個單純的置標語言,它是一種元語言(meta-language),可以被用來定義任何一種新的置標語言。XML可以用來創造新類別文件的格式定義,也就是在XML之中能夠創造出很多不同的置標語言,用來定義各種不同的文件類別。
2. XML的特點
簡單易懂:XML 對人而言是非常清晰易懂的;計算機可以輕易對它進行處理。
開放對可延伸:XML 于目前幾乎所有的軟件、硬件都是開放的,并且是一種可擴展和延伸的語言,根據需要,可以建立新的置標。
內容與顯示分離:XML 是用來描述內容而非描述外觀。用XML語言來表示一個文件或一個網站,可以在不改變文件或網站內容的情況下來改變其外觀。
可以內嵌多種類型信息:XML 文件可以包含從多媒體信息到各種數據庫、程序文件等多種信息類型,這種特點對于接收多種類型歸檔電子文件至關重要。
3. XML技術在檔案管理系統中的應用
可以解決數字檔案瀏覽、閱讀和存儲對原有軟件、硬件的依賴性,可以簡化檔案管理系統與其它應用系統接口的復雜性,可以保持歸檔電子文件保存格式的多樣性,可以基本解決數字檔案的真實、完整和長期可讀等等。
2 數據倉庫技術
數字檔案管理系統本質上是一個數據庫管理系統,數據倉庫技術是數據庫技術的發展,是一種智能化的數據庫。
1.數據倉庫的基本概念
數據倉庫概念起源于20 世紀 80年代中期,是在系統管理和決策中面向主題的、集成的、與時間相關的、不可修改的數據集合。數據倉庫沒有成熟的基本模式,實際上是一種應用解決方案。
2.數據倉庫的關鍵技術
數據的抽取:數據的抽取是數據進入倉庫的入口,由于數據倉庫是一個獨立的數據環境,它需要通過抽取過程將數據從聯機事物處理系統、外部數據源、脫機的數據存儲介質中導入到數據倉庫。數據抽取在技術上主要涉及互聯、復制、增量、轉換、調度和監控等方面。
數據的存儲和管理:這是數據倉庫的關鍵。數據倉庫的組織管理方式決定了它有別于傳統數據庫,同時也決定了其對外部數據的表現形式。要決定采用什么產品和技術來建立數據倉庫的核心,則需要從據倉庫的技術特點著手分析。
數據的表現:數據表現實際上相當于數據倉庫的門面,其性能主要集中在多維分析、數理統計和數據挖掘方面。
3.數據倉庫的體系結構
為了能夠將已有的數據源提取出來,并組織成可用于決策分析所需的綜合數據的形式,一個數據倉庫的基本體系結構有以下幾個基本組成部分。
數據源:指為數據倉庫提供最底層數據的運作數據庫系統及外部數據。
監視器:負責感知數據源發生的變化,并按數據倉庫的需求提取數據。
集成器:將從運作數據庫中提取的數據經過轉換、計算、綜合等操作,集成到數據倉庫中。
數據倉庫:存儲已經按檔案管理要求轉換的數據,供分析處理用。根據不同的分析要求,數據按不同的綜合程度存儲。數據倉庫中還應存儲元數據,其中記錄了數據的結構和數據倉庫的任何變化,以支持數據倉庫的開發和使用。
應用:供用戶對數據倉庫中的數據進行訪問查詢,并以直觀的方式表示分析結果的工具。
4.數據倉庫在檔案管理系統中的應用
數據倉庫是一個設計思路、一個解決方案,而不是一個可以買到的產品。不同的檔案管理系統會有不同的數據倉庫。在許多情況下,檔案管理人員往往不懂如何利用數據倉庫,不能發揮其決策支持的作用,而計算機編程人員又對檔案管理業務不是很熟悉,不知道建立哪些決策主題,從數據源中抽取哪些數據,因此,在具體應用數據倉庫技術時需要計算機人員和檔案管理專家互相溝通,共同協商開發數據倉庫。
3 VPN技術
數字檔案館的投入和建設是由一個個獨立的檔案館完成的,為了適應社會信息化對檔案事業發展的要求,為了使數字檔案資源能夠社會共享,數字檔案館之間的互相聯通是數字檔案館建設的一個發展方向。從安全角度來考慮,似乎應該為數字檔案館建設一個專用網,但是從現實出發,數字檔案館建專網既不可能,也沒有必要。VPN技術可以解決數字檔案館的館際互聯問題。
1. VPN技術的基本概念
VPN又叫虛擬專用網,是一個被加密或封裝通訊過程,該過程把數據安全地由一端傳到另一端,數據的安全由可靠的加密技術來保障,而數據是在一個開放的、沒有安全保障的、經過路由傳送的網絡上傳輸的。VPN是利用公眾網來構建專用網絡,其核心是被稱為“隧道”的技術,它是通過特殊設計的硬件和軟件直接通過共享的IP網所建立的隧道來完成的。
2. VPN技術的特點
費用低:和建設或者租用專用網相比,使用公眾網的費用非常低,可以節省購買和維護通訊設備的費用。
安全性有保證: VPN通過使用點到點協議( PPP)用戶身份驗證的方法進行驗證,并且采用微軟點對點加密算法( MPPE)和網際協議安全(IPSec )機制對數據進行加密。對于敏感數據,還可以使用VPN 將服務器中的高度敏感數據進行物理隔離,只有內網上擁有相應權限的用戶才能通過遠程訪問建立連接關系,而獲取該敏感數據。
使用方便:使用時間、傳輸速度完全可以由使用者自己決定。