深圳市檔案局 李國慶
2002年12月8日,國家檔案局在深圳召開了“檔案信息化建設現場演示會”,深圳市檔案局館向與會代表成功地演示了深圳數字檔案館應用系統的各項主要功能,這標志著“深圳數字檔案館系統工程建設”項目已經取得了階段性成果:該項目課題組歷經兩年的努力,對數字檔案館的基本理論、框架結構、基礎設施、應用技術和實現模式的研究、開發,都取得了長足的進展和可喜的成就。
一、對“數字檔案館”的認識
數字檔案館是近年來檔案界提出的新概念,暫時還沒有取得統一的認識和提法。綜合目前的各種提法,較為完整的表述應該是:數字檔案館是建立在現代信息技術普遍應用基礎上,利用數字化手段,以綜合檔案信息資源為處理核心,對數字檔案信息資源進行收集、管理,通過高速寬帶通信網絡設施相連接和提供利用,實現檔案信息資源共享的超大規模、分布式數字信息系統。從目前國內外有關情況和發展趨勢看,有各種類型的數字檔案館??綜合性的、行業的、專題的、甚至個人的,本文所論述的是國家綜合性數字檔案館。
以“有序的信息空間和開放的信息環境”為特征的完整意義上的數字檔案館,不是封閉的檔案館信息網絡,而是包含在辦公自動化系統、計算機輔助設計和管理系統、公共信息數據管理系統等更為廣闊的大系統之中,由分布式檔案信息資源構成的具有強大服務功能的跨機構、跨地域的信息系統。數字檔案館建設,應該納入各地政府信息化建設總體規劃,成為政府信息系統的一個重要組成部分。
數字檔案館的含義有廣義和狹義之分。廣義數字檔案館是指存儲和利用檔案信息資源的信息空間,是一個由眾多檔案資源庫群、檔案信息資源處理中心、檔案用戶群構成的數字檔案館群體。狹義數字檔案館是指其中的個體檔案館,其含義除了館藏檔案數字化工作外,還涉及檔案信息的采集、整理、存儲、檢索、傳遞、保管、保護、利用、鑒定、統計等全過程,代表的是一種信息環境和基礎設施的構建,包括軟、硬件系統的設計和組織實體的建立。
二、深圳數字檔案館的五大建設任務
基于上述理論認識,深圳數字檔案館在建設中確定了五大任務:軟硬件基礎設施建設、應用系統開發、數字信息資源建設、標準規范體系建設、人才隊伍建設。
(一)基礎設施建設
深圳數字檔案館的基礎設施建設主要包括網絡環境、硬件環境和系統軟件建設三部分。根據三種不同的服務對象和范圍,網絡環境分為檔案館內部網、與政府連接的政務網、與互聯網連接的公眾網三個層次,并實行三網物理隔離。根據數字檔案館的功能需要,數字檔案館的基礎硬件設施主要包括網絡設備、服務器、檔案數字化加工等設備以及其他支撐設備等,并要建設大容量的分布式資源數據庫、大規模并發用戶的訪問服務管理系統。在進行數字檔案館系統軟件建設,尤其是在選擇操作系統的過程中,遵循了通用、實用、可靠、節省、成熟、方便維護等原則,選擇了目前世界上流行的windows、UNIX、MNUX等操作系統。
(二)應用系統開發
深圳數字檔案館應用系統的建設目標是建成一個可擴展的網絡應用系統、其功能涵蓋檔案的數字化加工、電子檔案信息的采集、處理、存儲、歸檔、組織、發布、利用及數字資源管理全過程。所采用的許多關鍵技術,屬于當前計算機技術、信息技術、人工智能領域中最先進、最有發展前途的前沿科學,例如:大量并發查詢、數據倉庫、數據挖掘、海量數據存儲、網絡安全、圖象分類、智能檢索、人工語言向自然語言轉換、視頻點播、虛擬現實技術等。這些技術在數字檔案館工程項目中的應用,將大大提高數字檔案館系統的技術含量,確保其技術的先進性。應用系統的構成及其功能將在下一個論題具體闡述。
(三)數字信息資源建設
深圳數字檔案館數字信息資源建設的定位是分布式文件、檔案數字資源構成的具有強大服務功能的跨機構、跨地域的信息系統。這個系統突破了傳統“檔案信息”的內涵、建立了廣義“檔案信息”概念,其采集、存儲、管理的信息數據構成形式包括:文本文件、圖形文件、圖像文件、影像文件、聲音文件及其他文件(如命令文件,亦稱計算機程序)等。其來源和采集范圍包括:傳統檔案館的館藏、立檔單位的檔案文件材料、有檔案性質的行業及專題信息資源庫和互連網上其它具有檔案價值的信息等。通過對各類信息的整合,形成一個社會綜合信息資源庫,以滿足社會各方面對檔案信息資源的需要。
(四)標準規范體系建設
深圳數字檔案館在建設過程中,采用、研制、建立了一套相關的行政法規、業務規范、技術標準和管理規則。深圳數字檔案館的標準規范體系包括管理業務、技術二個層面。管理性標準規范包括計算機安全法規與標準,數字檔案館工作人員、用戶及設備管理規范,利用管理規定,以及數字檔案館信息資源合法性的確認等;業務性標準規范包括術語標準以及相關的電子文件和電子檔案管理的標準、規范;技術性標準規范包括數字檔案館軟硬件基礎設施建設技術標準,軟件系統工作平臺技術標準,數據存儲壓縮格式規范,數據長期保存格式規范,數據加密算法規范,網絡數據傳輸規范和數字水印標準等。
(五)人才隊伍建設
深圳數字檔案館的人才隊伍建設貫徹以管理型人才為基礎,以復合型人才為重點的指導思想。根據數字檔案館業務工作的劃分,所需人才的類型有:檔案采集、處理與數據庫加工人才;信息技術及計算機系統和網絡設計與開發人才;檔案信息分析、研究與咨詢人才;數字檔案館理論與方法研究人才;數字檔案館系統運營與服務的管理人才。對人才隊伍業務素質的要求是具有較全面的知識結構以及敏銳的信息意識、良好的信息道德、較強的信息能力,以適應數字檔案館的建設和正常運行的需要。
三、深圳數字檔案館的階段性成果
經過兩年的努力,深圳數字檔案館建設的上述各項任務均取得了階段性成果。主要表現是:
1、在《深圳數字檔案館總體規劃書》指導下,完成了《第一期工程需求報告》、《工程實施方案》、《數字檔案館應用需求分析報告》等綜合性、指導性文件,并付諸實施。
2、完成了《電子郵件公文歸檔與管理規則》(行業標準項目)、《電子文件元數據標準》、《電子文件生命周期表》、《通用電子文件保管期限表》等一批標準、規范的起草工作。
3、應用系統的研制開發已經基本成型,正在進一步完善,其中數字化加工處理軟件已經投入運行。
4、已經建成檔案數字化加工生產線,日加工能力不斷提高,完成了相當數量的館藏紙質檔案、照片檔案的數字化,同時為部分立檔單位進行檔案數字化加工,建立了一定規模的數據庫。
5、深圳市檔案館新館舍(數字檔案館所在地)正在進行網絡布點、布線,有關設備正分批購置,陸續到位。數字檔案館的具體運作機構,已由市編辦正式下文成立予以定編,為數字檔案館的運行打下了良好基礎。
四、深圳數字檔案館應用系統的四大功能模塊
根據數字檔案館的總體要求,按照檔案信息的數據流向,深圳數字檔案館的應用系統共包括:電子檔案信息收集、電子檔案信息管理、電子檔案信息利用、電子檔案信息安全維護四個功能模塊。
(一)電子檔案信息收集模塊。負責各類電子檔案信息的采集并將其輸入系統。根據數字檔案館數字信息資源的來源,在此模塊下設立了三個子系統:1、館藏資源數字化系統,包括紙質檔案掃描子系統、縮微膠片數字化子系統、視頻資料數字化子系統、音頻資料數字化子系統;2、信息接收系統,通過卸載報盤和網絡在線的方式,接收立檔單位的電子檔案和應歸檔電子文件及其元數據,以及下屬檔案館的電子檔案信息;3、信息搜尋系統,通過網絡在線采集現有的各種信息資源庫,如國土信息資源庫、人口統計信息資源庫等;采集各網站的網頁、歷史照片、有關新聞報道、統計數據、歷史事件的聲像資料等其他社會零散信息,作為數字檔案館數字資源建設的補充。
(二)信息管理模塊。主要負責對采集到的信息進行整理、分類、管理,使大量無序的信息有序化。其功能主要包括:電子檔案標準化、元數據著錄、分類號主題詞自動標引、多媒體檔案標引、目錄管理、檔案鑒定、報表打印、信息統計等。其中電子檔案標準化子系統對收集來的符合或通過轉換使其符合一定規范(包括電子文件元數據標準、數據交換標準、文件的語言格式、數據交換的物理存儲介質標準和數據交換的邏輯格式標準等)的數字信息及其元數據,根據采集時所帶的目錄信息,采取一定的分類方案,將這些數據有序地存儲到系統中。元數據著錄子系統是對采集來的數字檔案信息進行內容、結構、背景信息等相應項目的元數據進行檢查和缺項補著錄,建立元數據庫。分類號主題詞自動標引子系統含有按邏輯關系將符合《中國檔案主題詞表》有關要求的主題詞和符合《中國檔案分類法》有關要求的信息分類號組合在一起所形成的一套分類號主題詞對照表,系統可以從“對照表”中自動提取相應的分類號?主題詞,完成標引任務。檔案輔助鑒定子系統可以對數字檔案信息進行批量的內容鑒定和技術鑒定:內容鑒定是根據檔案開放所必須具備的條件,檔案價值判定、保管期限劃分的標準,檔案真偽鑒別的主要依據等要素,同檔案文件的來源、類別、責任人、形成時間、存儲介質等眾多信息相結合,制訂鑒定規則,利用計算機的智能技術,建立起專家智能鑒定系統,進行檔案信息的批量輔助鑒定;在此基礎上再由專家對輔助鑒定過的檔案信息進行直接鑒定,予以確認,不僅可以大大減少全部由人工直接鑒定的工作量,同時能保證鑒定的質量。技術鑒定子系統是對電子文件各方面的技術狀況進行全面檢查,包括對文件信息真實性、完整性、可讀性分析以及對文件載體狀況的檢測(該系統目前正在研制當中)。統計報表子系統能對系統中的基本數據進行匯總,形成統計表,包括規范化統計表和自定義統計表,如檔案館基本情況年報、全年檔案利用統計表、溫濕度統計表等。
(三)信息利用模塊。負責對數字檔案館管理的海量電子檔案信息,運用計算機和網絡技術向社會提供超越時空界限的利用服務,可以使具備上網條件的用戶在任何地點、時間得到權限許可的檔案信息,真正實現數字檔案信息資源的共享。該模塊包括:檔案信息開發,綜合智能查詢,網站信息發布,光盤發布等子系統。其中檔案信息開發子系統的主要功能是進行檔案信息的編研規范化和素材編輯。綜合智能查詢子系統可提供館藏電子檔案的文檔、圖形圖象、語音資源、視頻資源的查詢閱覽及虛擬演播等服務。網站信息發布子系統能夠將館藏電子檔案通過互連網進行發布,提供對外信息服務。光盤發布子系統能將允許發布的多媒體信息資料,包括目錄數據及原文以一定的格式遷移到光盤上,形成發布盤,既能在網上運行閱讀,又能提供給用戶進行單機閱讀。
(四)電子檔案信息安全維護模塊。深圳數字檔案館的安全維護,從物理安全、信息資源安全和安全保密管理幾方面著手,采取了一系列措施:
1、數據遷移、備份、恢復。數字檔案館的應用系統分布在三網物理隔離的網絡環境中,無法直接通信,這就產生了信息隔膜,必須進行數據遷移。本系統采用的方法是先從一個網絡的數據庫中將數據導出到可寫光盤、熱拔插硬盤等介質,再將這些介質接到另一個網絡,將數據導入其數據庫中。深圳數字檔案館系統的主要設備、軟件、數據、電源等都有備份,并有技術措施和組織措施可以在發生故障后較短時間內恢復系統運行。服務器采用雙機備份,主工作機出現故障后,備份機自行啟動工作。數據脫機備份使用光盤,災難恢復采用磁帶機。服務器的UPS電源保證在停電后十小時內仍可保持正常工作;軟件備份利用關系數據庫系統自身提供的功能,對元數據和存儲文件的對象數據庫進行備份恢復。
2、計算機病毒防治。采用國家有關主管部門批準的查毒、殺毒軟件,適時對服務器和客戶端查毒、殺毒,并制定嚴格的防毒制度。
3、身份鑒別。深圳數字檔案館系統鑒別主體身份的方法主要有二種:一是只有該用戶了解的秘密,如口令、密鑰等;二是用戶攜帶的能證明用戶身份的物品,如智能卡;三是只有該用戶具有的獨一無二的特征或能力,如指紋、聲音、視網膜等。凡政務網上的在線移交、信息檢索都要進行身份鑒別。
4、訪問控制。對用戶進行操作權的限制,包括功能權限制和數據權限制,主要防范用戶的越權訪問。
5、信息加密。分傳輸加密和存儲加密。信息傳輸加密用來防止通信線路上的竊聽、泄漏、篡改和破壞,其方式通常有鏈路加密、網絡層加密、應用層加密等,深圳數字檔案館系統采用應用層加密。凡是需要在網絡上傳輸的數據,傳輸前必須加密。信息存儲時,對每份原文進行了加密。加密協議采用的是國際標準協議DES和RSA,具有一定的權威性。
6、信息完整性校驗。其作用是防止信息被非法篡改、插入和刪除。本系統采用數字水印技術保護信息的完整性。
7、安全審計。深圳數字檔案館系統利用數據庫、操作系統、安全保密產品和應用軟件的審計功能來完成安全審計。
五、數字檔案館與傳統檔案館的關系
數字檔案館的建成,并不意味著傳統檔案館的消亡。由于各自的主要功能不同,加之各自具備適應某種社會需求的特殊優勢,決定了數字檔案館和傳統檔案館將長期共存,它們之間是一種互為補充、互相依存的關系。
(一)數字檔案館不可取代傳統檔案館
數字檔案館在向社會提供服務中,與傳統檔案館相比具有明顯優勢,但這并不說明數字檔案館可以取代傳統檔案館,在現代社會傳統檔案館具有自身的優勢,具有繼續存在和發展的生命力。
1、傳統檔案館的館藏主要是原始檔案的實體,在歷史真跡、憑證價值方面具有法律效力上的優勢。當人們需要獲得法律援助時,除了在網上搜尋有利的信息外,還要索取不易被篡改的檔案實體原件作為原始憑證。這一社會功能的有效發揮,非傳統檔案館莫屬。
2、傳統檔案館館藏的重要檔案原件以紙質為主,許多重要的原件進行了縮微拍攝。紙質和膠片的壽命都遠遠超過數字化信息,且不易被篡改。據測試,機讀磁帶、唱片、硬盤的壽命僅十至幾十年,其中磁帶至多20年,壽命最長的是CD-ROM,但也只有30年左右。要想延長數字化信息的保存期限,只有不斷地重新復制。要長久保存歷史檔案文化財富,目前最可靠的還是傳統檔案館。
3、傳統檔案館以其豐富的歷史檔案和珍藏的孤本原件可供有關社會人士休閑觀賞,充分發揮檔案珍品的社會價值,盡管憑借汁算機從網絡上也可以搜尋、閱讀多媒體珍品信息,但從觀賞、品味的角度來講,人們更看重珍品的實體原件。在人民生活水平、文化素養不斷提高的現在和將來,這一社會需求將日益突現。
4、數字化信息必須借助于一定的硬件和軟件才能被用戶所利用,由于經濟和技術發展的不平衡,在一些經濟欠發達地區,計算機和網絡的應用在相當長時間內還不會普及到全體社會公眾,許多人還要造訪傳統檔案館,查閱、利用檔案。傳統檔案館的社會服務功能,還將繼續沿用很長時間。
(二)數字檔案館與傳統檔案館互相依存
數字檔案館與傳統檔案館都因社會的需求和各自的優勢而得以生存和發展,然而由于各自都有某些弱點而必須互相依存,不能孤立地存在。
1、在檔案信息資源建設上,傳統檔案館館藏檔案原件是數字檔案館數字化檔案信息的重要來源;數字檔案館為傳統檔案館進一步豐富館藏提供線索和可能。傳統檔案館保存的本轄區或本專業系統立檔單位移交的檔案以及征集進館的珍貴檔案原件,通過數字化加工,進入數字檔案信息資源庫,成為數字檔案館數字化檔案信息中最基本的、重要的核心組成部分。離開了這一來源,數字檔案館將難以構建完整的、有權威的信息資源庫。然而傳統檔案館的館藏檔案主要是根據國家規定,通過接收立檔單位移交的檔案積累起來的,而對于散存的重要檔案以及其他專門行業檔案信息的收集,卻因缺乏線索和有效途徑而難以實現。數字檔案館恰好在這方面具備優勢。數字檔案館保存的數字信息,不僅有傳統檔案館館藏檔案的數字化信息,還包括電子政府形成的電子文件及時歸檔、政府綜合信息的及時采集。同時,數字檔案館與企業信息化建設相聯系,可與企業信息網絡建立互聯互通關系;與電子商務建設相聯系,可與金融、保險、政府采購、運輸、物流配送等電子商務信息服務系統建立聯通關系;與社會公共服務信息化建設相聯系,可與覆蓋全社會各領域(包括教育、科技、文化、醫療、社會保障等)的應用信息數據庫建立互聯關系。這樣就為傳統檔案館提供了進一步收集社會檔案信息,豐富館藏的線索和途徑。
2、在檔案信息資源的開發利用上,傳統檔案館由于缺乏強有力的開發利用手段,受時間和空間的局限而不能迅速、廣泛地為社會提供檔案信息服務,限制了檔案信息價值的發揮。數字檔案館則可以憑借網絡優勢,在極廣闊的范圍內發布數字檔案信息,不受時間、地域的限制,提供快捷、方便的服務,實現檔案信息資源共享。在必要的時候,可以通過傳統檔案館收藏的檔案原件和縮微品取得真實性印證,產生檔案信息的法律效力。
3、在檔案信息真跡的保護上,傳統檔案館優于數字檔案館。數字化信息可以完美地被復制,也可以不留痕跡地被修改。計算機病毒、磁場、電磁脈沖都對數字化信息和計算機系統具有破壞性。由于信息技術發展迅速,同時也由于商業因素,數字檔案館常常遇到技術過時的問題,需要更新硬件設備和軟件版本,需要把數據遷移到新型的載體上去。而在遷移過程中容易出現數據丟失的問題。盡管上述問題可以采用較先進的技術得到控制性的解決,但難以從根本上杜絕發生。
4、在檔案信息的加工上,傳統檔案館館藏檔案信息經過數字化加工、整序,成為數字檔案館數字信息資源的核心組成部分,并生成各種類型的信息目錄(二次文獻)和結構較單純的檔案參考資料(三次文獻),如“大事年表”等。這種方式的二次加工,不僅免除了傳統檔案館人工編目、編研的繁瑣和辛勞,而且所編的目錄、資料能適合機檢和手檢、機讀和直讀,形式可以不斷更新,能滿足不同的需求,能在館內和網上組建檔案信息資料目錄中心。而深層次加工的檔案編研成果(三次文獻),如:各種“綜述”、“專題概要”、“人物傳記”、“指南”以及利用館藏檔案資料編制的圖片、音像等多媒體參考資料,還要依靠傳統檔案館來進行,數字檔案館可以將經數字化的深層次編研成果,融入數字信息資源庫在網上發布,提供服務。
(牛角摘自《中國檔案》2003年第3期)
2002年12月8日,國家檔案局在深圳召開了“檔案信息化建設現場演示會”,深圳市檔案局館向與會代表成功地演示了深圳數字檔案館應用系統的各項主要功能,這標志著“深圳數字檔案館系統工程建設”項目已經取得了階段性成果:該項目課題組歷經兩年的努力,對數字檔案館的基本理論、框架結構、基礎設施、應用技術和實現模式的研究、開發,都取得了長足的進展和可喜的成就。
一、對“數字檔案館”的認識
數字檔案館是近年來檔案界提出的新概念,暫時還沒有取得統一的認識和提法。綜合目前的各種提法,較為完整的表述應該是:數字檔案館是建立在現代信息技術普遍應用基礎上,利用數字化手段,以綜合檔案信息資源為處理核心,對數字檔案信息資源進行收集、管理,通過高速寬帶通信網絡設施相連接和提供利用,實現檔案信息資源共享的超大規模、分布式數字信息系統。從目前國內外有關情況和發展趨勢看,有各種類型的數字檔案館??綜合性的、行業的、專題的、甚至個人的,本文所論述的是國家綜合性數字檔案館。
以“有序的信息空間和開放的信息環境”為特征的完整意義上的數字檔案館,不是封閉的檔案館信息網絡,而是包含在辦公自動化系統、計算機輔助設計和管理系統、公共信息數據管理系統等更為廣闊的大系統之中,由分布式檔案信息資源構成的具有強大服務功能的跨機構、跨地域的信息系統。數字檔案館建設,應該納入各地政府信息化建設總體規劃,成為政府信息系統的一個重要組成部分。
數字檔案館的含義有廣義和狹義之分。廣義數字檔案館是指存儲和利用檔案信息資源的信息空間,是一個由眾多檔案資源庫群、檔案信息資源處理中心、檔案用戶群構成的數字檔案館群體。狹義數字檔案館是指其中的個體檔案館,其含義除了館藏檔案數字化工作外,還涉及檔案信息的采集、整理、存儲、檢索、傳遞、保管、保護、利用、鑒定、統計等全過程,代表的是一種信息環境和基礎設施的構建,包括軟、硬件系統的設計和組織實體的建立。
二、深圳數字檔案館的五大建設任務
基于上述理論認識,深圳數字檔案館在建設中確定了五大任務:軟硬件基礎設施建設、應用系統開發、數字信息資源建設、標準規范體系建設、人才隊伍建設。
(一)基礎設施建設
深圳數字檔案館的基礎設施建設主要包括網絡環境、硬件環境和系統軟件建設三部分。根據三種不同的服務對象和范圍,網絡環境分為檔案館內部網、與政府連接的政務網、與互聯網連接的公眾網三個層次,并實行三網物理隔離。根據數字檔案館的功能需要,數字檔案館的基礎硬件設施主要包括網絡設備、服務器、檔案數字化加工等設備以及其他支撐設備等,并要建設大容量的分布式資源數據庫、大規模并發用戶的訪問服務管理系統。在進行數字檔案館系統軟件建設,尤其是在選擇操作系統的過程中,遵循了通用、實用、可靠、節省、成熟、方便維護等原則,選擇了目前世界上流行的windows、UNIX、MNUX等操作系統。
(二)應用系統開發
深圳數字檔案館應用系統的建設目標是建成一個可擴展的網絡應用系統、其功能涵蓋檔案的數字化加工、電子檔案信息的采集、處理、存儲、歸檔、組織、發布、利用及數字資源管理全過程。所采用的許多關鍵技術,屬于當前計算機技術、信息技術、人工智能領域中最先進、最有發展前途的前沿科學,例如:大量并發查詢、數據倉庫、數據挖掘、海量數據存儲、網絡安全、圖象分類、智能檢索、人工語言向自然語言轉換、視頻點播、虛擬現實技術等。這些技術在數字檔案館工程項目中的應用,將大大提高數字檔案館系統的技術含量,確保其技術的先進性。應用系統的構成及其功能將在下一個論題具體闡述。
(三)數字信息資源建設
深圳數字檔案館數字信息資源建設的定位是分布式文件、檔案數字資源構成的具有強大服務功能的跨機構、跨地域的信息系統。這個系統突破了傳統“檔案信息”的內涵、建立了廣義“檔案信息”概念,其采集、存儲、管理的信息數據構成形式包括:文本文件、圖形文件、圖像文件、影像文件、聲音文件及其他文件(如命令文件,亦稱計算機程序)等。其來源和采集范圍包括:傳統檔案館的館藏、立檔單位的檔案文件材料、有檔案性質的行業及專題信息資源庫和互連網上其它具有檔案價值的信息等。通過對各類信息的整合,形成一個社會綜合信息資源庫,以滿足社會各方面對檔案信息資源的需要。
(四)標準規范體系建設
深圳數字檔案館在建設過程中,采用、研制、建立了一套相關的行政法規、業務規范、技術標準和管理規則。深圳數字檔案館的標準規范體系包括管理業務、技術二個層面。管理性標準規范包括計算機安全法規與標準,數字檔案館工作人員、用戶及設備管理規范,利用管理規定,以及數字檔案館信息資源合法性的確認等;業務性標準規范包括術語標準以及相關的電子文件和電子檔案管理的標準、規范;技術性標準規范包括數字檔案館軟硬件基礎設施建設技術標準,軟件系統工作平臺技術標準,數據存儲壓縮格式規范,數據長期保存格式規范,數據加密算法規范,網絡數據傳輸規范和數字水印標準等。
(五)人才隊伍建設
深圳數字檔案館的人才隊伍建設貫徹以管理型人才為基礎,以復合型人才為重點的指導思想。根據數字檔案館業務工作的劃分,所需人才的類型有:檔案采集、處理與數據庫加工人才;信息技術及計算機系統和網絡設計與開發人才;檔案信息分析、研究與咨詢人才;數字檔案館理論與方法研究人才;數字檔案館系統運營與服務的管理人才。對人才隊伍業務素質的要求是具有較全面的知識結構以及敏銳的信息意識、良好的信息道德、較強的信息能力,以適應數字檔案館的建設和正常運行的需要。
三、深圳數字檔案館的階段性成果
經過兩年的努力,深圳數字檔案館建設的上述各項任務均取得了階段性成果。主要表現是:
1、在《深圳數字檔案館總體規劃書》指導下,完成了《第一期工程需求報告》、《工程實施方案》、《數字檔案館應用需求分析報告》等綜合性、指導性文件,并付諸實施。
2、完成了《電子郵件公文歸檔與管理規則》(行業標準項目)、《電子文件元數據標準》、《電子文件生命周期表》、《通用電子文件保管期限表》等一批標準、規范的起草工作。
3、應用系統的研制開發已經基本成型,正在進一步完善,其中數字化加工處理軟件已經投入運行。
4、已經建成檔案數字化加工生產線,日加工能力不斷提高,完成了相當數量的館藏紙質檔案、照片檔案的數字化,同時為部分立檔單位進行檔案數字化加工,建立了一定規模的數據庫。
5、深圳市檔案館新館舍(數字檔案館所在地)正在進行網絡布點、布線,有關設備正分批購置,陸續到位。數字檔案館的具體運作機構,已由市編辦正式下文成立予以定編,為數字檔案館的運行打下了良好基礎。
四、深圳數字檔案館應用系統的四大功能模塊
根據數字檔案館的總體要求,按照檔案信息的數據流向,深圳數字檔案館的應用系統共包括:電子檔案信息收集、電子檔案信息管理、電子檔案信息利用、電子檔案信息安全維護四個功能模塊。
(一)電子檔案信息收集模塊。負責各類電子檔案信息的采集并將其輸入系統。根據數字檔案館數字信息資源的來源,在此模塊下設立了三個子系統:1、館藏資源數字化系統,包括紙質檔案掃描子系統、縮微膠片數字化子系統、視頻資料數字化子系統、音頻資料數字化子系統;2、信息接收系統,通過卸載報盤和網絡在線的方式,接收立檔單位的電子檔案和應歸檔電子文件及其元數據,以及下屬檔案館的電子檔案信息;3、信息搜尋系統,通過網絡在線采集現有的各種信息資源庫,如國土信息資源庫、人口統計信息資源庫等;采集各網站的網頁、歷史照片、有關新聞報道、統計數據、歷史事件的聲像資料等其他社會零散信息,作為數字檔案館數字資源建設的補充。
(二)信息管理模塊。主要負責對采集到的信息進行整理、分類、管理,使大量無序的信息有序化。其功能主要包括:電子檔案標準化、元數據著錄、分類號主題詞自動標引、多媒體檔案標引、目錄管理、檔案鑒定、報表打印、信息統計等。其中電子檔案標準化子系統對收集來的符合或通過轉換使其符合一定規范(包括電子文件元數據標準、數據交換標準、文件的語言格式、數據交換的物理存儲介質標準和數據交換的邏輯格式標準等)的數字信息及其元數據,根據采集時所帶的目錄信息,采取一定的分類方案,將這些數據有序地存儲到系統中。元數據著錄子系統是對采集來的數字檔案信息進行內容、結構、背景信息等相應項目的元數據進行檢查和缺項補著錄,建立元數據庫。分類號主題詞自動標引子系統含有按邏輯關系將符合《中國檔案主題詞表》有關要求的主題詞和符合《中國檔案分類法》有關要求的信息分類號組合在一起所形成的一套分類號主題詞對照表,系統可以從“對照表”中自動提取相應的分類號?主題詞,完成標引任務。檔案輔助鑒定子系統可以對數字檔案信息進行批量的內容鑒定和技術鑒定:內容鑒定是根據檔案開放所必須具備的條件,檔案價值判定、保管期限劃分的標準,檔案真偽鑒別的主要依據等要素,同檔案文件的來源、類別、責任人、形成時間、存儲介質等眾多信息相結合,制訂鑒定規則,利用計算機的智能技術,建立起專家智能鑒定系統,進行檔案信息的批量輔助鑒定;在此基礎上再由專家對輔助鑒定過的檔案信息進行直接鑒定,予以確認,不僅可以大大減少全部由人工直接鑒定的工作量,同時能保證鑒定的質量。技術鑒定子系統是對電子文件各方面的技術狀況進行全面檢查,包括對文件信息真實性、完整性、可讀性分析以及對文件載體狀況的檢測(該系統目前正在研制當中)。統計報表子系統能對系統中的基本數據進行匯總,形成統計表,包括規范化統計表和自定義統計表,如檔案館基本情況年報、全年檔案利用統計表、溫濕度統計表等。
(三)信息利用模塊。負責對數字檔案館管理的海量電子檔案信息,運用計算機和網絡技術向社會提供超越時空界限的利用服務,可以使具備上網條件的用戶在任何地點、時間得到權限許可的檔案信息,真正實現數字檔案信息資源的共享。該模塊包括:檔案信息開發,綜合智能查詢,網站信息發布,光盤發布等子系統。其中檔案信息開發子系統的主要功能是進行檔案信息的編研規范化和素材編輯。綜合智能查詢子系統可提供館藏電子檔案的文檔、圖形圖象、語音資源、視頻資源的查詢閱覽及虛擬演播等服務。網站信息發布子系統能夠將館藏電子檔案通過互連網進行發布,提供對外信息服務。光盤發布子系統能將允許發布的多媒體信息資料,包括目錄數據及原文以一定的格式遷移到光盤上,形成發布盤,既能在網上運行閱讀,又能提供給用戶進行單機閱讀。
(四)電子檔案信息安全維護模塊。深圳數字檔案館的安全維護,從物理安全、信息資源安全和安全保密管理幾方面著手,采取了一系列措施:
1、數據遷移、備份、恢復。數字檔案館的應用系統分布在三網物理隔離的網絡環境中,無法直接通信,這就產生了信息隔膜,必須進行數據遷移。本系統采用的方法是先從一個網絡的數據庫中將數據導出到可寫光盤、熱拔插硬盤等介質,再將這些介質接到另一個網絡,將數據導入其數據庫中。深圳數字檔案館系統的主要設備、軟件、數據、電源等都有備份,并有技術措施和組織措施可以在發生故障后較短時間內恢復系統運行。服務器采用雙機備份,主工作機出現故障后,備份機自行啟動工作。數據脫機備份使用光盤,災難恢復采用磁帶機。服務器的UPS電源保證在停電后十小時內仍可保持正常工作;軟件備份利用關系數據庫系統自身提供的功能,對元數據和存儲文件的對象數據庫進行備份恢復。
2、計算機病毒防治。采用國家有關主管部門批準的查毒、殺毒軟件,適時對服務器和客戶端查毒、殺毒,并制定嚴格的防毒制度。
3、身份鑒別。深圳數字檔案館系統鑒別主體身份的方法主要有二種:一是只有該用戶了解的秘密,如口令、密鑰等;二是用戶攜帶的能證明用戶身份的物品,如智能卡;三是只有該用戶具有的獨一無二的特征或能力,如指紋、聲音、視網膜等。凡政務網上的在線移交、信息檢索都要進行身份鑒別。
4、訪問控制。對用戶進行操作權的限制,包括功能權限制和數據權限制,主要防范用戶的越權訪問。
5、信息加密。分傳輸加密和存儲加密。信息傳輸加密用來防止通信線路上的竊聽、泄漏、篡改和破壞,其方式通常有鏈路加密、網絡層加密、應用層加密等,深圳數字檔案館系統采用應用層加密。凡是需要在網絡上傳輸的數據,傳輸前必須加密。信息存儲時,對每份原文進行了加密。加密協議采用的是國際標準協議DES和RSA,具有一定的權威性。
6、信息完整性校驗。其作用是防止信息被非法篡改、插入和刪除。本系統采用數字水印技術保護信息的完整性。
7、安全審計。深圳數字檔案館系統利用數據庫、操作系統、安全保密產品和應用軟件的審計功能來完成安全審計。
五、數字檔案館與傳統檔案館的關系
數字檔案館的建成,并不意味著傳統檔案館的消亡。由于各自的主要功能不同,加之各自具備適應某種社會需求的特殊優勢,決定了數字檔案館和傳統檔案館將長期共存,它們之間是一種互為補充、互相依存的關系。
(一)數字檔案館不可取代傳統檔案館
數字檔案館在向社會提供服務中,與傳統檔案館相比具有明顯優勢,但這并不說明數字檔案館可以取代傳統檔案館,在現代社會傳統檔案館具有自身的優勢,具有繼續存在和發展的生命力。
1、傳統檔案館的館藏主要是原始檔案的實體,在歷史真跡、憑證價值方面具有法律效力上的優勢。當人們需要獲得法律援助時,除了在網上搜尋有利的信息外,還要索取不易被篡改的檔案實體原件作為原始憑證。這一社會功能的有效發揮,非傳統檔案館莫屬。
2、傳統檔案館館藏的重要檔案原件以紙質為主,許多重要的原件進行了縮微拍攝。紙質和膠片的壽命都遠遠超過數字化信息,且不易被篡改。據測試,機讀磁帶、唱片、硬盤的壽命僅十至幾十年,其中磁帶至多20年,壽命最長的是CD-ROM,但也只有30年左右。要想延長數字化信息的保存期限,只有不斷地重新復制。要長久保存歷史檔案文化財富,目前最可靠的還是傳統檔案館。
3、傳統檔案館以其豐富的歷史檔案和珍藏的孤本原件可供有關社會人士休閑觀賞,充分發揮檔案珍品的社會價值,盡管憑借汁算機從網絡上也可以搜尋、閱讀多媒體珍品信息,但從觀賞、品味的角度來講,人們更看重珍品的實體原件。在人民生活水平、文化素養不斷提高的現在和將來,這一社會需求將日益突現。
4、數字化信息必須借助于一定的硬件和軟件才能被用戶所利用,由于經濟和技術發展的不平衡,在一些經濟欠發達地區,計算機和網絡的應用在相當長時間內還不會普及到全體社會公眾,許多人還要造訪傳統檔案館,查閱、利用檔案。傳統檔案館的社會服務功能,還將繼續沿用很長時間。
(二)數字檔案館與傳統檔案館互相依存
數字檔案館與傳統檔案館都因社會的需求和各自的優勢而得以生存和發展,然而由于各自都有某些弱點而必須互相依存,不能孤立地存在。
1、在檔案信息資源建設上,傳統檔案館館藏檔案原件是數字檔案館數字化檔案信息的重要來源;數字檔案館為傳統檔案館進一步豐富館藏提供線索和可能。傳統檔案館保存的本轄區或本專業系統立檔單位移交的檔案以及征集進館的珍貴檔案原件,通過數字化加工,進入數字檔案信息資源庫,成為數字檔案館數字化檔案信息中最基本的、重要的核心組成部分。離開了這一來源,數字檔案館將難以構建完整的、有權威的信息資源庫。然而傳統檔案館的館藏檔案主要是根據國家規定,通過接收立檔單位移交的檔案積累起來的,而對于散存的重要檔案以及其他專門行業檔案信息的收集,卻因缺乏線索和有效途徑而難以實現。數字檔案館恰好在這方面具備優勢。數字檔案館保存的數字信息,不僅有傳統檔案館館藏檔案的數字化信息,還包括電子政府形成的電子文件及時歸檔、政府綜合信息的及時采集。同時,數字檔案館與企業信息化建設相聯系,可與企業信息網絡建立互聯互通關系;與電子商務建設相聯系,可與金融、保險、政府采購、運輸、物流配送等電子商務信息服務系統建立聯通關系;與社會公共服務信息化建設相聯系,可與覆蓋全社會各領域(包括教育、科技、文化、醫療、社會保障等)的應用信息數據庫建立互聯關系。這樣就為傳統檔案館提供了進一步收集社會檔案信息,豐富館藏的線索和途徑。
2、在檔案信息資源的開發利用上,傳統檔案館由于缺乏強有力的開發利用手段,受時間和空間的局限而不能迅速、廣泛地為社會提供檔案信息服務,限制了檔案信息價值的發揮。數字檔案館則可以憑借網絡優勢,在極廣闊的范圍內發布數字檔案信息,不受時間、地域的限制,提供快捷、方便的服務,實現檔案信息資源共享。在必要的時候,可以通過傳統檔案館收藏的檔案原件和縮微品取得真實性印證,產生檔案信息的法律效力。
3、在檔案信息真跡的保護上,傳統檔案館優于數字檔案館。數字化信息可以完美地被復制,也可以不留痕跡地被修改。計算機病毒、磁場、電磁脈沖都對數字化信息和計算機系統具有破壞性。由于信息技術發展迅速,同時也由于商業因素,數字檔案館常常遇到技術過時的問題,需要更新硬件設備和軟件版本,需要把數據遷移到新型的載體上去。而在遷移過程中容易出現數據丟失的問題。盡管上述問題可以采用較先進的技術得到控制性的解決,但難以從根本上杜絕發生。
4、在檔案信息的加工上,傳統檔案館館藏檔案信息經過數字化加工、整序,成為數字檔案館數字信息資源的核心組成部分,并生成各種類型的信息目錄(二次文獻)和結構較單純的檔案參考資料(三次文獻),如“大事年表”等。這種方式的二次加工,不僅免除了傳統檔案館人工編目、編研的繁瑣和辛勞,而且所編的目錄、資料能適合機檢和手檢、機讀和直讀,形式可以不斷更新,能滿足不同的需求,能在館內和網上組建檔案信息資料目錄中心。而深層次加工的檔案編研成果(三次文獻),如:各種“綜述”、“專題概要”、“人物傳記”、“指南”以及利用館藏檔案資料編制的圖片、音像等多媒體參考資料,還要依靠傳統檔案館來進行,數字檔案館可以將經數字化的深層次編研成果,融入數字信息資源庫在網上發布,提供服務。
(牛角摘自《中國檔案》2003年第3期)