中國人民大學檔案學院 于麗娟
什么是數字檔案館,現在尚無定論。無論是學術研究人員,還是項目建設人員,大都處在摸索和實驗的階段。目前在學術界主要有兩種觀點:一種觀點認為數字檔案館是一種實體概念,是全方位實現信息化的新型檔案館,它包括服務數字化和檔案館其他業務職能的信息化。實現了數字化館藏的存儲、維護、傳輸和提供利用,同時實現了文檔接收、征集、整理、著錄、鑒定、編研、維護、保管、遷移等各項工作的信息化。第二種觀點認為,數字檔案館是一個跨越空間的檔案信息資源的集成,主體是基于網絡的共享數據庫系統,它突破了館與館之間的物理界限,將分散在不同物理位置、不同載體上的信息聯接起來,向用戶提供方便快捷的在線信息服務。①簡單來說,基于本館信息化②的數字檔案館和基于信息共享的數字檔案館將成為數字檔案館的主要形式。而且實踐將說明,這兩種數字檔案館具有很大的互補性,未來應該看到基于“信息化充分發展的檔案館“的信息共享空間。
在國際檔案界,“數字檔案館”(digital archives)概念雖然目前不像“電子文件”那么“火爆”,但卻有逐漸升溫的可能,而且相關的項目也越來越多。美英兩國關于數字檔案館的研究比較集中,而加拿大、澳大利亞、荷蘭等國家雖然對美英兩國數字檔案館中的某些項目內容也有深入研究,但卻相對分散,而且較少使用“數字檔案館”這樣的概念。本文將主要以美國和英國的情況為例,對國外數字檔案館建設進行簡單的介紹。
一、基于信息共享的數字檔案館
此類項目主要是由圖書館等機構發起而由檔案館參與的項目,其中較為典型的有伊利諾斯數字檔案館。該“數字檔案館”主要是由該州的圖書館和行政部門聯合建設和維護,參加者有15個機構,除了伊利諾斯州檔案館之外,還包括兩所學校,一個歷史研究會和一個博物館。其項目的主要目的是在網上為用戶提供有關該州歷史和現狀的信息,同時為項目參加機構向伊利諾斯數字檔案館上傳數據提供工具。
這樣的合作項目還有美國的西北數字檔案館(northwest digital archives),該數據庫于2002年初由13個機構共同建立。該項目得到美國國家人文基金批準,資助金額為兩年35萬美元。參加該項目的13個機構除了高校和歷史協會之外,還包括華盛頓州檔案館、西雅圖市檔案館。該數據庫最終將安裝在華盛頓州立大學,為各類研究人員提供在線的信息檢索和服務。
因為在歐美國家數字圖書館的建設中包括檔案資源,因此這種由圖書館、檔案館參加的基于信息共享的數字檔案館非常普遍。其核心部分主要是數據庫和網站建設。數字檔案館建設的過程中除了遇到數字化技術、數據壓縮、數據組織、信息檢索等技術問題之外,還會遇到數字化權、著作權、隱私權等法律難題。
由于該類型的項目主建方不是檔案機構,也就無形中降低了從專業角度對它進行分析的價值。從目前掌握的材料,似乎還沒有由若干檔案館聯合建立的基于信息共享的數字檔案館。
二、基于本館信息化的數字檔案館
這種類型的數字檔案館,根據其現階段信息化側重的不同,可分為重視服務數字的項目和強調各項業務活動信息化的項目。前一種基于數據的積累,后一種則基于各種研究成果的積累。此分類并不是數字檔案館類型的劃分,而只是強調不同數字檔案館項目切入點的區別,因為這兩種思路將會殊途同歸,英國的NDAD(National Digital Archive of Datasets)和美國的電子文件檔案館(BRA)分別是這兩類的代表。
1、基于服務信息化的數字檔案館
20世紀90年代,英國國家檔案館為了履行安全保管和提供利用電子文件的義務,實施了兩項計劃,一項是針對政府機構產生的電子文件的EROS(E1ectronic RecordsOelceSystem);另一項就是NDAD。NDAD是為了保存和利用結構數據集(DATASET)而提供的整套系統和服務,由倫敦大學計算機中心和倫敦大學圖書館建設和維護。NDAD的主要功能包括,接受、存儲、保管政府部門產生的需要永久保存的數據集(比如每年的農業人口普查、犯罪統計、污染土地面積的報告等),并且提供利用。1998年3月,NDAD作為一項服務向社會推薦。公眾可以通過網站訪問某些政府部門的一手數據和背景材料。為了提高服務質量,NDAD還提供了隨時報道數據變化和發展的在線新聞服務。
NDAD項目主要側重于數字館藏的信息服務,雖然它也在網站和系統建設的基礎上兼顧了數字檔案的保管問題。但該項目對電子文件真實性、完整性、長期可讀等問題的研究并不深入,而且該項目中的數據種類相對單一(主要是結構化的數據)。這兩個因素都在一定程度上降低了該項目的示范作用。
2、基于整體職能信息化的數字檔案館
其中最具代表性的就是美國國家文件和檔案管理局(NARA)組建的電子文件檔案館(ERA,E1ectronic Record Archives)。與NDAD相比,ERA更側重于電子文件和數字文獻的各項管理技術研究。
20世紀90年代末以來,美國國家檔案和文件管理局發現其收集的電子文件種類日益豐富,除了數據文件、數據庫之外,還有電子郵件、地理空間數據、數字影像等等結構復雜的數據,電子檔案管理的難度和復雜程度今非昔比。此外公眾迫切希望能夠通過在線的方式獲取國家檔案館中保存的電子文件。這些壓力和挑戰促使美國國家檔案和文件管理局決定自2000年起建立一個自動化程度很高的集成系統,在實現數字資源提供利用的同時,管理、維護各種類型電子文件,保證其真實、完整和長期可讀。該項目就是電子文件檔案館。美國國家檔案與文件管理局希望能夠設計一個接收、保管和提供利用的系統,它不只是軟件系統,還包括政策、工作流程、標準和必需的技術等。與NDAD不同,電子文件檔案館立足于解決任何類型的電子文件(而不僅限于結構數據)對特定硬件和軟件的依賴問題,其職責就是不管多長時間,只要社會需要,就能夠提供可讀和有效的電子文件。
為了實現這樣的項目預期,ERA資助了很多研究項目,并與美國國家科學基金會(NSF)進行了深入的合作,其中包括在美國國家圣地亞哥超級計算中心的“檔案和電子文件的持久管理”項目;美國國家歷史出版物和文件委員會在圣地亞哥超級計算中心的項目“依賴于軟件的電子文件的保存和利用”。此外電子文件檔案館還贊助了美國InterPARE5等。這些項目的研究結果將成為美國電子文件檔案館的技術基礎。
美國國家檔案與文件局稱ERA是未來的檔案館,這類檔案館沒有局限在某個地理位置上,數字技術保證人們能夠通過INTERNET在世界各地方獲得檔案信息。但從另一個角度來說,ERA在功能上確實等同于傳統的實體檔案館。從這個角度來看,KRA確實是一個相對徹底和完善的檔案館信息化項目。
2002年8月14日,ERA向供應商們征集電子文件檔案館的各類解決方案。并決定在2003財政年度的第二個季度召開一次業界的會議。③
3、基于物理實體館址的數字檔案館
ERA的設計過程中,專家們已經考慮到場所的問題。但就目前來看,ERA項目目前看來還是屬于一個集成系統的建設,對于新館建筑可能會在項目成熟之后開始籌劃。英國的NDAD也是一個系統,是一個沒有考慮實體建筑的數字檔案館項目。但國際檔案界對電子文件、數字信息保管的研究中開始出現一種新的呼聲—基于新型的現代化建筑的檔案保管策略。這樣的建筑可能會更多地考慮合理的網絡布線,嚴格的保管環境和技術環境等要素。和該理論相呼應,2002年6月18日一個基于物理館址的數字檔案館將在美國華盛頓破土動工。④華盛頓州官員SamReed稱,這是美國國內第一個組建數字檔案館。這個數字檔案館將立足于解決各類電子文件的管理問題,包括電子郵件、網站文件和政府的數據庫文件等。這個投資1430萬美元、占地48000平方英尺的數字檔案館大樓預計15年之內將擁有800TB的信息量,這可能相當于2000億張紙質文件。而且據有關專家的介紹,美國的德克薩斯州今年也開始了同樣的數字檔案館項目,并且這兩個項目將由美國同一家公司完成。
注釋:
①馮惠玲主編,《電子文件管理教程》,北京:中國人民大學出版社,第23頁。
②實體的數字檔案館不是基于館藏數字化,而是基于信息化的全面發展。它包括服務數字化和其他各項業務職能的信息化兩部分。服務數字化主要是包括館藏檔案的數字化及存儲、壓縮、保管和提供利用。而各項業務職能信息化包括:數字文件的保管,數字文獻長期可讀性的維護,電子文件的歸檔、傳輸與管理,電子文件真實性、完整性維護與鑒定等。
③http://www.efs.gov/spg/NARN/NAA/AC/NZ/NA-MA02SEM0009/listing.html
④據IDG(國際數據集團)旗下的計算機世界(COMPUTERWORLD)報道。
(牛角摘自《中國檔案》2003年第3期)
什么是數字檔案館,現在尚無定論。無論是學術研究人員,還是項目建設人員,大都處在摸索和實驗的階段。目前在學術界主要有兩種觀點:一種觀點認為數字檔案館是一種實體概念,是全方位實現信息化的新型檔案館,它包括服務數字化和檔案館其他業務職能的信息化。實現了數字化館藏的存儲、維護、傳輸和提供利用,同時實現了文檔接收、征集、整理、著錄、鑒定、編研、維護、保管、遷移等各項工作的信息化。第二種觀點認為,數字檔案館是一個跨越空間的檔案信息資源的集成,主體是基于網絡的共享數據庫系統,它突破了館與館之間的物理界限,將分散在不同物理位置、不同載體上的信息聯接起來,向用戶提供方便快捷的在線信息服務。①簡單來說,基于本館信息化②的數字檔案館和基于信息共享的數字檔案館將成為數字檔案館的主要形式。而且實踐將說明,這兩種數字檔案館具有很大的互補性,未來應該看到基于“信息化充分發展的檔案館“的信息共享空間。
在國際檔案界,“數字檔案館”(digital archives)概念雖然目前不像“電子文件”那么“火爆”,但卻有逐漸升溫的可能,而且相關的項目也越來越多。美英兩國關于數字檔案館的研究比較集中,而加拿大、澳大利亞、荷蘭等國家雖然對美英兩國數字檔案館中的某些項目內容也有深入研究,但卻相對分散,而且較少使用“數字檔案館”這樣的概念。本文將主要以美國和英國的情況為例,對國外數字檔案館建設進行簡單的介紹。
一、基于信息共享的數字檔案館
此類項目主要是由圖書館等機構發起而由檔案館參與的項目,其中較為典型的有伊利諾斯數字檔案館。該“數字檔案館”主要是由該州的圖書館和行政部門聯合建設和維護,參加者有15個機構,除了伊利諾斯州檔案館之外,還包括兩所學校,一個歷史研究會和一個博物館。其項目的主要目的是在網上為用戶提供有關該州歷史和現狀的信息,同時為項目參加機構向伊利諾斯數字檔案館上傳數據提供工具。
這樣的合作項目還有美國的西北數字檔案館(northwest digital archives),該數據庫于2002年初由13個機構共同建立。該項目得到美國國家人文基金批準,資助金額為兩年35萬美元。參加該項目的13個機構除了高校和歷史協會之外,還包括華盛頓州檔案館、西雅圖市檔案館。該數據庫最終將安裝在華盛頓州立大學,為各類研究人員提供在線的信息檢索和服務。
因為在歐美國家數字圖書館的建設中包括檔案資源,因此這種由圖書館、檔案館參加的基于信息共享的數字檔案館非常普遍。其核心部分主要是數據庫和網站建設。數字檔案館建設的過程中除了遇到數字化技術、數據壓縮、數據組織、信息檢索等技術問題之外,還會遇到數字化權、著作權、隱私權等法律難題。
由于該類型的項目主建方不是檔案機構,也就無形中降低了從專業角度對它進行分析的價值。從目前掌握的材料,似乎還沒有由若干檔案館聯合建立的基于信息共享的數字檔案館。
二、基于本館信息化的數字檔案館
這種類型的數字檔案館,根據其現階段信息化側重的不同,可分為重視服務數字的項目和強調各項業務活動信息化的項目。前一種基于數據的積累,后一種則基于各種研究成果的積累。此分類并不是數字檔案館類型的劃分,而只是強調不同數字檔案館項目切入點的區別,因為這兩種思路將會殊途同歸,英國的NDAD(National Digital Archive of Datasets)和美國的電子文件檔案館(BRA)分別是這兩類的代表。
1、基于服務信息化的數字檔案館
20世紀90年代,英國國家檔案館為了履行安全保管和提供利用電子文件的義務,實施了兩項計劃,一項是針對政府機構產生的電子文件的EROS(E1ectronic RecordsOelceSystem);另一項就是NDAD。NDAD是為了保存和利用結構數據集(DATASET)而提供的整套系統和服務,由倫敦大學計算機中心和倫敦大學圖書館建設和維護。NDAD的主要功能包括,接受、存儲、保管政府部門產生的需要永久保存的數據集(比如每年的農業人口普查、犯罪統計、污染土地面積的報告等),并且提供利用。1998年3月,NDAD作為一項服務向社會推薦。公眾可以通過網站訪問某些政府部門的一手數據和背景材料。為了提高服務質量,NDAD還提供了隨時報道數據變化和發展的在線新聞服務。
NDAD項目主要側重于數字館藏的信息服務,雖然它也在網站和系統建設的基礎上兼顧了數字檔案的保管問題。但該項目對電子文件真實性、完整性、長期可讀等問題的研究并不深入,而且該項目中的數據種類相對單一(主要是結構化的數據)。這兩個因素都在一定程度上降低了該項目的示范作用。
2、基于整體職能信息化的數字檔案館
其中最具代表性的就是美國國家文件和檔案管理局(NARA)組建的電子文件檔案館(ERA,E1ectronic Record Archives)。與NDAD相比,ERA更側重于電子文件和數字文獻的各項管理技術研究。
20世紀90年代末以來,美國國家檔案和文件管理局發現其收集的電子文件種類日益豐富,除了數據文件、數據庫之外,還有電子郵件、地理空間數據、數字影像等等結構復雜的數據,電子檔案管理的難度和復雜程度今非昔比。此外公眾迫切希望能夠通過在線的方式獲取國家檔案館中保存的電子文件。這些壓力和挑戰促使美國國家檔案和文件管理局決定自2000年起建立一個自動化程度很高的集成系統,在實現數字資源提供利用的同時,管理、維護各種類型電子文件,保證其真實、完整和長期可讀。該項目就是電子文件檔案館。美國國家檔案與文件管理局希望能夠設計一個接收、保管和提供利用的系統,它不只是軟件系統,還包括政策、工作流程、標準和必需的技術等。與NDAD不同,電子文件檔案館立足于解決任何類型的電子文件(而不僅限于結構數據)對特定硬件和軟件的依賴問題,其職責就是不管多長時間,只要社會需要,就能夠提供可讀和有效的電子文件。
為了實現這樣的項目預期,ERA資助了很多研究項目,并與美國國家科學基金會(NSF)進行了深入的合作,其中包括在美國國家圣地亞哥超級計算中心的“檔案和電子文件的持久管理”項目;美國國家歷史出版物和文件委員會在圣地亞哥超級計算中心的項目“依賴于軟件的電子文件的保存和利用”。此外電子文件檔案館還贊助了美國InterPARE5等。這些項目的研究結果將成為美國電子文件檔案館的技術基礎。
美國國家檔案與文件局稱ERA是未來的檔案館,這類檔案館沒有局限在某個地理位置上,數字技術保證人們能夠通過INTERNET在世界各地方獲得檔案信息。但從另一個角度來說,ERA在功能上確實等同于傳統的實體檔案館。從這個角度來看,KRA確實是一個相對徹底和完善的檔案館信息化項目。
2002年8月14日,ERA向供應商們征集電子文件檔案館的各類解決方案。并決定在2003財政年度的第二個季度召開一次業界的會議。③
3、基于物理實體館址的數字檔案館
ERA的設計過程中,專家們已經考慮到場所的問題。但就目前來看,ERA項目目前看來還是屬于一個集成系統的建設,對于新館建筑可能會在項目成熟之后開始籌劃。英國的NDAD也是一個系統,是一個沒有考慮實體建筑的數字檔案館項目。但國際檔案界對電子文件、數字信息保管的研究中開始出現一種新的呼聲—基于新型的現代化建筑的檔案保管策略。這樣的建筑可能會更多地考慮合理的網絡布線,嚴格的保管環境和技術環境等要素。和該理論相呼應,2002年6月18日一個基于物理館址的數字檔案館將在美國華盛頓破土動工。④華盛頓州官員SamReed稱,這是美國國內第一個組建數字檔案館。這個數字檔案館將立足于解決各類電子文件的管理問題,包括電子郵件、網站文件和政府的數據庫文件等。這個投資1430萬美元、占地48000平方英尺的數字檔案館大樓預計15年之內將擁有800TB的信息量,這可能相當于2000億張紙質文件。而且據有關專家的介紹,美國的德克薩斯州今年也開始了同樣的數字檔案館項目,并且這兩個項目將由美國同一家公司完成。
注釋:
①馮惠玲主編,《電子文件管理教程》,北京:中國人民大學出版社,第23頁。
②實體的數字檔案館不是基于館藏數字化,而是基于信息化的全面發展。它包括服務數字化和其他各項業務職能的信息化兩部分。服務數字化主要是包括館藏檔案的數字化及存儲、壓縮、保管和提供利用。而各項業務職能信息化包括:數字文件的保管,數字文獻長期可讀性的維護,電子文件的歸檔、傳輸與管理,電子文件真實性、完整性維護與鑒定等。
③http://www.efs.gov/spg/NARN/NAA/AC/NZ/NA-MA02SEM0009/listing.html
④據IDG(國際數據集團)旗下的計算機世界(COMPUTERWORLD)報道。
(牛角摘自《中國檔案》2003年第3期)