為按期完成國家重點檔案搶救任務,加快推進數字檔案館建設步伐,江西省檔案館于2007年啟動省檔案館館藏紙質檔案數字化工作,圍繞如何解決數字化服務外包過程中的檔案實體與檔案信息安全、質量控制,以及如何提升紙質檔案數字副本憑證性問題,不斷學習、研究、總結,形成了一整套可行的紙質檔案數字化全程管理工作方法與措施。
一、實施紙質檔案數字化全程管理的必要性
1.實施全程管理是維護檔案實體與檔案信息安全的重要屏障
在紙質檔案數字化外包過程中如何保障檔案實體和檔案信息的安全,已成為開展紙質檔案數字化外包工作中急需解決的問題。在維護檔案實體和檔案信息安全實踐中,檔案實體和檔案信息在數字化各環節中流轉,都離不開人這個關鍵因素,而把具有主觀能動性的人與具有客觀性的流程設計管理制度、監控設備有機結合起來的有效手段,就是全程管理。只有進行全程管理,實現兩方面優勢互補,才能最大限度地保障檔案實體和檔案信息安全。
2.實施全程管理是質量控制的必然要求
質量控制如同醫生看病,治標不能忘治本,現實中經常存在“頭疼醫頭、腳疼醫腳”的“重結果輕過程”的質量管理誤區。對紙質檔案數字化實施全程管理,就是為了徹底走出“事后控制”的誤區,由單一的事后質量檢驗把關控制轉變為“預防式”的事前控制、事中控制和事后數據質檢相結合的綜合管控策略,實現質量問題的處理“由堵向疏”的轉變,進一步提高數據質量,提高各環節工作效率。
3.實施全程管理將為今后認定紙質檔案數字副本憑證性奠定基礎
通過數字化轉換制作紙質檔案數字副本,是當前和今后一個時期實施重要檔案異質異地備份,加快數字檔案資源建設與網絡化共享的主要途徑。以數字副本作為紙質檔案的異質備份件,在網絡化查檔利用工作中代替檔案原件出證,這都要求紙質檔案數字副本應具備憑證功能,這也是今后必須解決的問題。鑒于當前我國認定數字副本法律地位的法規和標準尚未出臺,而紙質檔案數字化以及數字副本的長期保存是一個浩大的系統工程,在經費、人力、物力等方面的投入可謂巨大,屬于稀缺資源的檔案原件在數字化過程要經過一場浩蕩的拆裝過程,若以這樣的代價制作形成并長期保存的數字副本僅具有查考價值,那么紙質檔案數字化的工作績效將被大打折扣。基于這樣的認識,參照《縮微攝影技術縮微品法律認可性》等標準,省檔案局館認為只有通過全程管理,從保障紙質檔案數字副本真實性、完整性、可靠性和可用性入手,規范數字副本的制作過程,盡力保存數字副本的背景和結構信息才能為將來認定它的憑證性奠定基礎、創造條件。
二、紙質檔案數字化全程管理實踐的主要做法
省檔案館將紙質檔案數字化全程分為10個基本環節,包括審批數字化對象、制定數字化工作方案、檔案出庫、整理分件、建元數據庫、檔案掃描、圖像處理、數據質檢、檔案還原入庫、數字化成果驗收移交等,同時,針對數字化基本環節建立數字化工作文檔管理制度。下面重點介紹下省檔案館在幾個關鍵環節的主要做法。
1.數字化對象的審批。為證明民國檔案數字副本來源的可靠性,參照檔案原件縮微品規范制作要求,對數字化對象實行審批制,由法人簽署《紙質檔案原件數字化審批書》,并將其納入全宗卷和數字化工作文檔管理范疇。審批書主要內容包括數字化對象、數字化目的、授權信息、審批時間等。
2.制定數字化工作方案。省檔案館把數字化工作方案視為有效管理數字化全程、控制數字化成果質量的重要武器,因此,它既是數字化服務外包招標文件的主要內容,也是項目實施全過程的操作和管理標準,應盡量具體、量化并具可操作性。省檔案局館編制的紙質檔案數字化工作方案主要包括數字化現場安全保密措施、項目管理要求、檔案整理與修復要求、技術標準、數字化工作文檔管理要求、數據質檢與驗收要求、數字化成果移交要求等主要內容。每個方面都有詳細的要求,比如,技術標準部分又進一步明確了數字圖像技術參數、圖像處理、格式與存儲、命名標準、著錄與目錄數據庫建庫、數字化元數據賦值等要求。
3.整理分件。整理分件是整個數字化過程的重要環節,直接關系到檔案實體安全和數字副本的命名、存儲與質量控制,抓好該環節,整個數字化工作將事半功倍。省檔案局館的主要做法:一是加強對數字化服務外包商員工的集中培訓,他們對民國時期公文、組織職能等方面的認知水平將決定整理分件的準確性,培訓內容包括民國公文種類、公文處理辦法、民國時期文化背景知識、政府機構的衍變、電報在公文中的應用等;二是每個案卷填寫一張數字化流程單,并跟隨案卷在數字化各個環節流轉,需要填寫案卷的總頁數、頁號編制、修裱、分件情況,登記珍貴和特殊檔案頁面;三是實行流水線上整理分件環節的在線指導,發現問題及時指正,提高整理分件的準確率,從而提高整個項目的工作效率。
4.建文件級元數據庫。省檔案局館將檔案目錄數據與數字化元數據的集合稱為元數據庫。自2009年起,省檔案局館要求數字化服務外包公司在數字化過程中由數字化系統自動捕獲或手動批量著錄數字化授權、時間、分辨率、格式、捕獲設備等20個有關數字副本背景和結構的元數據。這一做法在后來發布的《信息與文獻——文件檔案數字化實施指南》中得到印證。同時,在準確分件的基礎上按照《檔案著錄規則》《民國檔案目錄中心數據采集標準民國檔案著錄細則》《江西省文書類電子檔案著錄與數據格式規范》等標準規范進行著錄與目錄數據錄入,建立案卷級、文件級目錄數據庫。鑒于經費、人力和時間等方面的限制,著眼為今后各項業務工作建立基礎數據庫,省檔案局館采取了民國檔案文件級著錄分步實施、逐漸完善的策略,即在數字化過程中做到卷內檔案分件基本準確,建立文件級目錄數據庫時照錄檔案原有事由,無事由時才重擬題名,為今后著錄職能部門依托數字檔案集成管理系統進一步開展著錄工作奠定基礎。實踐證明這是一項有效的舉措。
5.圖像處理。按照精確復制的原則并參照《紙質檔案數字化技術規范》的要求實施圖像處理,使數字圖像清晰、端正,準確反映檔案原件的原始面貌,不去除檔案頁面原有的紙張褪變斑點、水漬、污點、裝訂孔等;在距頁邊最外沿約2毫米處裁剪數字圖像,保留紙質檔案原有頁邊,包括破損、歪斜頁邊。
6.數據質檢。包括數字圖像質檢與目錄數據質檢兩個部分。按批次數據隨機抽檢方式進行質檢,質檢次數一般為兩次。一次質檢抽檢率不少于20%,二次質檢抽檢查率不少于10%,批次抽檢合格率應為100%,否則整批數據打回重新制作或不予驗收,同時據實填寫質檢任務安排單、質檢情況登記表、質檢驗收登記表等數字化工作文檔,作為數字化成果驗收移交的依據。
7.數字化成果驗收移交。移交的內容包括符合標準化要求的紙質檔案數字副本及其元數據庫、數字化工作文檔以及按照規范要求制作的存儲移交介質。其中,紙質檔案原件數字化審批書、數字化工作方案、數字化項目招投標文件、中標通知書、數字化項目合同書等憑證性文件的數字副本一同存儲于移交介質的授權文件夾中。
三、幾點思考
紙質檔案數字化是高速發展的信息時代給檔案工作帶來的一項新內容,在推進過程中不可避免會遇到一些新情況、新問題。
1.如何更加科學確定數字化范圍,除了考慮檔案重要程度、破損情況、利用需求等,是否還要結合數字化工作進度、工作量以及數字化績效等實際情況綜合考慮。
2.數據質檢與準確率問題。面對數以百萬級甚至千萬級的目錄和圖像數據,即使實施全程管理、盡最大努力提高抽檢比例,也難免會掛一漏萬。在合理安排年度工作量的前提下,如何提高數據準確率,需要進一步摸索、研究和總結推廣。
3.數字副本的法律地位問題。目前,我國尚未啟動有關數字副本法律認可性的法規標準的制定工作,現有標準均沒有明確的相關條款,通過實踐證明《信息與文獻——文件檔案數字化實施指南》以及澳大利亞等國的先進標準具有科學性、合理性和可操作性,因此,應該參照這些標準并結合我國的具體實踐著手制定有關標準,用于規范數字副本制作的全程管理與技術要求。總結省檔案局館在這方面的做法主要包括以下幾個方面:
(1)實施數字化對象審批制,用以記錄數字化項目授權信息,證明數字副本來源的合規性;
(2)建立并歸檔保存規范的數字化工作文檔,記錄、審核數字化項目全過程管理信息;
(3)完整掃描關于同一項業務活動的往來文件,以及一份文件的正本、定稿、公文處理單、重要修改稿等,確保數字化對象及其來源信息的完整性;
(4)精確復制、準確標識,以文件級檔號及件內頁面流水號命名數字副本,以彩色JPEG格式存儲源版數字副本,完整記錄檔案原件頁面原有內容,包括斑點、破損頁邊等頁面信息;
(5)通過數字化元數據記錄紙質檔案數字副本的技術參數與生成背景;
(6)通過先期制定數字化工作方案,結合現場監管、按比例抽檢、分階段驗收等方式,實施數字化成果的質量控制。
原載于《中國檔案報》2013年11月14日 總第2533期 第一版