檔案數據庫的總體設計
1 檔案數據庫結構設計方法
1.根據檔案信息管理特點進行系統分析
在設計一個有效檔案數據庫時,首先要了解檔案數據庫系統中設計的情況和檔案數據處理過程,即:①有關檔案管理系統的限制和檔案管理目標方面的資料,包括檔案管理的目標,以及處理方式、硬件的選擇和對設計數據庫的影響。②檔案數據庫數據的描述方法及其數據之間的關系,各項數據項的大小和數據量,用于完整性、可靠性和保密性的一些規則。③檔案數據處理的要求,依照數據使用方法對數據量、頻度、使用先后順序和性能等進行的規劃和控制。
2.建立概念模式檔案數據模型
在前階段分析系統需求工作的基礎上,建立一個數據庫的概念模式,即分析檔案系統限制及每個用戶的信息要求和處理要求,清除沖突和數據之間的差異,最后綜合成一個概念描述檔案數據庫,從而理解檔案數據庫系統的各種處理要求和限制。概念性模型是用戶和設計人員之間的橋梁,一方面它是明確地表達用戶要求的一個模型,另一方面又是設計檔案數據庫的基礎。
3.實現檔案數據庫的邏輯設計和物理設計
在確定檔案數據庫的基本要求和處理方法之后,應用數據庫管理系統如Foxpro、Mfoxbase等應用軟件,輸入概念模式的數據庫結構,在具體設計過程中還應充分了解檔案管理中的表格應用,如檔案日常管理中案卷目錄、卷內目錄的打印格式,借閱登記和各類統計報表的管理。在檔案數據庫設計過程中應考慮到系統的完整性、一致性、可恢復性、安全性和可擴充性等問題。還應考慮到對時間、空間、效率、維護代價和各類用戶要求進行權衡,其結果可能產生多個方案,在權衡數據庫管理簡易和用戶使用方便等方面后,再選擇一個較優的方案實施。
2 檔案數據庫的數據準備
檔案數據庫作用的發揮,最重要的問題就是檔案文獻的數據準備,也就是著錄與標引工作。沒有好的機器設備和優秀軟件,就難以達到很好的檢索效果,然而即使有了好的設備和優秀的軟件,而沒有相當數量的規范化的檔案文獻信息輸入計算機,仍然形成不了一個實用的檔案信息資源數據庫系統。許多檔案館室購置了計算機,準備或正在建立檔案數據庫,但是檔案的整理和規范化工作跟不上,工作就很被動。例如,二次文獻的準備工作大都是手工操作,影響了錄入速度和質量,使機器“吃”不飽,出現了所謂的數據加工“瓶頸”問題。因此研究解決檔案數據庫數據的準備方法就成了檔案數據庫建設過程中需要解決的迫切問題。
1.檔案數據庫數據準備的幾個誤區
一是按照《檔案著錄規則》搞標準著錄,原有檢索工具全部廢棄,一切都得從頭來的誤區。由于這種認識的誤導,加之檔案著錄本身要求很高,便產生了畏難情緒,影響了檔案著錄工作的開展。實際上,現行的案卷封面、案卷目錄、全引目錄、專題卡片、人名卡片的著錄項目5-12個不等,有很多項目與《檔案著錄規則》規定的著錄項目相同或大體相同,只要我們對原有檢索工具稍加改造或增補,是完全可以符合《檔案著錄規則》要求的。
二是檔案著錄標引必須一次到位的誤區。很多單位在這種觀念影響下,檔案著錄工作進展十分遲緩。實際上,檔案著錄標引工作較難的只有兩項,這就是標引“分類號”和“主題詞”,各單位完全可以根據實際情況,跳過這兩個難點,待條件成熟或經驗豐富后再補著補標。
三是關于著錄、標引可使檢索準確率、網羅度達到100%的誤區。規范檔案著錄標引工作,與原有著錄標引工作相比,在檢索準確率、網羅度方面,已是質的飛躍,至于要求檢索查全率、查準率達到100%的提法,是不現實的。至于標引到何種深度,檢索準確率、網羅度多少為宜,應根據各檔案館(室)的實際情況而定。
2.檔案數據庫的前期準備工作
要建立檔案數據庫,必須做好前期準備工作,也就是說兵馬未動,糧草先行。檔案數據庫的前期準備工作主要有以下兩點:
加強標準化、規范化建設。檔案工作標準化體現在各項基礎業務建設中。基礎業務建設達不到標準化、規范化的要求,直接影響檔案著錄標引工作,影響檔案數據庫的建立。關系檔案數據庫建立的標準化工作主要有兩項:一是全宗劃分問題。盡管制定了有關規范,但由于多種多樣的原因,很多單位還沒有按規范要求完成全宗調整工作,以至于影響了整個基礎建設的開展。全宗是檔案館管理檔案的基本單位,全宗沒有按標準劃分和管理,全宗不固定,檔案館的其它工作就無從談起。二是檔號問題。檔號存在的主要問題是不按規范要求進行編制,存在重號、漏號現象,特別是目錄號的編制問題較多。檔號不固定,等于檔案的位置不固定,檔案數據庫就無從建立,即使搞了也是廢品。因此,應加強檔案整理工作,搞好檔號編制,固定檔案位置,為檔案著錄工作的開展奠定基礎。
培養一支較高水平的著錄標引專業隊伍。要搞好檔案著錄工作,建立檔案數據庫,關鍵是要大量培養檔案著錄人才,沒有大量的檔案著錄人才,檔案著錄工作是搞不好的,弄不好,還會走彎路,造成人力、物力、時間的極大浪費。
3.檔案數據庫數據準備的方法
除常規的著錄標引方法,即按《檔案著錄規則》要求開展標準著錄之外,檔案數據庫數據準備還有以下幾種方法:
改造原有檢索工具。原有的檢索工具雖不規范,但并不意味著必須廢棄。這些舊式檢索工具也是多年辛勤勞動的成果,為檔案開發利用工作也作出過一定的貢獻,有的仍不失為一種較為實用的檢索工具。假如把舊的檢索工具全部推倒,重新搞標準著錄,將造成很大的浪費。因此,改造利用原來的檢索工具,按照《檔案著錄規則》要求,填平補齊缺少的主要項目,從而基本達到新的著錄要求。
探索和實踐自動標引。檔案主題標引采用人工標引方法,對標引人員要求很高,而標引的速度和質量卻難以保證。解決的出路就是探索和實踐檔案自動標引的方法,它將使檔案主題標引面臨的主要問題得到一定程度的改善。
直接錄入法。即錄入人員或著錄標引人員將檔案文件的有關著錄項目和主題內容直接輸入計算機,而不再摘著錄卡片或著錄標引工作單,好處是省去了一些工作環節,錄入速度大大加快。缺點是對錄入人員或著錄標引人員的要求更高了,即不但要懂微機、會操作,而且要熟悉著錄標引的有關規則,熟練地掌握《中國檔案分類法》和《中國檔案主題詞表》,因而,直接錄入法普及的難度較大。
改革現行的編目方法和格式,實行編目和標準著錄一體化。即在文書立卷后期,編制案卷目錄、卷內文件目錄和全引目錄時,按《檔案著錄規則 要求,將編目和著錄工作溶為一體,同步進行,案卷目錄格式采用《檔案著錄規則》中的書本式案卷級條目著錄格式;卷內文件目錄格式采用《檔案著錄規則》中書本式文件級條目著錄格式,全引目錄則將兩種格式綜合。這樣,不但減少了工作程序,避免了重復勞動,而且為實現機關檔案管理現代化打下了基礎,同時也可減輕檔案館現行檔案著錄工作的壓力。
4.綜合規劃問題
制定細則。制定適合本單位實際情況的《著錄標引細則》。《檔案著錄規則》是進行著錄的依據,帶有總標準的性質。由于各單位實際情況千差萬別,檔案管理標準化和現代化的進度也不一致,因此,制訂一個檔案著錄標引實施細則是十分必要的。細則可對檔案著錄的范圍、對象、著錄項目的選擇、著錄方法的具體要求、某些內容和形式及其特殊檔案的著錄方法以及《檔案著錄規則》中其它未盡事宜做出具體的規定,便于實際操作。
制定規劃。檔案著錄標引工作是一項長期工作,不可能一蹴而就。因此,一定要制定好長期規劃和短期安排。制訂計劃時可以掌握這樣的原則:一個檔案館內不一定所有的全宗都同時進行著錄,一個全宗內不一定所有的案卷都同時著錄;一個案卷內不一定所有的文件都同時著錄。也就是要根據需要和本單位實際情況,分清輕重緩急,先后主次,抓住重點,避免盲目性。
加強檔案著錄工作的組織管理。一要納入領導的議事日程,提高認識,加強對這項工作的引導和研究;二要納入基礎業務建設之中,把它作為一項長期業務建設抓好抓實;三要納入目標管理之中,通過目標管理和定額管理等先進管理方法,推動檔案著錄標引工作健康發展。