美 国 一 级 A 片/午夜免费视频/久久riav/国产人妖 视频专区 - 1024亚洲精品国产

檔案之窗

掃一掃關注

當前位置: 首頁 » 技術 » 檔案信息化 » 檔案數字化 » 正文

當前檔案信息數據庫建設的關鍵問題

放大字體  縮小字體 發布日期:2018-12-24 17:36:55    瀏覽次數:61    評論:0
導讀

明確建設檔案信息數據庫是單純為了檢索的需要,是建立檔案信息管理系統的需要,還是建立文檔一體化管理系統的需要;是為了若干個機構聯合建立目錄中心的需要,還是當前要加入某個聯機檢索數據庫的需要。

當前檔案信息數據庫建設的關鍵問題

(一)明確數據庫建設目的

對于檔案信息數據庫建設,首先必須從技術上明確建設的目的。明確建設檔案信息數據庫是單純為了檢索的需要,是建立檔案信息管理系統的需要,還是建立文檔一體化管理系統的需要;是為了若干個機構聯合建立目錄中心的需要,還是當前要加入某個聯機檢索數據庫的需要。目的不同,相應的數據庫管理系統的選擇、結構的設計、字段項的設計都會有很大差異。

以“軍檔工程”為例。從宏觀上看, “軍檔工程”主要由兩個大的分支網絡系統構成。一個是檔案事業管理信息網絡系統。它主要用于管理除檔案實體信息之外的其他諸類綜合信息,如檔案數量統計信息,檔案部門人員情況信息,檔案科技成果管理信息等等。另一個是檔案信息網絡系統。它主要用于管理全軍檔案目錄、全文、多媒體等實體信息,實現數據共享。這兩大系統結構功能不同,使得系統內部的信息流也分為兩類。一類是檔案事業綜合信息流,另一類是檔案數據信息流。數據信息流又可按不同的方法分為公文檔案信息、科技檔案信息、專門檔案信息等。每一類信息都有各自的特色與結構,數據庫設計的內容各不相同。

再如中國人民解放軍檔案館要建設全軍統一的聯合目錄中心,就必須統一數據庫的字段設置,實現不同數據庫之間數據的轉換。再比如在美國,越來越多的檔案館館藏信息加入到國際聯機檢索系統中。近百個檔案館將許許多多的全宗和收藏加入研究圖書館信息網絡系統(RLIN) 及聯機自動化圖書編目系統(OCLC)。這些系統數據庫是依據圖書館關于著錄種類的假設,所以不能適合所有的檔案目的。

(二)實現館藏檔案目錄數據庫建設

各檔案機構一般都把館藏檔案目錄數據庫的建立作為數據庫建設的第一個目標。對正處在信息化建設發展初級階段的大多數檔案館來說,信息化建設的切入點和工作重心,首先是抓好目錄數據庫的建設。館藏目錄數據庫可以比較全面地反映館藏檔案信息,有助于實現全方位的、動態的、完整的檔案信息服務。如湖南省檔案館要求建立檔案目錄數據庫。重點是案卷級、文件級和專題目錄的輸入。他們制定的目標是:人均每天至少完成200條;11臺計算機半年完成25萬條以上;完成明清、民國、革命歷史檔案三個目錄數據庫的建設和上報工作;完成建國后檔案案卷級目錄的輸入、打印及裝訂;開展文件級或專題目錄的輸入。再如安徽省檔案館繼1999年在省直機關啟動新一輪到期檔案進館工作以來,2000年度再次接收省計委、省人行、省委統戰部、省委講師團、省機械局、省電子局、省建材局等7家單位的100018卷檔案及配套的檢索工具進館,同時上述單位按統一軟件錄入的機讀文件目錄193240條亦同步進館,并入省檔案館文件目錄數據庫。館藏檔案目錄從傳統的紙質載體到數字化信息的轉變,是一種對傳統模式繼承發展的過程,更是一種拓展應用空間和范圍的質的升華和揚棄。由此館藏檔案目錄數據庫的建立成為傳統檔案工作向現代化檔案工作轉型的標志。

在館藏檔案目錄數據庫建立的基礎上,可以考慮建立檔案目錄中心。國家檔案局已建立全國明清檔案目錄中心、全國民國檔案目錄中心、革命歷史檔案資料目錄中心。中國人民解放軍檔案館要建設成為全軍統一的聯合目錄中心。各地方檔案機構可以加快建立本地區的檔案目錄中心,實現一定范圍內檔案館館藏內容互補和檔案信息資源整合,更大限度地發揮檔案效益。

(三)建立特色檔案信息數據庫

在網絡環境下,重復的信息沒有任何意義。在檔案信息數據庫建設過程中,要避免信息的重復建設。各類檔案館及其各級管理機構,有著各自的任務與特色。各個層次、各種類型的檔案機構只有形成各有特色、互不雷同的檔案信息數據庫,網絡才能真正成為檔案信息資源的寶庫。

1998年國家據 檔案局統計,省級以上檔案館館藏中包括許多具有地方特色、民族特色的檔案。如:甘肅的敦煌遺書檔案、秦漢簡牘檔案,云南的多種民族檔案,貴州的紅軍轉戰貴州檔案,重慶的“陪都檔案”,四川的巴縣清代檔案,青海的唐前期“謹封”銅印,明代誥命和金書鐵券檔案,西藏的元、明、清檔案,寧夏的西夏檔案等。其中四川省檔案館就在網絡中發布了巴縣清代檔案。這些獨具特色的檔案是中華民族寶貴的歷史文化遺產,具有無窮的魅力。

檔案部門還可以通過網絡,針對某一專題提供廣度和深度上的服務,建立專題檔案信息數據庫,擴大利用者對檔案信息的占有程度,提高服務質量。例如就當前中國西部大開發、文化遺產保護、城市環保、大氣污染、北方的沙塵暴等一些熱點問題,建立專題檔案信息數據庫,將檔案信息經過合成、整序、轉換成專題檔案信息資源,為利用者提供定向專題檔案信息服務。這樣既提高檔案信息的價值含量,又能為社會提供檔案信息的增值服務,深化數據庫建設深度。筆者曾在網絡中訪問到一個名為“拉薩檔案”的數據庫①,它是由西藏文化發展公益基金會(THF)提供的。這是一個民間的、非贏利性的國際組織,主要從事西藏文化遺產,尤其是西藏傳統建筑的保護工作。其檔案數據庫包含有多種照片、測量圖及建筑平面圖。為推廣和進一步研究西藏建筑藝術及保護拉薩城的寶貴遺產奠定了資源基礎。其未來發展計劃還將提供更多可供在線查詢的照片和建筑平面圖。這樣一個檔案數據庫,為相關的專業人士和對西藏文化感興趣的非專業人士提供了豐富而生動的信息。各個檔案館幾乎都擁有自己的特色館藏,如果能將這些館藏信息建成一個或多個頗具特色和規模的數據庫,為利用者提供高效的信息服務,將是我國網絡檔案信息資源建設的特色所在。

(四)豐富檔案信息數據庫內容種類

國際上通常根據數據庫內容將數據庫劃分為三大類:參考數據庫、源數據庫、混合數據庫。參考數據庫是指各種檔案目錄數據庫、內容摘要數據庫等以二次檔案信息為內容的數據庫。其作用在于指引利用者找到相應的檔案信息源,也就是原始形態的檔案文件,包括傳統載體的檔案原件及電子文件,從而滿足其檢索要求。源數據庫包括數值數據庫、圖像數據庫、術語數據庫、文本數據庫、全文數據庫等形式。這些形式的共同特點是庫中的數據都是一次檔案信息,直接提供利用者要求獲取的數值、文本或事實。利用者可直接從中利用自己所需要的檔案信息,如查看檔案全文,檢索檔案原文中的任何字句?;旌蠑祿焓侵笖祿熘械膬热莶捎枚喾N表現形式。檔案信息有文本型、數值型、圖片型、聲音型、影像型等各種形式,混合數據庫就是將文本、數值、圖形、音像等形式結合在一起的多媒體數據庫。這種數據庫的內容不僅是靜態的文本、數字或表格,還可聞其聲、見其形。這類數據庫是多媒體技術發展的產物。

由于還處于信息化建設發展初級階段,我國的檔案信息數據庫絕大部分是參考數據庫,即目錄數據庫等。源數據庫如全文數據庫、圖形圖像數據庫數量較少,混合數據庫更少。誠然,參考數據庫也能為利用者提供必要的服務,但僅僅依靠二次檔案信息是無法滿足利用需求的,因此要加強源數據庫建設,大力開發檔案文獻全文數據庫。目前在檔案全文信息的開發利用受諸多因素限制的情況下,可以對檔案深加工后的各種信息建立編研成果數據庫。另外還要注重開發多媒體數據庫等混合數據庫。

(五)遵循數據庫建設的標準與規范

標準化是高質量數據庫建設的重要組成部分。遵循標準化建設的數據庫系統成為開放系統(OpenSystem),不僅在軟件和硬件上可以兼容,更使數據的共享成為可能,極大地方便用戶使用。標準化已成為高水平數據庫的標志之一,并與其效益直接聯系起來。在檔案信息數據庫建設中的標準化,主要是指檔案信息前處理過程中進行數據標引、加工的標準化,如制定《文書檔案目錄數據庫結構與著錄格式》等。

在標準的實施上要注意與國際接軌。現在各國新開發的數據庫,都比較注意采用國際通用標準。而我國數據庫建設尚未實行統一的標準,更沒有注意與國際標準的接軌,這在一定程度上限制了國內和國際間的數據共享,影響了效率和效益。

(六)注重數據庫的內容質量

我國與國外一些技術較為先進的國家相比,網絡檔案信息數據庫無論在深度還是廣度上都存在一定的差距。

廣度方面主要是指數據庫在檔案工作中的應用范圍和數據收錄范圍。我國數據庫在檔案工作中的應用起步較晚,應用范圍還不是很廣泛。真正網絡意義上的建庫大概始于1998年左右。由此造成了數據收錄范圍還不廣泛。數據收錄范圍是評價數據庫質量的首要指標,關系到數據庫是否能全面滿足利用者的檢索要求,是取信于利用者的基本前提。在數據庫廣度方面的建設質量取決于長時間的積累,而我國基本數據的積累目前可以說還在從零開始?;緮祿臏蕚涫菙祿旖ㄔO也是信息化建設最基礎的工作,而做基礎工作是沒有捷徑可走的。網絡檔案信息服務要想走得遠、走得好,必須打好數據庫的基礎。

深度方面主要是指著錄標引的深度、數據的準確性、數據庫更新的及時性等。著錄標引的深度是指對檔案信息特征揭示的充分程度。著錄標引越充分,就越有助于利用者判斷檔案的價值及其切題程度,從而幫助他們迅速準確地找到自己所需要的檔案。數據的準確性主要是指數據庫中收錄的數據是否準確可靠,這是保證檔案檢索系統檢索效率的重要因素。數據不準確,可能會導致利用者對數據庫的徹底否定。另外數據庫更新要及時,數據庫更新的時差越短,其價值就越大,這對于現實效用較強的科技檔案尤為重要。

我國與國外檔案信息數據庫存在差距的主要原因是以往我國社會總體意義上的數據庫建設起步較晚、經驗不足、缺課太多,直到今天還缺乏相對成熟具有競爭力的數據庫。我國網絡中檔案信息數據庫很少,數據庫中的信息量很少,而每一條記錄所含的著錄信息更少(除了檔號、題名、年代之外,其他著錄項很少著錄)。因此,必須注意加強數據庫的內容質量。在當前大力開展數據庫建設的時期,必須扎扎實實,從頭做起,避免追求速度的“短平快”建設,保證數據庫建設質量。這其中一定要把握住的信念就是質量勝于數量,深度勝于廣度。在網絡環境中,每件事情都成了“信息”,而信息數量的增長并不一定等于信息質量的提高。在網絡中擴展信息的數量和廣度較為容易,加強信息的深度就必須加強專業建設。信息的廣度可以疊加,深度則必須通過專業研究來實現。因此,對于網絡數據庫建設做廣容易做深難。建設網絡檔案信息資源,必須在專業上下功夫,對信息的深度進行開發。

(七)重視檢索技術

隨著數據庫應用的變化,對數據庫的使用要求也在發生變化。以前,信息系統的主要問題是如何把數據更好地存入數據庫,而現在,尋求一種更好的方法,將數據從數據庫中提取出來成了主要問題。檢索技術成為數據庫技術中一項至關重要的技術。檔案信息數據庫要上網發布擴大使用范圍,必須重視檢索技術,配備相應的高效的檢索系統。


 
(文/小編)
免責聲明
本文為小編原創作品,作者: 小編。歡迎轉載,轉載請注明原文出處:http://www.szsunz.com/tech/201812/4911.html 。本文僅代表作者個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,作者需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們kf@dawindow.com。
 

Copyright ? 2018 檔案之窗(dawindow.com) ??? 深圳司捷科技有限公司? ? 版權所有       粵ICP備18047471號-1