知識網格作為一種軟件基礎設施,已被應用于知識挖掘、知識服務領域,但在數字檔案館的建設中國內還沒有開展這方面的研究,本文嘗試將知識網格引入數字檔案館的建設中,以期引起檔案界同仁對該問題的進一步研究。 檔案信息化是我國信息化建設的重要組成部分,檔案信息化水平對檔案事業的發展有著舉足輕重的作用。國家檔案局制定的《全國檔案信息化實施綱要》要求,把建設數字檔案館列入事業發展規劃,充分運用信息化建設這一新的發展突破口,積極探索數字檔案之路,以發展數字檔案館為目標,創新檔案服務工作機制,由檔案實體的傳統管理向檔案信息現代化管理轉型,以適應信息化社會對檔案的新要求。
目前,我國數字檔案館的建設是建立在信息資源構建理論基礎上的,基本能滿足人們在網絡和Web環境中發現、管理和利用檔案信息的需求。但是這種服務,檢索出來的還是以文件為單元的一條條信息,即使數字檔案館采取個性化定制或集成服務模式,但對于“求知者”所要解決的問題來說,并不能迅速而準確地提供全面、系統、有針對性的知識信息。知識服務已向檔案信息資源構建提出了嚴峻的挑戰,數字檔案館建設需要引入新的理論、技術支持,我們認為知識網格將成為數字檔案館知識創新與服務的大平臺。
一。知識網格
網格是伴隨著互聯網而迅速發展起來的,簡單的講,網格就是把整個互聯網整合成一臺巨大的超級計算機,實現計算資源、存儲資源、數據資源、信息資源、知識資源、專家資源的全面共享。網格的基本特點是資源共享與協同工作。網格的基本理念是,不再關注單個網站和與因特網連接的單個設備,而是讓所有的計算機、相關設備和服務商協同工作, 提供更廣泛和豐富的解決方案, 使人們能夠控制信息并讓它在指定的時間以指定的方式傳送給自己。網格的目標就是要能像電力網供電一樣,使得相兼容的任何設備能在任何時間任何地點插入網格,得到所需要的服務,網格的根本特征并不一定是它的規模,而是資源共享,消除資源孤島。
網格計算技術的初期主要集中在高性能科學計算領域, 提升計算能力, 并不關心資源的語義,故不能有效地管理知識。目前網格已經從計算網格發展成為面向服務的知識網格。
知識網格是一個智能互聯環境, 它能使用戶或虛擬角色有效地獲取、發布、共享和管理知識資源, 并為用戶和其他服務提供所需要的知識服務, 輔助實現知識創新、協同工作、問題解決和決策支持。其目標是創建一種基于因特網的新一代知識服務平臺和軟件基礎設施。在這個平臺上, 知識的處理是分布式、協作和智能化的, 用戶可以通過單一入口訪問所有知識信息, 享受一步到位的服務。它采納下一代互聯網所使用的技術和標準, 下一代互聯網的相關研究成果為知識網格提供了技術和實現平臺。
知識網格具有以下特點:
1.人們能夠通過單一語義入口獲取和管理全球分布的知識,而無須知道知識的具體位置。
2.全球分布的相關知識可以智能地聚合,并通過后臺推理與解釋機制提供按需的知識服務。達到這個目標的方法之一是知識提供者提供元知識。統一的資源管理模型將有助于實現知識服務的動態聚合。
3.人或虛擬角色能在一個單一語義空間映射、重構和抽象的基礎上共享知識和享用推理服務,其中的相互理解沒有任何障礙。知識網格還會使知識共享更加普適。
4.知識網格應能在全球范圍搜索解決問題所需的知識,并確保合適的知識閉包(即最小完備知識集)。為了達到這個目標,我們需要建立新的知識組織模型。
5.在知識網格環境中,知識不是靜態存貯的,它能動態演化而保持常新。這意味著知識網格中的知識服務在使用過程中可以不斷自動演化改進。
知識網格關注的問題:
1.知識獲取與知識表示的理論、模型、方法和機制。在知識網格中獲取知識有兩種方法:一種方法是人們直接通過交流互相獲取知識,或通過接受他人發布的知識資源獲取知識;另一種方法是知識網格通過對諸如數據、文本和圖像等資源進行抽取、挖掘、歸納、演繹、合成來獲取知識。。網格由6 個部分組成, 即網格結點、數據庫、存儲和處理設備、可視化設備、寬帶網和網格軟件。知識網格應該能夠輔助人或虛擬角色有效地獲取和發布知識,并以人機都可理解的方式將其表示出來。
2.知識可視化和創新。主要包括智能化的用戶接口(如:語義瀏覽器或知識瀏覽器),它使人們通過可視化來共享知識。語義鏈網絡和認知圖可以縮短知識表示和知識可視化之間的鴻溝。接口應體現知識網格的個性特征,并能通過類比推理、歸納機制及組織規則來激發知識創新。
3.在動態虛擬組織間進行有效的知識傳播和知識管理。為此中國知識網格研究組提出一種知識流網絡來實現動態虛擬團隊間的知識有效共享。
4.知識的有效組織、評估、提煉和衍生。知識可通過基于語義的范式來組織,以確保有效的檢索和修改操作。知識網格應能刪除冗余知識,并提煉所含的知識來合理擴展有用的知識。
5.知識關聯和集成。知識網格應能關聯和集成不同級別(如概念級、公理級、規則級和方法級)和不同領域的知識資源,以此來支持跨領域的類比推理、問題解決和科學發現。
二、知識網格與數字檔案館
知識網格能夠有效地解決數字檔案館知識資源構建中的三個關鍵問題:
1.實現數字檔案館的知識生成。知識網格具有知識生成特性,這是與現有數字檔案館信息管理平臺之間本質的區別。現有數字檔案館信息管理平臺僅僅實現了檔案信息的有序化,不具有知識生成的功能。而知識網格則能根據用戶的需求自動地對有關信息進行分析、對比、綜合等,形成新的知識。所生成的知識在經過評價過濾后添加到知識庫中,然后再對其進一步求精。經過知識發現和知識求精處理后,相應的信息資源就以知識的形式儲存,對用戶需求的滿足就不再僅僅是信息,還有知識,可以大大節省用戶甄別信息、獲取知識的時間與精力支出。
作為數字檔案館來講,提供信息服務是其基本功能,但在信息量呈幾何級數增長的現實環境中,如何從事實、數據和信息中提取對決策有直接作用的知識是數字檔案館的發展方向,而知識網格為我們實現這一目標提供了物質基礎。知識網格是數據網格和信息網格的集成與拓展,它除了提供計算服務和信息服務外,還使用數據挖掘、智能代理、分布式知識庫等技術將數據和信息轉換成知識,有利于數字檔案館進行知識管理及知識服務。
將知識網格和數字檔案館有機結合起來,可以為有效地實施知識管理提供支持。現有數字檔案館的網絡平臺與豐富的信息資源為知識管理提供了硬件基礎設施與信息源,而知識網格作為一種軟件基礎設施,將由網格提供的存取機制和由數字檔案館提供的功能進行映射,用以管理、處理分布的數字檔案館間的信息流。網格側重于存取服務的執行,數字檔案館側重于結果的管理。知識生產通過網格服務應用進行管理,知識的組織與管理通過數字檔案館的使用來實現,將知識網格和數字檔案館技術整合起來才能對知識進行有效管理,才能實現知識生成和知識組織與管理之間的連續性。
2.建構數字檔案館集成的檢索體系。知識網格把多個數字檔案館整合為一個巨大的超級虛擬計算機,實現各種資源的全面共享。在分布式的異構環境中,知識網格技術能夠以一種全局命名方式,有效地管理數量繁多的名字和屬性以及它們之間的關系,能夠精確定位所需的數據集,并為后續處理提供支持,能夠有效管理數據資源存儲形式等相關信息,實現命名、定位和訪問的透明性。知識網格支持對異構數據資源的訪問,為用戶提供統一的訪問接口,選擇適當的訪問協議來實現用戶提出的數據訪問請求。
3.構建數字檔案館集成的服務體系。在知識網格計算中,靈活的、可擴展的信息服務體系結構能夠保證資源信息提供者的廣泛分布性和信息服務的分布特性,避免由于單個信息服務實體的失敗導致其他資源信息服務不能正常提供服務。知識網格中的所有元數據構成元數據目錄,這種目錄結構系統具有層次和分布式的特性,并且不會破壞現有系統的元數據描述方法,并能與它們很好地交互、融合。全面整合的服務趨勢為數字檔案館服務體系的集成奠定了基礎。數字檔案館可以利用知識網格應用工具層( Grid Application Tool kits) 所提供的工具以及其他層次的接口和服務構建數字檔案館集成服務體系。
縱觀國內外研究成果尚缺少對數字檔案館知識資源構建及服務模式的研究,將知識網格技術運用到的數字檔案館知識管理與服務的研究更是無人問津。目前,已有部分學者對知識網格在數字圖書館的應用展開了研究,并取得了初步進展。數字檔案館與數字圖書館雖有相似之處,但在資源特性、組織模式、服務對象、運行機制等方面存在著本質的不同,因而,對知識網格在數字圖書館與數字檔案館的應用研究是兩個截然不同的領域。
因此如何在數字檔案館已有研究基礎上,借鑒知識網格在數字圖書館領域應用研究的成果,致力于研究以知識網格作為軟件基礎設施,以用戶為中心,構建以知識創新為特征的數字檔案館是檔案界應該研究的課題之一。
參考文獻:
[1] 周淑云. 知識管理的新發展知識網格. 圖書館論壇.2006(2)
[2] 王平. 知識網格技術與圖書館信息資源的組織開發.現代情報.2006(7)
[3] 韓毅. 基于知識網格的區域數字圖書館建設框架.大學圖書館學報. 2003(6)
[4] 李澤鋒.數字檔案館建設與管理.北京:中國檔案出版社,2005
[5] 諸葛海. 利用知識網格實現知識創新.中國信息化. 2004(3)
文章來源: 《檔案學通訊》 作者:劉國華 郝偉斌