檔案信息發布方式
迄今為止,國內檔案界在考慮網絡檔案信息發布問題時,一直站在技術的門外。所關注的范圍僅停留在信息內容上,還未曾對發布方式、發布語言等問題給予適當的關注,因為這當中要涉及一部分技術問題。從古至今,我國的檔案工作一直隸屬于社會科學領域,一向埋頭于故紙堆中與歷史打交道的檔案實際工作人員,似乎對技術總有一些畏難情緒。事實上,選擇什么樣的方式發布檔案信息,針對不同的方式選擇什么樣的標準等問題,都會對網絡檔案信息發布的效率與效益產生重大影響。它對于檔案工作是事半功倍,還是事倍功半起關鍵作用。所以檔案工作人員必須緊跟現代技術,了解技術的功用及其對檔案工作效率的影響。如上一節所述,檔案工作人員對技術要理解,而不是要求過分精通。不是要求檔案工作人員要變成一個技術人員去具體掌握各種技術的細節,而是檔案工作人員要理解什么樣的技術對檔案工作能產生什么樣的影響、哪些新技術可以為我所用,以提高工作效率和服務效益。
本節主要研究檔案信息發布方式,從中可以體會到檔案機構應該如何理解和處理技術問題。
從前面的論述中可見,為了實現檔案信息管理、方便利用者利用、宣傳檔案功能,可在網絡上發布的檔案信息內容極為豐富。根據信息內容的不同,可以選擇不同的發布方式。
目前網絡信息發布方式主要有兩種:一是以靜態頁面形式發布,簡稱頁面發布;二是以動態數據庫查詢方式發布,簡稱數據庫發布。
頁面發布是指以計算機文件的方式來管理各類信息,并將這些文件基于置標語言(如SGML、HTML、XML)組織成許多的靜態網頁,然后將這些網頁復制到中心服務器上。早期的信息發布都是靜態頁面發布,其中包含一些動畫和圖片。這種發布方式,對于網絡用戶來說,只是被動瀏覽,缺乏與信息發布端的交互。另一方面,對于信息發布方來說,維護靜態頁面費時費力。
隨著網絡速度的提高及聲音、影像等多媒體信息在網絡上的傳輸,網絡使用的范圍日趨廣泛。一方面,數量巨大、結構復雜的網絡信息再也不能忍受文件系統的管理模式,而且網絡信息總處于不斷的動態變化之中,僅有靜態頁面形式已不能滿足發布信息的需求。因此,人們引入數據庫技術,以動態數據庫形式發布信息;另一方面,傳統的數據庫管理系統也需要引入網絡技術,以方便信息在網絡上的訪問和發布。由此,產生了數據庫與Web的集成,形成了數據庫發布方式。這種方式是通過網絡服務器擴展程序(如CGL、ASP)將Web技術系統與數據庫系統連接起來。在Web上連接、訪問或獲取數據庫信息。而數據庫中的信息是由集成的內部管理系統提供,也就是說內部管理系統(如檔案信息管理系統)的數據庫中的內容是信息發布的數據源。信息發布方通過Web服務器接收用戶的輸入,實時執行用戶的提問,并返回執行后的結果,實現數據庫信息的動態發布。這樣給用戶提供一個可供交互的平臺,以滿足用戶對信息的動態需求。用戶可以通過交互方式找到需要的信息。這一方面減少了用戶利用網絡信息的盲目性,另一方面提高了網絡的有效利用率,不僅把Web與數據庫的所有優點集中在一起,而且充分利用了大量已有的數據庫信息資源。這對網絡信息發布者和維護人員來說也非常有意義。他們再也不必維護大量需手工修改的靜態網頁,取而代之的是發布可以根據用戶的特殊需要從數據庫提取不同數據生成相應內容的動態網頁。利用數據庫系統可以對各種復雜的信息進行有效的管理。數據庫由專業人士進行組織和管理,數據質量、可靠性、安全性都比較高。數據庫中的信息按照網絡遠程用戶的特定訪問請求實時產生動態的訪問結果,更具交互性、動態性、實時性和靈活性。
所以,今天的網絡是由靜態和動態的網頁文件、各種多媒體文件、數據庫、網絡服務器擴展程序等構成的混合體。在其中發布信息必須選擇適當的發布方式。
對于檔案信息來說,主要是根據信息的結構化或非結構化特點進行選擇。如檔案機構職能信息、檔案利用服務信息、檔案工作信息等都是單向性、分散性的信息,可以采用靜態頁面形式發布。而檔案內容信息、檔案背景信息等數量大且具有結構性、動態性、實時性的信息,更適合以數據庫形式發布。
必須明確的是,對發布方式的選擇沒有絕對的標準,而是取決于技術的發展和考慮問題的角度。對于一個檔案館來說,其中著重要考慮的是如何選擇適當的方式發布館藏信息。在我國的檔案網站建設中,關于館藏目錄信息等,無一例外是選擇數據庫方式進行發布。但對于一部分檔案館來說,對于館藏信息的發布,也許采用靜態頁面形式加EAD標準(參見第四節)的方式更具有積極意義,更有利于檔案信息服務社會化。
例如,美國馬里蘭州檔案館對結構化的館藏信息就采用靜態頁面形式發布。該館發布的館藏檔案信息首先進行數字化處理,然后存儲。這些信息不是存儲在數據庫中,而是以txt格式、tif格式和html格式三種文件格式存放在樹狀計算機文件目錄下。這樣發布館藏檔案信息,頁面文件數量十分龐大,不利于管理。他們為什么選擇這種發布方式呢?回答是這樣的:利用者在不了解本館職能作用、館藏內容及網站網址的情況下不會訪問本館網站。采用頁面發布方法可以針對html格式存儲的網頁文件內容做索引(如果采用EAD標準,那么可以直接將檔案內容信息做成全文檢索信息),并直接利用搜索引擎等公共網絡信息發現工具對館藏檔案內容做檢索。該館一向直接利用Infoseek、Google等搜索引擎作為本館館館藏信息的主要檢索工具,而無須再自行編制計算機檢索系統。利用者一旦使用這些搜索引擎,就可以直接通過各種與館藏檔案相關的內容鏈接到本館的網站。筆者曾有機會與馬里蘭州檔案館網頁制作小組交流過。當時在討論這個問題時他們舉了個例子:在HotBot搜索引擎中通過姓名查找該州州長夫人的資料。查找結果中注有資料源于馬里蘭州檔案館,并可以馬上鏈接到本館的網站。這樣引導利用者開辟了一片新天地,他們繼而可以查看其他館藏檔案信息。上網的館藏檔案內容范圍有多廣,鏈入的機會就有多大。從理論上說可以無限大地擴大潛在的用戶群。如果用數據庫管理這些館藏檔案內容信息,對利用者來說,就無法產生這樣的機會。他們考慮問題的角度,是把利用放在第一位。
檔案機構在選擇發布方式時,還要注意技術的更新。
如網頁發布方式,傳統的做法往往是用網頁編輯軟件編制完后,用FTP類的工具上傳更新。如果時常發布和更新信息,這種做法就顯得極為煩瑣、低效,而且需要有相關的掌握網頁編輯軟件的工作人員。此時可以選擇一些公司開發的信息自動發布系統來完成相應的工作。這些自動發布系統采用傻瓜式的界面,直接在Web界面上錄入文字,自動生成網頁文件,操作簡單、時效性高。
再如數據庫發布,體系結構的選擇從客戶/服務器(Client/Server)方式發展到瀏覽器服務器(Browser/Server)方式。以解放軍檔案館的《軍隊檔案館文獻信息網絡管理系統》為例。該系統開發后已經進行了兩次改動較大的版本升級。但是隨著信息技術的發展,系統最初采用的客戶/服務器方式還是受到了挑戰,其技術日趨落后,弊端日漸明顯。一是對于系統用戶來說,客戶端必須安裝操作系統、網絡軟件、特定的中間件(Oracle的客戶端)等應用系統才能確保應用軟件系統的正常工作,這些應用系統占用了大量的系統資源。而且客戶端應用系統的安裝、升級和維護往往需要專業人員才能勝任;二是對于系統開發方來說,由于計算機技術的飛速發展和用戶需求變化,硬件、網絡操作系統、數據庫系統、開發工具、應用系統的升級周期越來越短,維護和升級客戶/服務器系統的費用和代價變得越來越高昂。此時基于新的Web體系結構的瀏覽器/服務器方式的優越性日趨顯著。因此,解放軍檔案館再度對《軍隊檔案館文獻信息網絡管理系統》進行升級,將其移植為瀏覽器/服務器模式。新的模式可以做到真正的“瘦”客戶端應用,客戶端除安裝基本的操作系統和瀏覽器以外無須安裝任何其他軟件。同時對于應用系統的維護,新的模式可以做到“零”客戶管理,只要硬件和網絡帶寬允許,在世界范圍,客戶端建立在任何平臺上,都可以訪問數據庫中的數據,而無須維護客戶端的應用。系統升級后降低了維護成本,能夠在網絡上平滑高效地運行,更易于管理,更利于檔案信息管理的網絡化。
由以上分析可見,技術是一把雙刃劍。對技術的無知會導致管理的落后。然而只要理解技術并運用得當,就會對檔案信息網絡化建設起到積極的促進作用。