聯機檔案信息檢索系統
聯機檢索技術從20 世紀70 年代開始得到迅速發展, 目前世界上已有不少具有國際規模的聯機檢索系統。聯機檢索相對于脫機檢索而言, 有不少優點, 檢索效率大大提高。
一、聯機檔案檢索系統的特點
(一) 交互式檢索
在此之前的脫機檢索是委托性質的檢索, 由用戶委托專家進行檢索。檢索者須事先將一切可能的檢索途徑考慮周全并編制出周密的檢索策略輸入計算機, 檢出相關文獻。用戶不能立即獲得檢索結果, 須等待成批的或定期的檢索處理。而聯機檢索采用檢索者與系統的會話方式進行。用戶可以通過終端借助于通信線路與系統直接對話, 可隨時修改檢索策略直到獲得滿意的結果為止, 是一種交互式的檢索方式。
(二) 實時檢索
聯機檢索系統中, 計算機將處理時間分配給許多終端, 即所謂“ 分時”。由于計算機運算速度極快, 使用戶產生錯覺, 以為他是唯一用戶, 檢索是以實時方式進行的, 從呼叫系統, 到取得檢索結果, 片刻即可。一個設計優良的系統對一詢問或指令的響應速度快到1~2 秒, 幾乎是即時的。消除了手工檢索和脫機檢索中時間上的延遲現象。
(三) 啟發式檢索
聯機檢索具有啟發和幫助檢索者的功能。系統可幫助檢索者選擇合適的數據庫, 通報數據庫的更新情況, 顯示系統詞表, 幫助檢索者將課題的主題概念轉換為檢索標識, 解釋檢索者不熟悉的作業指令及其使用方法, 回答各種業務詢問, 并讓檢索者瀏覽檢索的初步結果。由于系統的幫助, 檢索者可以邊檢索, 邊詢問, 在得到啟發和幫助的條件下逐步明確自己的檢索策略, 使檢索得以順利進行。
(四) 高檢準率
聯機檢索是“ 對話” 式的, 允許檢索者隨時根據檢索的實際情況修改檢索策略, 擴大、縮小或改變檢索范圍, 避免檢索失誤, 查到自己真正需要的檔案, 檢準率較高。
(五) 對用戶限制較嚴
在脫機檢索系統中, 用戶不能直接操作計算機, 由檢索人員代查檔案, 對用戶沒什么限制。而在聯機檢索系統中, 用戶直接與計算機打交道, 由于系統數據庫中檔案信息并不是無區別地向所有人開放, 其中機密材料的檢索并不是人人都有資格進行的,這樣就有必要采取一定的保密措施。此外, 聯機檢索是要收費的, 為了防止盜用, 系統給其終端用戶一個秘密代號, 即所謂口令字, 每次開始檢索時, 系統要求檢索者輸入這個口令字。以檢驗該檢索者是否為合法用戶, 口令字對上后, 系統才開始檢索服務。口令字除了識別合法用戶外, 也用來控制機密材料的檢索者的范圍與級別。合法用戶中, 有的可檢索整個數據庫, 有的只能檢索其中的一部分。由于檔案材料的特點, 保密問題尤其重要,對用戶的限制十分嚴格。
二、聯機檔案檢索系統的工作過程及其功能
(一) 聯機檢索系統的工作過程
檢索者通過計算機終端, 向系統發出呼叫; 系統響應后對檢索者作保密審查, 識別是否是合法用戶; 審查合格即由用戶向系統輸入檢索提問式; 系統根據檢索要求進行檢索; 最后輸出檢索結果。檢索者獲得結果后檢查結果是否符合要求, 若不符合就修改檢索策略, 重新輸入系統, 直到獲得滿意的結果為止。
(二) 聯機檢索系統的功能
聯機檢索系統除提供一般的布爾檢索、加權檢索、截詞檢索功能外, 還具有一些脫機檢索系統所沒有的功能:
1 . 幫助用戶選擇合適的數據庫
由于系統擁有的數據庫越來越多, 檢索者有時不了解自己該查哪一種數據庫, 這時系統可根據檢索課題將含有該課題檔案的數據庫名單, 按照所含檔案數量的多少次序, 向檢索者顯示, 供其選擇。
2 . 詞表顯示
選定數據庫后, 如果檢索者不熟悉檢索語言, 可要求系統顯示自己需要的那一部分詞表或分類表, 從中選擇合適的檢索詞。
3 . 幫助檢索者回顧檢索過程
如果檢索過程較長, 檢索者可能會忘記檢索已經進行過一些什么階段, 這時系統可應檢索者要求, 把以往關鍵性的一些檢索語句重新顯示一遍, 幫助回顧檢索過程, 有利于檢索者繼續向下檢索。
4 . 保留檢索語句或檢索策略
當某些檢索語句或檢索策略以后還需重復使用時, 系統可為檢索者短期保留這些檢索語句或檢索策略, 需要時根據標識號即可召回, 免去重新輸入的麻煩。
5 . 提供聯機定題服務
當訂購這種服務的用戶把自己的檢索式輸入系統后, 系統將其納入專門的用戶提問檔, 予以長期保留。每當新材料進入系統的數據庫時, 就為檢索者進行查找, 將切合用戶課題要求的新材料提供給用戶。
6 . 支持個人文檔服務
聯機檢索系統允許用戶把自己的機讀文檔輸入并保存在該系統里, 以備自己檢索之用。系統為這種個人文檔保密, 旁人無權存取。
三、聯機檔案檢索系統的選擇
近些年來, 聯機檢索系統的數量日益增加, 這些系統所提供的數據庫各不相同, 收費標準各有區別, 可提供的檢索功能和服務項目也不盡相同, 系統的資源水平、響應速度、可靠性、方便性等更有不小差異。因此, 如何合理地選擇聯機檢索系統就成為一大問題。
一般說來, 選擇聯機檢索系統可考慮以下因素:
(一) 數據庫因素
1 . 數據庫的追溯范圍
并非范圍越大越好, 這要與檢索目標結合起來考慮。如果檢索課題是普查性的, 則須選擇追溯年代較長的數據庫; 如果檢索課題只要求了解最新發展動態, 則不應追求數據庫的完整性, 因為追溯年代越長, 檢索時掃描的范圍越大, 命中的檔案越多, 檢索所需時間就越長, 檢索費用也就越多。
2 . 數據庫的文檔劃分
若在系統中裝成一個單獨的大庫, 對普查式檢索課題有利;若按年代斷開劃分為幾個文檔, 則對只想檢索最新材料的用戶有利。有的數據庫既作為一單獨的完整數據庫存在, 又有按累積期劃分的若干個小文檔, 這種大小文檔并列的方式既便于普查式檢索, 又便于最新信息的檢索, 是最為方便的。
3 . 數據庫的現實性
即數據庫收入的最新資料與其發表的時差有多大, 這與數據庫更新周期的長短有關。更新周期越短, 就越能獲得及時信息。
4 . 數據庫記錄內容的完整性
對同一種數據庫, 各個檢索系統對裝入字段的選擇會有所不同, 裝入字段越多, 其內容就越完整。
5 . 系統對數據庫的獨占性
有的數據庫是由某一檢索系統獨家提供的, 這無疑會增加該系統的吸引力。
6 . 數據庫群的存在情況
對某一學科主題范圍而言, 往往有一批相關數據庫, 稱之為數據庫群, 這種數據庫群是否存在及其完整程度, 是衡量檢索系統數據庫資源整體水平的依據之一。對檢索者來說, 某一領域數據庫群的存在, 擴大了選擇數據庫的余地, 也便于進行跨文檔檢索。
(二) 系統軟件功能因素
1 . 系統的用戶界面
用戶界面包括檢索模式、后處理的選擇、說明提示等。有的聯機檢索系統針對無經驗的檢索新手和有經驗的檢索專家, 分別提供菜單驅動和命令驅動兩種方式, 能夠適應不同水平級別的用戶, 比只有一種方式要好。
2 . 系統的軟件功能
除了一般布爾邏輯檢索外, 是否還具備加權檢索、截詞檢索、限定檢索等功能。系統軟件功能與檢索處理的深度和靈活性有密切關系。
(三) 系統所能提供的服務
是否能提供原文復印件? 能否提供咨詢服務、電子郵政服務? 是否提供系統說明材料, 這些材料是否齊全, 更新是否及時? 是否提供培訓服務? 等等。
(四) 費用因素
收費標準如何? 是否收初始費或預訂費, 有無優惠? 等等。
(五) 檢索者對系統的熟悉程度及其經驗水平
檢索者越是熟悉系統, 就越能取得良好的檢索結果, 這本身就是一種經費的節省。檢索者的素質和經驗是保證檢索質量的重要條件, 應根據自身情況選擇對檢索語言、數據庫、軟件功能、服務項目有較多了解的系統。