信息網(wǎng)絡環(huán)境下的檔案信息檢索
一、信息網(wǎng)絡環(huán)境下檔案信息檢索的特點
信息網(wǎng)絡環(huán)境下的檔案信息檢索與傳統(tǒng)的手工檢索和常規(guī)計算機檢索相比, 在檢索對象、檢索方式、檢索軟件、檢索服務類型、檢索效率等方面都有顯著差異。
(一) 檢索對象
傳統(tǒng)的檔案信息檢索對象只限于本部門、本系統(tǒng)所擁有的特定的信息資源, 而網(wǎng)絡信息檢索對象的范圍則廣泛得多, 所面對的是龐大的網(wǎng)上共享資源, 可檢索分布在網(wǎng)上各類數(shù)據(jù)庫的信息。從信息內(nèi)容來看, 除科技類、社科類知識型信息外, 還包括廣告、文體、影視、游藝等商業(yè)類和娛樂型信息。從信息形式來看, 除文本信息外, 還包括各種多媒體信息。
(二) 檢索方式
常規(guī)計算機檔案信息檢索主要采用人- 機交互的文本檢索方式, 用戶界面單一, 實際檢索前需制訂周密的檢索策略, 編制檢索式, 輸入檢索命令, 然后才能在計算機文檔中進行查詢, 檢索結果一般僅為文獻題錄、文摘、數(shù)值等文本信息, 檢索速度較慢。網(wǎng)絡信息檢索采用超文本、超媒體檢索方式, 具有統(tǒng)一、友好的用戶界面, 不需編制檢索式, 采用自然語言檢索, 實行標題和內(nèi)容的自動搜索, 檢索結果除文本信息外, 還包括音頻信息、視頻信息等非文本信息, 檢索速度快。
(三) 檢索軟件
普通的檔案信息檢索軟件一般為封閉式的獨家使用軟件, 各文檔檢索軟件不能通用, 用戶使用不便。而網(wǎng)絡信息檢索軟件是開放式的公用軟件, 只要是網(wǎng)上用戶, 均可使用各種檢索軟件,共享網(wǎng)上全部信息資源。
(四) 檢索服務
常規(guī)的計算機信息檢索服務方式包括追溯檢索、脫機和聯(lián)機定題服務、復錄、聯(lián)機打印、訂購原文等, 且收費較高, 服務范圍狹窄。而網(wǎng)上各類服務器除了提供一般的聯(lián)機檢索服務外, 還可提供瀏覽檢索、超文本檢索、自動內(nèi)容搜索等多項服務, 這些服務器徹底向用戶開放, 任憑用戶瀏覽、選用, 其中一部分服務項目是免費的, 服務范圍十分廣泛。
(五) 檢索效率
在傳統(tǒng)的計算機檢索中, 用戶租用專門的信息通道, 信息傳輸較為順暢, 但由于一般的計算機檢索系統(tǒng)擁有的數(shù)據(jù)庫數(shù)量有限, 信息來源狹窄, 信息資源共享程度低, 使得檢全率較低。而在信息網(wǎng)絡中, 用戶使用的是公用的信息通道, 由于網(wǎng)上用戶眾多, 傳輸?shù)男畔⒘烤薮?/span>, 信息通道易于堵塞, 對檢索速度有所影響, 但網(wǎng)上信息來源十分廣泛, 用戶可在全球范圍內(nèi)進行信息交流, 檢索相關信息, 共享信息資源, 檢全率自然就高。此外, 網(wǎng)絡信息檢索大多采用自然語言, 不需像傳統(tǒng)的計算機檢索那樣編制檢索式, 對用戶知識水平要求較低, 用戶不必知道所需信息具體存儲在哪個文檔上, 也不必選擇檢索標識, 就可用自己所熟悉的語言直接在計算機終端上查詢所需信息, 避免了將自然語言轉(zhuǎn)換成檢索標識以及構造檢索式時可能出現(xiàn)的種種誤差, 提高了檢準率, 檢索的方便性也大大增加。
由此可見, 隨著信息傳輸速度與網(wǎng)絡功能的進一步提高、網(wǎng)絡用戶的增多, 網(wǎng)絡信息檢索將逐步取代傳統(tǒng)的手工檢索和常規(guī)計算機檢索, 占據(jù)信息檢索的主導地位。
二、網(wǎng)絡信息檢索工具
在信息網(wǎng)絡環(huán)境下, 信息組織與檢索方式有了很大改變, 檢索工具的運行環(huán)境與前迥異, 原有的信息檢索工具已不能適應新的需要, 各種專門用于網(wǎng)絡環(huán)境的檢索工具應運而生。網(wǎng)絡信息檢索工具目前主要有下面幾種:
1 . 交互式檢索工具
提供類似商用聯(lián)機檢索的信息檢索服務, 可分為Gopher 和WWW 兩大類。
(1 ) Gopher
是一種菜單式的檢索工具, 用戶只要在成樹型結構排列的菜單上選擇特定的項目( 可以是目錄名, 也可以是文件名) , 就可直接檢索所需信息, 而不必考慮這些信息的存儲方式和存儲地點, 它是目前最常用的網(wǎng)絡信息檢索工具之一。
(2 ) WWW
是一種基于超文本的交互式瀏覽型檢索工具, 是目前因特網(wǎng)上最先進的信息檢索工具。它覆蓋了約2 000 萬個大小不等的信息源, 可幫助用戶查找各服務器在網(wǎng)上的地址, 通過該地址訪問該服務器提供的信息。對用戶來說, 文件的格式及其存儲方式均是透明的, 這些文件既可來自WWW 服務器, 又可來自F TP、Gopher 或WAIS 服務器。
2 . 名錄式檢索工具
類似字典、電話簿、人名錄的功能, 用于查詢網(wǎng)上用戶信息和網(wǎng)上各種服務及其提供者的信息。例如, 目前在因特網(wǎng)上運行的常用名錄式網(wǎng)絡信息檢索工具就有WH OIS、NETFIND、X. 500 等。
(1 ) WH OIS
提供因特網(wǎng)的用戶信息服務, 一般用來查找因特網(wǎng)上某個用戶的E-mail 地址、郵政地址、電話號碼等, 結構簡單, 使用方便。目前, 一種名為WHOIS + + 的新的目錄服務通信協(xié)議正在制訂中, 將可能建成一個能覆蓋整個因特網(wǎng)的分布式名錄服務系統(tǒng)。
(2 ) NETFIND
可根據(jù)已知的人名及其工作地點的信息查找該人的E-mail地址和電話號碼以及用戶愿意公布的其他信息。
(3 ) X. 500
它是由國際電報電信咨詢委員會( CCIT T ) 制定的名錄服務通信協(xié)議, 目的是向用戶提供分布式的標準化名錄服務, 不僅可以提供有關個人和機構的信息, 還提供有關網(wǎng)絡資源、應用系統(tǒng)、硬件等方面的信息。
3 . 索引式檢索工具
為網(wǎng)上信息資源建立索引, 向用戶提供文件檢索服務, 檢索結果可以是文件的存儲地址, 也可進一步通過檢索工具獲得原文信息。屬于前者的有Archie, 屬于后者的有Veronica、Jughead和WAIS 等。
(1 ) Archie
建立Archie 服務器的機構定期從各個FTP 主機上收集存儲在其中的所有公開文件的目錄, 將這些信息存儲在Ar chie 索引數(shù)據(jù)庫內(nèi)供用戶檢索。因特網(wǎng)上已建立了幾十個Archie 服務器,這些服務器共存儲了分布在全世界約1 200 個主機上的大約210萬個文件的目錄。
(2 ) Veronica
功能與Archie 相仿, 它是與Gopher 配套的檢索工具。Veronica服務器定時與各個Gopher 服務器聯(lián)系, 將所有的菜單復制下來, 存儲在一個數(shù)據(jù)庫里, 用戶隨時可通過Ve ronica 檢索服務程序到這個數(shù)據(jù)庫中去自動搜索相關的Gophe r 服務器的菜單, 大大提高了Gophe r 的檢索速度。
(3 ) Jughead
是與Ve ronica 類似的檢索工具, 不同之處是J ughead 的檢索范圍是事先限定的, 如只檢索某所大學或某一類Gopher 服務器。
(4 ) WAIS
以因特網(wǎng)上的各種文本數(shù)據(jù)庫為檢索對象, 采用自然語言全文檢索方法, 可使用戶在很大范圍內(nèi)快速檢索信息, 并可將文件全文信息顯示在屏幕上供用戶聯(lián)機瀏覽。