美 国 一 级 A 片/午夜免费视频/久久riav/国产人妖 视频专区 - 1024亚洲精品国产

檔案之窗

掃一掃關(guān)注

當(dāng)前位置: 首頁(yè) » 技術(shù) » 檔案論文 » 論文欣賞 » 正文

檔案信息檢索智能化趨勢(shì)

放大字體  縮小字體 發(fā)布日期:2018-11-15 11:50:26    來(lái)源:網(wǎng)絡(luò)    瀏覽次數(shù):503    評(píng)論:0
導(dǎo)讀

摘 要 筆者認(rèn)為在信息社會(huì)和網(wǎng)絡(luò)時(shí)代,信息檢索智能化是不可逆轉(zhuǎn)的發(fā)展趨勢(shì),對(duì)于這方面的研究,檔案學(xué)界目前落后于圖書館學(xué)界。本文從檔案信息檢索智能化是信息社會(huì)和網(wǎng)絡(luò)時(shí)代的必然產(chǎn)物、檔案信息檢索智能化出現(xiàn)的利用環(huán)境分析與科技環(huán)境分析、檔案信息檢

摘  要   筆者認(rèn)為在信息社會(huì)和網(wǎng)絡(luò)時(shí)代,信息檢索智能化是不可逆轉(zhuǎn)的發(fā)展趨勢(shì),對(duì)于這方面的研究,檔案學(xué)界目前落后于圖書館學(xué)界。本文從檔案信息檢索智能化是信息社會(huì)和網(wǎng)絡(luò)時(shí)代的必然產(chǎn)物、檔案信息檢索智能化出現(xiàn)的利用環(huán)境分析與科技環(huán)境分析、檔案信息檢索系統(tǒng)智能化的發(fā)展趨勢(shì)等方面略陳管見(jiàn),意在引起檔案界同仁的關(guān)注。
關(guān)鍵詞   檔案信息  檢索  智能化  環(huán)境   趨勢(shì)

 
隨著網(wǎng)絡(luò)時(shí)代的到來(lái),信息檢索智能化的趨勢(shì)已初見(jiàn)端倪,對(duì)于這方面的研究,圖書館學(xué)界已取得了令人矚目的成果,而檔案學(xué)界似乎尚未熱起來(lái)。筆者就此略陳管見(jiàn),以期拋磚引玉。
一、檔案信息檢索智能化是信息社會(huì)和網(wǎng)絡(luò)時(shí)代的必然產(chǎn)物
檔案信息檢索是人類社會(huì)發(fā)展到一定階段的產(chǎn)物,并隨著人類社會(huì)信息和科技的發(fā)展而不斷發(fā)展。從人類社會(huì)利用檔案信息的歷史發(fā)展過(guò)程來(lái)看,檔案信息檢索大致經(jīng)歷了自然檢索→手工檢索→計(jì)算機(jī)自動(dòng)檢索→計(jì)算機(jī)智能檢索四個(gè)發(fā)展階段。在19世紀(jì)前,因?yàn)闄n案信息數(shù)量和人們需要的檔案信息有限,人們很容易就能獲得所需檔案信息,沒(méi)有產(chǎn)生并且也不可能產(chǎn)生“檔案信息檢索”的意識(shí),所以勿需專門的檢索技術(shù),此時(shí)處于自然檢索階段。人類社會(huì)進(jìn)入20世紀(jì),特別是20世紀(jì)80年代以后,信息與科技均逐漸呈現(xiàn)出加速度發(fā)展趨勢(shì),檔案信息數(shù)量劇增,其內(nèi)容五花八門,存貯方式日益多樣,人們所需檔案信息的數(shù)量、范圍發(fā)生了很大的變化,必須到大量的檔案信息中去尋找,去發(fā)現(xiàn),于是“檔案信息檢索”的概念就產(chǎn)生了。最早出現(xiàn)的是手工檢索,產(chǎn)生了表格式、卡片式、書本式等檢索工具。當(dāng)計(jì)算機(jī)進(jìn)入檔案管理領(lǐng)域以后,出現(xiàn)了機(jī)器自動(dòng)檢索方式,隨著計(jì)算機(jī)智能技術(shù)的發(fā)達(dá)和信息社會(huì)的到來(lái),尤其是圖情信息智能檢索出現(xiàn)后,檔案智能檢索就成為檔案學(xué)界不得不關(guān)注的一個(gè)新課題了。所謂“智能檢索”,就是計(jì)算機(jī)檢索檔案信息時(shí)系統(tǒng)自動(dòng)進(jìn)行分析,挖掘利用者提出該檢索要求的深層次意圖。在網(wǎng)絡(luò)環(huán)境下,傳統(tǒng)檔案信息檢索已不能適應(yīng)檔案信息海量化趨勢(shì),不能方便快捷地滿足利用者需求,于是,智能檢索就成為新的歷史條件下的必然產(chǎn)物了;同時(shí),網(wǎng)絡(luò)技術(shù)、現(xiàn)代檢索技術(shù)等人工智能技術(shù)的不斷成熟,也為檔案信息智能檢索的出現(xiàn)提供了可能性。
二、檔案信息檢索智能化出現(xiàn)的環(huán)境分析
(一)利用環(huán)境分析
1、檔案信息檢索過(guò)程由模糊性向顯示性轉(zhuǎn)變
傳統(tǒng)的檔案信息檢索過(guò)程在很大程度上是模糊查找過(guò)程(即摸索過(guò)程)。在這一過(guò)程中,常會(huì)因?yàn)樵S多偶然因素影響檢索的結(jié)果。為什么呢?只要分析一下利用者對(duì)檔案信息需求的實(shí)際情況,即可明白。利用者的信息需求,可分為顯性需求(現(xiàn)實(shí)需求)和隱形需求(潛在需求)。一般而言,顯性需求者會(huì)利用自己掌握的方法去尋找所需檔案信息,以達(dá)到預(yù)期目的;但是,對(duì)那些隱性需求者來(lái)說(shuō),情況就有不一樣了,他們則需要通過(guò)某些相關(guān)信息的刺激,才能把潛在需求激發(fā)出來(lái),使之顯性化和明確化。為此,就必須在檢索過(guò)程中采用適當(dāng)?shù)拇碳ば畔⒉粩嘁龑?dǎo)利用者,將檢索結(jié)果逐步引向與利用者的真實(shí)需求相一致。否則,其潛在需求要么就難以激發(fā)出來(lái);要么即使激發(fā)出來(lái)了,或因海量信息導(dǎo)航偏差,同樣難以達(dá)到預(yù)期目標(biāo)。在傳統(tǒng)檔案信息檢索過(guò)程中,由于檔案人員自身知識(shí)結(jié)構(gòu)的缺陷,雖然他們?cè)D作好這種信息導(dǎo)航,但實(shí)際上卻無(wú)法辦到。因此,利用電腦及網(wǎng)絡(luò)的海量存儲(chǔ)技術(shù)和電腦相對(duì)完整的“知識(shí)結(jié)構(gòu)”,既可以彌補(bǔ)檔案人員知識(shí)的不足,減少檢索誤導(dǎo),又能極大地減輕利用者的負(fù)擔(dān),從而實(shí)現(xiàn)機(jī)器智能檢索。
2、利用者信息需求表達(dá)語(yǔ)言由專業(yè)化向自然化轉(zhuǎn)變
傳統(tǒng)檔案信息檢索過(guò)程是利用者信息需求的表達(dá)方式與信息系統(tǒng)標(biāo)引方式耦合(相匹配)的過(guò)程,而這種耦合(匹配)是建立在規(guī)范化專業(yè)語(yǔ)言的基礎(chǔ)上的。具體來(lái)說(shuō),利用者信息需求是用一定數(shù)量的規(guī)范性檢索詞來(lái)代替,同樣,系統(tǒng)中的每一條信息也是由一定數(shù)量的規(guī)范性標(biāo)引詞來(lái)代替,如果這二者耦合(相匹配),那么系統(tǒng)中的標(biāo)引詞所代替的信息就被命中;否則,系統(tǒng)中的標(biāo)引詞所代替的信息就不予承認(rèn)。在應(yīng)用過(guò)程中,這兩個(gè)“代替” 實(shí)際上大多成為利用者查找所需信息的障礙,第一個(gè)“代替”可能會(huì)導(dǎo)致不能準(zhǔn)確地表達(dá)利用者的信息需求,即利用者信息需求一旦經(jīng)檢索語(yǔ)言規(guī)范后,其需求意愿有可能發(fā)生變化,或被縮小,或被擴(kuò)大,甚至被改變,所得檢索結(jié)果則不完全符合甚至完全不符合利用者的要求,這樣就會(huì)產(chǎn)生較高的誤檢率和不滿意率。第二個(gè)“代替”亦然,或者不能準(zhǔn)確地表達(dá)系統(tǒng)信息本身,或者其本身包含的信息沒(méi)有被完全標(biāo)引出來(lái),其檢索結(jié)果常常不能完全符合利用者的要求,同樣會(huì)造成較高的誤檢率、漏檢率和不滿意率。為此,人們一方面開(kāi)始嘗試采用單漢字標(biāo)引、自然語(yǔ)言標(biāo)引來(lái)彌補(bǔ)第二個(gè)“代替”的缺陷;另一方面則提出用智能技術(shù)解決第一個(gè)“代替”問(wèn)題的方案,即運(yùn)用智能技術(shù)對(duì)檢索表達(dá)方式進(jìn)行適當(dāng)?shù)姆治?、處理,盡量以自然語(yǔ)言來(lái)表達(dá)利用者需求,以滿足利用者的需求意愿。因此,表達(dá)語(yǔ)言自然化的要求就促進(jìn)了智能技術(shù)在檔案信息檢索中的應(yīng)用。
3、利用者檔案信息需求由單一性向復(fù)雜性轉(zhuǎn)變
21世紀(jì)將是人類在知識(shí)方面取得偉大進(jìn)步的時(shí)代,隨著人們生活水平的迅速提高,人們的需求將變得更加豐富多彩,對(duì)檔案信息的需求也日趨復(fù)雜起來(lái),利用者將不再滿意傳統(tǒng)檢索系統(tǒng)將檔案信息檢索與檔案信息獲取分裂的做法。傳統(tǒng)檢索概念的最大特征就是把找到的信息線索作為檢索的結(jié)果,這樣的結(jié)果就是當(dāng)時(shí)利用者的需求,而現(xiàn)在利用者不再滿足只獲得檔案信息的線索,更希望獲得原始信息或者能直接解決問(wèn)題的相關(guān)知識(shí),這就體現(xiàn)了利用者在信息需求的類型上更為多樣和復(fù)雜;同時(shí)要把檔案信息組織為知識(shí),就要求檔案信息檢索系統(tǒng)具有能夠進(jìn)行語(yǔ)法語(yǔ)義分析等現(xiàn)代智能技術(shù)。再說(shuō),利用者所需檔案信息的內(nèi)容也不盡相同,包括政策、法規(guī)、憑證、經(jīng)驗(yàn)、教訓(xùn)、知識(shí)等各方面,而這些檔案信息和需求又常常是相互聯(lián)系的,因此,利用者對(duì)檢索提出了更高的要求,只有在檢索中運(yùn)用概念聯(lián)想、數(shù)據(jù)庫(kù)動(dòng)態(tài)鏈接等智能技術(shù),才能幫助利用者實(shí)現(xiàn)其需求目的。可見(jiàn),只有實(shí)現(xiàn)智能檢索才能滿足利用者日益復(fù)雜的信息需求。
(二)科技環(huán)境分析
1、檔案信息檢索系統(tǒng)自身發(fā)展的要求
在網(wǎng)絡(luò)日益成為日常信息傳輸手段的時(shí)代,要從海量檔案信息中找出利用者所需信息,傳統(tǒng)的人工檢索方法和技術(shù)顯然已力不從心。摩爾斯定律認(rèn)為:一個(gè)情報(bào)系統(tǒng)如果對(duì)使用者來(lái)說(shuō)取得情報(bào)要比他不取得情報(bào)更費(fèi)事更麻煩的話,這一系統(tǒng)就不會(huì)得到利用。事實(shí)證明,當(dāng)系統(tǒng)的用戶需求和環(huán)境發(fā)生變化時(shí),如果該系統(tǒng)仍然維持原有模式和功能而不能相應(yīng)發(fā)展的話,那么,這種過(guò)時(shí)的檢索系統(tǒng)恰好為摩爾斯定律所言中,即利用者就會(huì)覺(jué)得用它比不用它更費(fèi)事更麻煩,這樣的系統(tǒng)除了死亡,就不配有更好的命運(yùn)了。因此,系統(tǒng)只有與時(shí)俱進(jìn),不斷進(jìn)行技術(shù)革新和升級(jí)才能生存下來(lái),譬如運(yùn)用模擬人類思維的分辨和聯(lián)想來(lái)適應(yīng)利用者需求和檢索環(huán)境的變化,使信息檢索系統(tǒng)自身逐步實(shí)現(xiàn)智能化。
2、人工智能技術(shù)進(jìn)步的影響
檔案信息檢索系統(tǒng)智能化的產(chǎn)生得力于人工智能技術(shù)的發(fā)展。人工智能技術(shù),說(shuō)得通俗一點(diǎn),實(shí)際上就是一種能夠進(jìn)行計(jì)算、推理等思維活動(dòng)的智能機(jī)器,現(xiàn)已發(fā)展到能夠進(jìn)行模式識(shí)別、物景分析、聯(lián)想記憶模擬、自動(dòng)定理證明、自動(dòng)程序設(shè)計(jì)、專家系統(tǒng)、自然語(yǔ)言處理的程度。其中模式識(shí)別、物景分析、自然語(yǔ)言處理和專家系統(tǒng)等技術(shù)均與信息檢索智能化相關(guān)聯(lián),例如模式識(shí)別可用于基于圖像的檢索,專家系統(tǒng)是智能檢索實(shí)現(xiàn)的基礎(chǔ)。人工智能技術(shù)用于檔案信息檢索系統(tǒng),必將導(dǎo)致檔案信息檢索理論和方法發(fā)生實(shí)質(zhì)性變化,使檔案信息檢索進(jìn)入智能化的新時(shí)代。
三、檔案信息檢索智能化的發(fā)展趨勢(shì)
檔案信息檢索智能化建設(shè)的發(fā)展方向,應(yīng)與圖書、情報(bào)基本一致,主要顯現(xiàn)在:
(一)向智能信息檢索技術(shù)的方向發(fā)展
20世紀(jì)80年代以來(lái),國(guó)內(nèi)外智能檢索系統(tǒng)開(kāi)發(fā)呈現(xiàn)出加速發(fā)展的勢(shì)頭。二十多年來(lái),智能檢索系統(tǒng)不斷由智能檢索接口系統(tǒng)向智能信息檢索系統(tǒng)轉(zhuǎn)變。智能檢索接口系統(tǒng)是利用人工智能技術(shù)對(duì)傳統(tǒng)信息檢索系統(tǒng)的接口進(jìn)行改善,即對(duì)檢索策略的構(gòu)造和檢索后的反饋進(jìn)行調(diào)節(jié),但未改變檢索系統(tǒng)內(nèi)部的結(jié)構(gòu)和組織方式。前期智能檢索接口系統(tǒng)沒(méi)有區(qū)別不同的利用者,后期系統(tǒng)對(duì)不同利用者的專業(yè)、身份、興趣等建立了詳細(xì)的用戶模型,使系統(tǒng)能根據(jù)不同利用者提出不同的檢索策略。其優(yōu)點(diǎn)是實(shí)現(xiàn)了原系統(tǒng)數(shù)據(jù)結(jié)構(gòu)與現(xiàn)有系統(tǒng)的友好鏈接,其缺點(diǎn)是沒(méi)有實(shí)現(xiàn)真正意義上的智能檢索。智能檢索系統(tǒng)則是完全基于知識(shí)的全面信息檢索系統(tǒng),完全更新了整個(gè)系統(tǒng)的結(jié)構(gòu),其基本結(jié)構(gòu)由用戶界面、文本處理和知識(shí)庫(kù)組成。其中,知識(shí)庫(kù)是一個(gè)由知識(shí)庫(kù)系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)、檢索推理系統(tǒng)組成的分布式系統(tǒng),各部分相對(duì)獨(dú)立。其知識(shí)庫(kù)系統(tǒng)包含了檢索專家的知識(shí)、經(jīng)驗(yàn)和相關(guān)領(lǐng)域的知識(shí),如專業(yè)知識(shí)、領(lǐng)域?qū)<抑R(shí)等,并按照一定方式組織存儲(chǔ)起來(lái),作為推理的前提。其檢索推理系統(tǒng)根據(jù)推理機(jī)制進(jìn)行具體的推理檢索,能夠充分利用知識(shí)庫(kù)中已有規(guī)則和知識(shí)推出未知內(nèi)容,提煉出符合利用者需求的信息,實(shí)現(xiàn)智能化檢索。文本處理系統(tǒng)利用計(jì)算機(jī)自動(dòng)處理自然語(yǔ)言形式的文本輸入,即利用知識(shí)庫(kù)中的語(yǔ)言學(xué)及相關(guān)科學(xué)的知識(shí),對(duì)文本進(jìn)行語(yǔ)法語(yǔ)義分析,通過(guò)理解文件內(nèi)容主題,將其表示為知識(shí)庫(kù)中的知識(shí)和數(shù)據(jù)庫(kù)中的數(shù)據(jù)元素,不斷地豐富目標(biāo)知識(shí)庫(kù)和數(shù)據(jù)庫(kù)。與智能檢索接口系統(tǒng)相比,智能信息檢索系統(tǒng)的優(yōu)勢(shì)十分明顯,并隨著信息技術(shù)和人工智能技術(shù)的發(fā)展,智能信息檢索技術(shù)必將日臻成熟并取代接口技術(shù),實(shí)現(xiàn)檔案信息全面智能檢索。
(二)向多維檢索系統(tǒng)的方向發(fā)展
在信息網(wǎng)絡(luò)化時(shí)代,網(wǎng)絡(luò)給人們帶來(lái)的是海量信息。從網(wǎng)絡(luò)信息利用的情況來(lái)看,人們使用最方便和最廣泛的是Web,因此,智能信息檢索系統(tǒng)一旦與web成功結(jié)合,就會(huì)大大提高該系統(tǒng)的使用效率。就信息傳播便捷有效的要求而言, web與智能檢索結(jié)合不僅是必要的,而且INTERNET、網(wǎng)絡(luò)數(shù)據(jù)庫(kù)和web網(wǎng)間數(shù)據(jù)庫(kù)鏈接技術(shù)的迅猛發(fā)展為實(shí)現(xiàn)這一結(jié)合提供了可能。例如GeneCards 系統(tǒng),就是實(shí)現(xiàn)web檢索的一個(gè)較為成功的范例。該系統(tǒng)作為一個(gè)人類基因及其產(chǎn)物和相關(guān)疾病的數(shù)據(jù)庫(kù),是一個(gè)以網(wǎng)頁(yè)界面瀏覽的知識(shí)平臺(tái),既有完整的導(dǎo)覽輔助應(yīng)用系統(tǒng),又有專家建議的提示,再加上拼字檢查功能,已成為一套十分方便好用的生物醫(yī)學(xué)資源工具。
(三)現(xiàn)代化檔案館應(yīng)該沿著信息檢索智能化的方向發(fā)展
基于概念和語(yǔ)義的檢索技術(shù)和跨語(yǔ)言檢索技術(shù)等新的檢索技術(shù)的產(chǎn)生,網(wǎng)絡(luò)技術(shù)的發(fā)展,已使檔案信息檢索智能化趨勢(shì)顯露出來(lái),檔案館只有沿著這一方向前進(jìn),才能實(shí)現(xiàn)真正意義上的現(xiàn)代化,其社會(huì)功能才能全面地發(fā)揮出來(lái)。
參考文獻(xiàn)
1、粟莉:《我國(guó)智能情報(bào)檢索研究的回顧與展望》,《情報(bào)科學(xué)》2001第2期。
2、馮惠玲、張輯哲主編:《檔案學(xué)概論》,中國(guó)人民大學(xué)出版社,2001年6月第1版。
3、李明、沈紅君:《情報(bào)檢索智能化》,《情報(bào)理論與實(shí)踐》,1996第6期。
鄒吉輝,攀枝花學(xué)院檔案館館長(zhǎng)、人文社科學(xué)院教授,中國(guó)檔案學(xué)會(huì)會(huì)員,已發(fā)表檔案學(xué)論文38篇。電話:(0812)3370668、6992606;郵編:617000
 

 
(文/小編)
免責(zé)聲明
本文為小編原創(chuàng)作品,作者: 小編。歡迎轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)注明原文出處:http://www.szsunz.com/tech/201811/1786.html 。本文僅代表作者個(gè)人觀點(diǎn),本站未對(duì)其內(nèi)容進(jìn)行核實(shí),請(qǐng)讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,作者需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問(wèn)題,請(qǐng)及時(shí)聯(lián)系我們kf@dawindow.com。
 

Copyright ? 2018 檔案之窗(dawindow.com) ??? 深圳司捷科技有限公司? ? 版權(quán)所有       粵ICP備18047471號(hào)-1