美 国 一 级 A 片/午夜免费视频/久久riav/国产人妖 视频专区 - 1024亚洲精品国产

檔案之窗

掃一掃關注

當前位置: 首頁 » 技術 » 檔案管理 » 檔案檢索 » 正文

檔案信息檢索策略

放大字體  縮小字體 發布日期:2018-07-20 10:16:03    瀏覽次數:87    評論:0
導讀

檔案信息檢索策略策略對檢索效果有很大影響, 檢索策略制訂得好, 不僅可達到較高的檢全率和檢準率, 還可提高檢索速度, 縮短檢索時間, 降低檢索費用。尤其是對計算機檢索來說, 制訂周密的檢索策略是檢索能否成功的關鍵。一、檔案信息檢索提問分析提問是用戶實際表達出來的檢索要求, 也稱情報提問。檔案檢索提問分析是對檔案檢

檔案信息檢索策略

  策略對檢索效果有很大影響, 檢索策略制訂得好, 不僅可達到較高的檢全率和檢準率, 還可提高檢索速度, 縮短檢索時間, 降低檢索費用。尤其是對計算機檢索來說, 制訂周密的檢索策略是檢索能否成功的關鍵。

一、檔案信息檢索提問分析

  提問是用戶實際表達出來的檢索要求, 也稱情報提問。檔案檢索提問分析是對檔案檢索課題所作的主題分析, 目的是弄清用戶真正的檢索要求, 以便確定檢索對象和檢索范圍, 它是制訂檔案信息檢索策略的首要步驟。

檔案檢索提問分析包括以下內容:

(1 ) 檢索目的: 是為了查證某一事實, 還是為了研究某一問題。

(2 ) 檢索對象: 是檢索檔案中包含的信息, 還是檢索某一特定的檔案。

(3 ) 檢索范圍: 檢索哪種類型、時間、地區和專業范圍的檔案材料。

(4 ) 現有檔案線索: 如立檔單位的名稱、職能、沿革, 檢索對象的時間、地點, 檔案責任者、文號、圖號, 相關聯的人物、機構、事件等。掌握的線索越多, 越有利于檢索的進行。

  種種原因, 用戶的檢索提問往往不能準確全面地表達其真正的檢索要求, 增加了檔案檢索提問分析的難度, 表現在以下方面:

(1 ) 用戶往往把提問局限于那些認為檢索系統能夠提供的信息范圍, 而不一定是他的全部需求。例如, 用戶對檔案機構或檢索系統提供檔案信息的能力有所懷疑, 認為不能滿足其要求, 或者認為自己的時間、吸收能力、經濟能力有限, 沒有必要正式提問。另一些用戶為了保密, 不愿將自己的要求和盤托出。因此,檢索提問往往縮小、放大或偏離了真正的檢索要求。

(2 ) 用戶對檢索要求的表達受用戶水平和系統語言的影響,常常出現誤差。用戶受本身水平的限制, 在表達自己的信息需求時難免出現含糊不清、詞不達意甚至錯誤表達自己的檢索要求的情況。另外, 目前的檔案檢索系統絕大多數采用的是受控語言,而不是自然語言, 用戶對這種受控語言往往很陌生, 缺乏這方面的知識, 難于用它精確地表達自己的需求, 在這種情況下, 表達的誤差是不可避免的。因此, 用戶的檢索提問不一定能代表其真正的要求。

(3 ) 用戶為實現其研究、查證等檢索目的而應當提出的檢索要求暫時還沒有被意識到, 這種潛在的信息需求往往隨著檢索工作的進展逐漸明朗, 轉化為現實的檢索提問, 需要作進一步的提問分析。

  看來, 如果把用戶檢索時的實際提問, 看作是他的全部信息需求, 那就片面了。用戶潛在的需求不一定都被轉化為檢索提問, 用戶的檢索提問不一定完全反映他的檢索要求, 表達的誤差時有發生。因此, 弄清用戶的真正需求, 并不是件容易的事,這就需要對檢索提問進行深入的分析, 正確的提問分析是檢索能否順利進行的前提。

二、檔案信息檢索策略的構造

() 檢索途徑的選擇

  用戶的檢索提問選擇合適的檢索途徑, 決定檢索入口。對某一特定的檢索要求選擇什么檢索途徑, 決定于用戶對檔案線索的掌握程度及檢索系統的設置情況。對于手工檢索來說, 檢索途徑的選擇就是決定采用哪種檢索工具進行檢索, 可以是分類目錄, 也可以是主題目錄; 可以是題名目錄, 也可以是文號索引,等等。而對計算機檢索系統來說, 則包括對數據庫的選擇及檢索項目的確定。檢索項目包括待檢數據庫中各種規范化代碼如分類號、產品代碼、國家或地區代碼、機構名稱代碼等, 以及表示主題概念的檢索詞。在計算機檢索中, 檢索詞是各種檔案數據庫中不可缺少的基本檢索項目。檢索詞包括主題詞和自由詞, 一般總是優先選擇主題詞作為最基本的檢索項目, 因此在計算機檢索中, 主題檢索途徑是主要的檢索途徑。

() 檢索標識的選定

   檢索途徑后, 即可根據分類表或詞表, 將表達用戶提問的主題概念, 轉換成檢索標識。所選擇的檢索標識適當與否取決于對檢索提問進行主題分析的正確性和全面性以及標引的準確性、專指性。在這里, 檢索標識的選定對檢索網羅度和專指度有很大影響。檢索網羅度是指檢索標識網羅檢索課題主題概念的范圍和程度, 網羅度高, 檢全率就高。檢索專指度指檢索標識表達檢索課題的主題內容的確切程度, 專指度越高, 檢準率就越高。

  達到較高的網羅度和專指度, 就要對檢索課題進行深標引,這意味著要用更多的檢索標識來更全面、更具體地標引檢索課題的主題概念。具體來說, 要優先選擇專指的主題詞, 另外可選用適當的自由詞配合檢索。需說明的是, 使用自由詞可達到較高的專指度, 可以及時反映新概念, 靈活性強, 但自由詞缺乏詞匯控制, 增加了檢索難度, 因此, 自由詞的選用是有一定限制的。

() 檢索式的擬定

    課題的主題內容選定了檢索標識以后, 就可以用布爾邏輯算符和一些檢索指令將檢索提問中各有關概念之間的關系表達為布爾檢索式。檢索式是檢索策略的具體表現形式, 它是對檢索提問的邏輯表達, 也稱檢索提問表達式。

常用的布爾邏輯算符有: 邏輯與( 或稱邏輯乘、邏輯積) , 符號“ * ; 邏輯和( 或稱邏輯加) , 符號“ + ; 邏輯非, 符號“ - ”。檢索指令是表示計算機能夠執行的各種運算關系的標記和符號, 不同的計算機檢索系統有各自的檢索指令。不管用戶的檢索提問多么復雜, 都可以用布爾邏輯的原理, 使用概念組配的方法, 轉化成布爾邏輯檢索式。

下面是布爾邏輯運算方式的圖例:

         

例如, 對“ 外國鐵路拱式鋼橋” 這一檢索提問, 可編制如下檢索式:

檢索式編制的好壞, 直接關系到檢索效果。檢索式的擬定有一定的技巧, 其基本要求是:

(1 ) 應完整而準確地反映出檢索提問的主題內容;

(2 ) 應遵守待檢數據庫的檢索用詞規則;

(3 ) 應符合檢索系統的功能及限制條件的規定;

(4 ) 應遵守概念組配原則, 避免越級組配;

(5 ) 注意檢索式的精練, 能化簡的檢索式盡量化簡。

三、檔案信息檢索策略的調節

檔案信息檢索過程比較復雜, 由于種種原因, 檢索結果往往

不能完全滿足檢索要求而出現一些偏差, 這就需要及時修改和調整檢索策略, 進行反饋檢索, 以達到既定的檢索目標。

一般來說, 需要進行反饋檢索的課題有兩種類型: 一是未達到檢索目標, 或用戶又在原來檢索的基礎上提出了進一步的檢索要求; 二是由于構造檢索策略不當所造成的檢索失誤。不管是哪種情況的反饋檢索, 都要對用戶提問和檢索結果進行深入分析,在原有的檢索基礎上進一步擴大或縮小檢索范圍。可通過下列方

法調節檢索策略:

() 調整檢索式

對于需提高檢全率的課題, 常用以下方法擴大檢索范圍:

(1 ) 降低檢索標識的專指度, 可從詞表中或檢出文獻中選一些上位詞參加檢索;

(2 ) 刪除檢索式的某個組面, 調節檢索網羅度;

(3 ) 增加用邏輯和( + ) 連結的相關檢索詞, 進行族性檢索。例如, 對“ 研究生教育” 這一提問, 可編制如下檢索式:

研究生( 碩士研究生+ 博士研究生) * 教育

在這里增加碩士研究生和博士研究生兩個相關檢索詞, 意味著除了總論研究生教育的材料可以檢出外, 專論有關碩士研究生和博士研究生教育的材料也可一并檢出。

對于需提高檢準率的課題, 常用以下方法縮小檢索范圍:

(1 ) 提高檢索標識的專指度, 可以增加或換用下位詞和專指性較強的自由詞;

(2 ) 用邏輯與( * ) 連結一些進一步限定主題概念的相關檢索項, 例如, “研究生* 教育* 通知”, 在這里“ 通知” 為檔案的文種, 可對主題概念進行限定;

(3 ) 用邏輯非( - ) 排除一部分不需要的材料;

(4 ) 在檢索標識后注明關聯符號和職能符號, 以避免概念的誤組配, 提高檢準率。

() 增加檢索途徑

除了采用主題檢索途徑外, 增加分類途徑、責任者途徑或其他形式檢索途徑進行檢索, 可以對檔案材料的專業范圍、檔案類型、文種、時間等進行限制。

() 利用概念等級樹擴檢或縮檢

利用分類表、詞表中的概念等級結構向上擴大檢索范圍, 提高檢全率; 向下縮小檢索范圍, 提高檢準率, 這是用計算機自動實現的。例如, 可采用上位登錄的方法, 將檢索標識的所有上位詞用計算機自動登錄, 利于擴檢。

() 采用截詞檢索、加權檢索、精確檢索等方法進行檢索具體方法后敘。

需要指出的是, 由于檢全率和檢準率之間存在著相互制約現象, 提高檢全率常常會降低檢準率, 而檢準率的提高又可能導致檢全率的降低, 因此, 在構造和調整檢索策略時, 應深入分析用戶檢索提問的實質及需求范圍, 以達到理想的檢索效率。


 
(文/小編)
免責聲明
本文為小編原創作品,作者: 小編。歡迎轉載,轉載請注明原文出處:http://www.szsunz.com/tech/201807/45.html 。本文僅代表作者個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,作者需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們kf@dawindow.com。
 

Copyright ? 2018 檔案之窗(dawindow.com) ??? 深圳司捷科技有限公司? ? 版權所有       粵ICP備18047471號-1