檔案檢索語言概述
一、檔案檢索語言的基本概念及特點
檢索語言是在文獻標引和檢索過程中所使用的一種人工語言。檔案檢索語言是根據檔案檢索的需要而創制的人工語言, 是檔案標引和檢索的工具, 是將檔案主題概念轉換為檢索標識的依據。
與日常使用的自然語言相比, 檔案檢索語言具有以下特點:
1 . 單義性。語詞與概念一一對應, 排除了自然語言中同義詞、多義詞和詞義含糊的現象。例:
精神( 心理學) 精神( 哲學)
通過括號內的限定詞將詞義進行注釋, 排除了多義現象。
2 . 規范性。檢索語言中采用比較確切、規范、通行的語詞作標識, 而不采用不通行的同義詞、近義詞、譯名、俗稱、舊稱、不能準確表達全稱含義的簡稱作標識, 例:
蕃茄( 俗稱) 萊 ( 舊譯名) 傷 ( 舊稱)
用 西紅柿 用 激光器 用 正骨科
3 . 關聯性。檢索語言中采用了各種手段來表達概念之間的相互關系。例:
4 . 系統性。檢索語言的標識都按一定方式進行了系統排列。分類法按號碼順序排列, 主題法按字順排列, 系統排列能固定標識的位置, 使之有序化, 從而提高檢索速度。
5 . 簡明性。檢索語言對大量的自然語言詞匯進行了壓縮和精選, 只選取文獻標引和檢索所需要的詞匯作標識, 具有簡明性。
檢索語言與一般的詞典不同, 詞典也表達概念, 也進行系統排列, 但沒有明確顯示概念之間的相互關系。它們所起的作用也不同。
與自然語言一樣, 檢索語言也由詞匯和語法組成。檔案檢索語言的詞匯是指表達檔案文獻主題概念的全部標識, 一個標識(如分類號、主題詞等) 即檢索語言的一個語詞, 由這些標識系統編排而成的分類表、詞表即為檢索語言的詞典。語法則是創造和運用這些標識所需的一整套規則。
二、檔案檢索語言的作用
檔案檢索語言是檔案信息檢索系統的重要組成部分, 是聯系檔案信息存儲與檢索之間的橋梁, 是整個檢索過程得以完成的語言保證, 其地位與作用如圖2-1 所示:
從圖中可以看出, 檔案檢索語言的主要作用是作為概念轉換
的依據。從檔案中分析出來的主題概念和從檢索提問中分析出的主題概念依據同一檢索語言進行標引, 轉換成檢索標識, 從而可以使標引用語和檢索用語相匹配, 使檢索過程得以完成。由于檢索語言對自然語言進行了規范化處理, 同時采用各種手段顯示概念之間的相互關系, 使之表達的概念專指、明確、規范, 從而能幫助檢索人員又全、又快、又準地檢索到所需文獻信息。
三、檔案檢索語言的分類
檔案檢索語言按構成原理分為: (1 ) 分類語言。其特點是:以學科為中心集中文獻, 以號碼作標識, 按號碼順序進行系統排列。包括體系分類法和組配分類法兩種, 統稱為分類法系統。《中國檔案分類法》即按體系分類法的原理編制而成。( 2 ) 描述語言。其特點是: 以事物為中心集中文獻, 以規范化的自然語言作標識, 按字順進行系統排列。包括標題法、敘詞法、關鍵詞法等, 統稱為主題法系統。1988 年編制出版的《中國檔案主題詞表》就是按敘詞法的原理編制的。(3 ) 代碼語言。其特點是就事物的某一方面特征, 用某種代碼系統來加以標引和排列, 如化合物的分子式索引系統等。
檢索語言按標識的組合方式分為: (1 ) 先組式語言。其特點是文獻標識在編表時就固定組配好; (2 ) 后組式語言。文獻標識在檢索時才組配起來。
檢索語言按學科和專業范圍還可分為綜合性語言、多學科語言、專業性語言; 按所采用的語言分為單語種語言和多語種語言, 等等。