美 国 一 级 A 片/午夜免费视频/久久riav/国产人妖 视频专区 - 1024亚洲精品国产

檔案之窗

掃一掃關注

當前位置: 首頁 » 技術 » 檔案信息化 » 檔案數字化 » 正文

網絡檔案信息利用流程分析

放大字體  縮小字體 發布日期:2018-12-26 17:35:27    瀏覽次數:19    評論:0
導讀

在網絡環境下,檔案信息利用者較之傳統檔案利用者出現二極分化的趨勢:一極是網絡檔案信息利用者日趨大眾化、社會化。另一極是網絡檔案信息利用者趨向專深化和特殊化。

網絡檔案信息利用流程分析

(一)利用者需求分析

在網絡檔案信息利用中,利用者是主體,是檔案信息的需求者和檢索系統的直接操作者。為此,在網絡檔案信息利用中首先就要克服以往檔案利用中坐等利用者上門的觀念和做法,加強對利用者及其利用需求的調研、了解和預測。掌握利用者對檔案信息的需求是實現網絡檔案信息服務的前提條件。

本書在第三章第二節網絡檔案計算機檢索系統的開發部分,對利用者的利用需求進行了分析。在網絡環境下,檔案信息利用者較之傳統檔案利用者出現二極分化的趨勢:一極是網絡檔案信息利用者日趨大眾化、社會化。這部分利用者利用檔案信息沒有明確目的,可能僅僅是出于休閑要求和個人愛好。對于他們來說,只有發現具有新意、能引起其興趣的信息時才可能仔細閱讀。這就要求檔案機構及時發布最新開放館藏的信息和最新消息,提供豐富翔實、特征鮮明、內容新奇的信息內容,同時還可以增加一些趣味性強的欄目,在傳遞信息和知識的同時,賦予一定的情趣和藝術感染力。另一極是網絡檔案信息利用者趨向專深化和特殊化。這部分利用者是希望獲得某種特定檔案信息的查找者,他們是帶著問題來訪問檔案網站的。他們的利用需求與普通利用者有著質的區別,不僅自己收藏了大量相關信息,而且時時跟蹤最新發展方向與動態,補充已有的資料,以使個人擁有的某方面信息達到一種極致狀態。這些利用者的利用需求更具專門性,對于他們不僅要有檔案信息內容的保障,而且還要提供有效的檢索工具和深入的、專業化的信息服務。

目前,關于如何掌握和分析利用者的利用需求還有待實踐探索。檔案機構可以通過網絡問卷形式獲得一些統計信息。如北京市檔案局在20036月底的網上調查欄目,設計的問題就是是否滿意改版后的檔案網站。針對各種統計數據,可以利用數據挖掘等相關技術,對流通記錄、檢索提問、網絡問卷、網絡論壇與留言等進行分析,統計檔案信息檢索和閱覽情況,對拒閱信息和頻繁閱覽信息進行統計分析,發現利用者興趣模式。

(二)檢索提問

網絡環境出現之前的檔案檢索,是根據利用者提出的要求由專職檔案人員進行計算機操作,再把檢索結果提供給利用者。其不足之處在于:這是一種委托性質的檢索,利用者沒有機會直接操作檢索系統,如果利用者未清楚地說明想要查找的是哪些內容,會直接影響檢索效果。由專職檔案人員進行檢索操作,利用者需要等待,影響了檢索的及時性。

在網絡環境下,利用者直接操作檢索系統,通過作為網絡節點的計算機,同網絡中的檢索系統直接進行對話,以問答的方式,獲得檢索結果。利用者無論何時何地都能調用檢索系統,查到所需的各類檔案信息,不超過幾秒鐘時間檢索要求即能得到響應,檢索迅速、方便。網絡檔案信息利用最基本的要求是利用者能夠進行檢索提問,而形成一個有效的檢索提問主要應具備以下幾個方面的基本技能:

1.分析檢索課題的主題

分析檢索課題的主題,要根據檢索課題的主題結構、類型、專業范圍、性質來進行,使檢索課題形成若干個既能代表信息需求又具有檢索意義的主題概念。分析所得的主題概念要盡量能夠反映檢索的需要,對所需信息的主題概念有幾個,概念的專指度是否合適,哪些是主要的,哪些是次要的等方面都要有所考慮。

2.確定檢索途徑,形成提問詞

在檢索中,首先要指定檢索途徑。檢索途徑是指在檢索系統設計時期確定的檔案信息數據的項目。檢索時利用者要根據需要選擇適當的檢索途徑。從理論上講,檔案信息數據庫中任何一個字段項都可以作為檢索途徑。但實際上有些項目(如密級等)如果單獨作為檢索途徑,則將檢出占半數以上的檔案信息,就失去了檢索意義,這些項目只能作為邏輯組合中的一些輔助的檢索途徑。利用者的提問一般針對主題詞、分類號、責任者、時間、檔號、關鍵詞等主要的檢索途徑。

利用者根據檢索需要確定檢索途徑后,要將檢索的內容形成提問詞。提問詞要盡量做到科學、準確、規范化。在形成提問詞過程中最大的障礙就是檢索語言的問題。檢索系統若采用的是人工語言有利于提高檢準率,但不適合普通的網絡利用者;若采用的是自然語言適合普通網絡利用者的使用,但又降低了檢準率不能滿足專業利用者的要求。所以筆者提倡網絡檔案信息檢索系統要能兼具關鍵詞檢索與主題詞檢索,這一點在第三章中已有所論述。隨著檢索系統的發展,形成提問詞對于利用者來說將越來越簡單。目前,有些檔案檢索系統采用了自動標引和半自動標引,為此要求在這類系統中有一個將提問詞與著錄標引用詞統一起來的詞表管理系統,將利用者提問的自然語言轉化為規范化的檢索語言。檢索系統借助于同樣的檢索詞典,將提問詞和著錄標引用詞都轉化成規范詞,是提高檢索效率的最好途徑。

3.指定檢索的比較部位

指定檢索的比較部位是指給出提問詞的有效位數,也就是給出檢索途徑中實際參加檢索查比的數據項目由左數起的字符個數。提問詞的比較部位常有如下二種:

完全一致,即要求提問詞與檢索途徑中的所有部位都符合比較條件。

部分一致,提問詞與檢索途徑某一部份符合比較條件。部分一致又可分為四種情況:一是前方一致,要求被檢索項目的前方與提問詞符合比較條件;二是后方一致,被檢索項目的后方與提問詞符合比較條件;三是中間一致,被檢索項目中存在某一段與提問詞符合比較條件。四是指定位一致,被檢索項目中從指定位開始的若干字節與提問詞符合比較條件。

4.構造邏輯檢索式

邏輯檢索式是由提問詞、邏輯比較符和邏輯關系符組成的邏輯表達式,它一般用于一個或多個檢索途徑的組合查詢。好的信息檢索系統都能提供邏輯組合功能。

邏輯比較符一般有>(大于),>=(大于等于),<( 小于),<=(小于等于),=(等于),<>(不等于)六種。針對每一個檢索項,可以利用邏輯比較符確定它與提問詞的關系。

邏輯關系符一般有AND(邏輯與)、OR(邏輯或)和NOT(邏輯非)三種。邏輯與關系,是表示同時滿足若干條件的情況。邏輯或關系是表示若干條件中滿足其中之一即可的情況。邏輯非關系是表示不滿足某一條件。

5.提問詞的加權

在檔案檢索中,提問詞是表達主題概念的。而一個主題概念可能要幾個提問詞的組合才能表達清楚。因此一些復合概念是用概念之間的組配來表示的。這種組配關系除了用定性的邏輯表達式表示外,還可以用定量方法,即從量的方面給以限定和表示,指出各概念之間的重要程度。在表達利用者的檢索時,對檢索邏輯式中的每個概念給予一定的數值,以表示其重要程度,這稱為概念加權。檢索中,該檢索與檔案信息匹配時,則同時計算所有已匹配檢索概念權值之和,只有當某一檔案信息的概念權值之和達到預先規定的數值時,才能被檢索出來。這個預先規定的數值稱為閥值,利用加權法的檢索也叫定量檢索。

加權是給概念加權,即無論這一概念是用什么詞來表示的,它們都具有同等的權。如同義詞,由于它們的概念是等同的,所以權也是等同的。例如“檔案檢索”與“情報檢索”都是“文獻檢索”,可以規定他們有相同的權數。又如“自行車”與“腳踏車”更應有相同的權值。

在一個好的網絡檔案信息檢索系統中,一般會提供很詳細的幫助系統。上述這些形成檢索提問的基本技能,在幫助系統中都會詳細加以介紹,而且會有許多生動的操作實例。對于這些技能,每個檢索系統實現的具體操作方法又各不相同。利用者完全可以在使用某一檢索系統之前,“臨時抱佛腳”地求教于這些幫助系統,只要細心體會,就可以成為檢索系統的使用專家。另外,在網絡環境下,檔案信息檢索系統有這樣的發展趨勢,即隨著計算機面向對象等技術的發展,檢索系統的設計與開發越來越注重易用性,檢索系統可以設計得十分直觀,操作簡單。多數檢索只需選定檢索途徑,輸入提問詞,就能得到檢索結果。

(三)執行檢索

執行檢索的過程非常簡單,每個網絡檔案信息檢索系統都提供了進行檢索的功能鍵,利用者將提問詞輸入完畢之后,按下相應的功能鍵,檢索系統會自動執行相應的檢索操作,并將檢索結果返回給利用者。

計算機系統及網絡系統會對執行檢索的速度產生一定影響。計算機硬件系統如機器本身的CPU、內存、硬盤的速度、容量及其配置,計算機軟件系統如檢索軟件、數據庫管理軟件,網絡系統如帶寬、速度等,都有可能影響檢索執行的響應速度。

(四)身份認證與用戶權限

因為是面向某一網絡的全部用戶發布檔案信息,網絡檔案信息利用的過程必須能實現對某些有特殊要求的檔案信息加以控制。這種控制主要表現在利用者向檔案信息管理者即檔案機構提供身份證明,檔案機構給予利用者特定的用戶權限。

身份認證通常采用兩種方式,一是利用者通過電子郵件、信函、電話等手段與檔案機構取得聯系,向其郵寄單位介紹信或個人身份證復印件,檔案機構審查通過后給予利用者相應的用戶名和密碼,利用者可以以該用戶名和密碼登錄訪問檔案網站,而其訪問的整個過程檔案網站有相應的系統記錄下來。二是通過利用者所在地的檔案館等檔案機構代為審核利用者的身份,通過檔案機構之間的合作,使利用者獲得用戶名與密碼,從而得到利用相應的檔案信息的資格。

在網絡檔案信息利用中,還要對網站用戶或檢索系統用戶進行分類,設置多種用戶類型,以控制其利用權限。如第一類用戶只能瀏覽目錄信息;第二類用戶既能瀏覽目錄信息,也能瀏覽指定的檔案全文信息;第三類能瀏覽全部信息,包括目錄信息以及所有檔案全文信息等。如果利用者需要,系統在嚴格驗證用戶身份后,可以以電子郵件或文件傳輸等形式自動將全文信息發送給利用者。

(五)網絡檔案信息利用的費用

對于一個檔案機構來說,要進行檔案信息網絡化建設,提供網絡檔案信息利用,前期投入的開發費用還是比較大的。根據實際情況不同,這些費用可能包括購置相應的設備、建設網絡基礎設施、進行數字化處理、開發或購買網絡檔案信息檢索系統及電子文件管理系統、進行著錄標引等數據準備工作的人工費、檔案網站建設投入的費用等等。這些費用的支出視各機構的實際情況而定。比如有些檔案館的檔案網站建設就使用本館技術處(科)的工作人員,除了他們的工資,基本上就不用付額外的費用了。對于我國的檔案機構來說,在投資開發方面要學會走聯合開發檔案信息之路,多方籌措資金。如本書第一章中探討的美國馬里蘭州檔案館和美國國家廣播檔案館“借雞生蛋”的案例,就是籌措開發費用的一種方法。檔案館利用“外”部援助的資金,對某一類檔案信息進行數字化處理,提供給出資方利用,并同時簽定可以將這類信息發布到網絡中的協議。利用方由于需要大量此類檔案信息,在其經濟條件允許的情況下,資助檔案館進行開發,最終形成雙贏的局面。在我國也出現了一些走聯合開發之路的案例。為了適應我國郵電事業發展的需要,迎接第22屆萬國郵政大會在北京召開,1997年原郵電部決定組織編寫《中國郵票史》。為了大量利用“郵電檔案”,原郵電部愿意資助一部分資金,由中國第二歷史檔案館提供人員、場地,購買所需設備,對館藏的“郵電檔案”進行整理,然后運用多媒體技術,將整理后的一次檔案信息以數字化形式存儲在光盤上,提供給原郵電部利用。其間共完成10余萬卷檔案的整理,200余萬頁文件的掃描,500余盤光盤的刻錄,真正開創了社會與檔案部門發揮各自優勢攜手開發檔案信息的先河。這個案例與美國馬里蘭州檔案館和美國國家廣播檔案館的不同之處,是開發僅限于對檔案的數字化處理上,最終沒有放到網絡上利用。但它畢竟為檔案機構的信息網絡化建設提供了一種發展思路。

對于一個網絡檔案信息利用者來說,其利用的費用主要包括網絡通信費用和檔案機構收取的信息服務費。

目前,我國的網絡通信費用還存在資費過高的情況。以中美兩國比較為例,美國人均月收入2000美元,每月網絡通信服務費支出不到20美元,約占收入的1/100;我國人均月收入不到1000元,網民每月實際花費的上網費用大部分在100元以內,約占收入的1/10。我國的國際聯網費是國外的13.5倍,國內通信費是國外的40倍,差距之大非常驚人。有人將因特網上的信息檢索成本用公式表達為:

成本=入網費+網絡使用費+電話費+時間耗費

其中入網費是一次性的,不同ISP有不同標準。如上海市的ADSL寬帶服務入網費為630元,其中310元為接入費,320元為設備費。網絡使用費目前有兩種收費形式,一種是包月形式,一種是計時形式。電話費,按線路占用時間計費,占用時間越長,付費越多。時間耗費指檢索者為獲得所需信息而消耗掉的時間,時間耗費成本的高低因人而異,職業、職位、工資水平都在不同程度上決定了時間成本的高低。當然,對于網絡信息利用者來說,他們上網利用的不僅僅是檔案信息,所以能折入檔案信息利用成本的僅是網絡通信費用中很少的一部分。但無論如何,對于網絡信息利用者來說,他們希望通信網絡“能夠成為公用事業,就像自來水、電力和煤氣一樣,做到人人用得上、用得好、用得起”。

對于檔案機構來說,在網絡檔案信息利用費用中,最應該考慮的是如何收取信息服務費。

目前,多數檔案機構與利用者都可以接受的觀點是,網絡檔案信息利用要分為免費和收費兩個部分。免費部分的信息,利用者可直接從檔案網站及其數據庫中調用;對于收費部分的信息,利用者要通過電子郵件等方法與檔案機構取得聯系,交付相關的費用后方可調用所需的檔案信息。目前的難點是如何確定收費的范圍,應該收取哪些費用。比如要使利用者能夠進行網絡檔案信息利用,開發費用是比較高的,這些開發費用是否應計入成本等等。對于這個問題,筆者主要通過中美兩國在檔案利用服務收費問題上的觀點進行比較分析。

我國檔案館在檔案利用服務中一度普遍實行有償服務,收取一定數量的調卷費。在網絡環境下,許多人依舊倡導有償利用。他們認為: “有償服務實質上是檔案信息價值的體現,” “有償利用檔案信息是檔案利用工作必須堅持的基本原則,只有實行有償服務,才能充分體現檔案信息的社會價值,才能使檔案工作逐步實現產業化之路。”

美國檔案館提倡以免費服務為主。在進行檔案宣傳時, “免費服務”是其在推銷檔案利用服務中喊得十分響亮的口號。那么免費服務是否就不收取任何費用呢?并不是這樣,他們要適當收取用于檔案復印和散發的少許費用。在1986年美國《信息自由法案》修訂版中,規定了三種收費項目:一是文件復印費;二是查找文件的費用;三是用于鑒定文件的費用。另外,他們對于不同的利用者收費不同,他們一般將利用者分為三類:一是包括新聞媒體、教育和非商業性的科研機構。這一類利用者的目的都是非商業性的,一般只收取合理的文件復制費用;二是商業使用者。商業使用沒有明確的法律定義,通常理解為贏利活動。對這類利用者的收費包括復印、查找和鑒定文件的全部費用;三是指上述兩種之外的所有其他利用者,如個人、公共利益團體、非贏利性組織。對這類利用者的收費包括文件的復印和查找費。在實際收費時,用于查找文件的前2小時和復印文件的前100頁是免費的,而一個較易進行的非商業性的小查詢通常都是完全免費的。在這些原則的基礎上,美國的網絡檔案信息利用也提倡免費利用。在美國檔案網站中查閱檔案目錄信息和檔案全文信息是免費的。但要得到相關檔案的復制件也要付出相應的費用。以美國國立航空宇航博物館為例。其照片檔案進行數字化處理后在網站上發布,但是這些照片掃描時分辨率并不高,僅供利用者全面掌握檔案的內容信息,因而這些數字化的照片只有小幅顯示時才清晰,通過網絡下載后質量一般達不到利用要求,下載了也沒有多大用處。利用者只是在網絡中通過這些信息準確找到其所要利用的照片,而后通過各種方法再訂購復制件,每張照片的費用是2美元。美國網絡檔案信息的免費與實際利用中的收費情況大抵如此。美國史密森納研究院檔案館前館長威廉·莫斯先生在1993年給我國國家檔案局的一封信中指出:“檔案不是商品,檔案服務是能夠出售的商品,但程度十分有限,認為檔案館可從向用戶收取入館費、利用費、查找服務費、復印費以及提供證明文件費中獲利,這是錯誤的。高收費只能阻礙利用;檔案館向政府部門收取服務費是反生產性的。”

從以上的比較中可以看出,檔案利用服務一定是要收取相關費用的,但收費要合情合理。在圖5中顯示的交費項目是我國實行有償服務時的情況,主要是對一些網絡檔案信息檢索系統的使用或者通過網絡下載檔案信息進行收費。

(六)網絡檔案信息利用結果

對于利用者來說,網絡檔案信息利用的結果有三種:一是在網絡中直接閱讀到相關的檔案信息,并根據需要將這些信息下載;二是通過網絡檔案信息檢索發現相關信息線索,通過向檔案機構提交申請并辦理相應手續后,獲得物理載體的復制件。在國外許多檔案網站中,都有如何購買和獲得復制件的提示。如加拿大國家檔案館網站中的“Obtain copies of records”項目,美國國家檔案與文件署的“Order”項目,都用于指導利用者如何獲得檔案復制件,包括文字檔案的復制件、照片檔案的復制件、承載音像檔案復制品的磁盤、磁帶、光盤等;三是通過網絡檔案信息檢索發現相關信息線索,通過向檔案機構提交申請并辦理相應手續后,獲得檔案證明。檔案機構為利用者提供檔案復制件或檔案證明,一般是根據利用者申請時提供的通訊地址通過郵寄傳遞給利用者。在這三種利用結果中,前兩種利用結果實現了檔案的情報價值,后一種利用結果實現了檔案的憑證價值。


 
(文/小編)
免責聲明
本文為小編原創作品,作者: 小編。歡迎轉載,轉載請注明原文出處:http://www.szsunz.com/tech/201812/5019.html 。本文僅代表作者個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,作者需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們kf@dawindow.com。
 

Copyright ? 2018 檔案之窗(dawindow.com) ??? 深圳司捷科技有限公司? ? 版權所有       粵ICP備18047471號-1