隨著電子文件的興起,人們開始從電子文件的角度對文件概念加以重新的界定。本文傾向于從文件的定義出發,對電子文件、電子檔案等概念進行一些綜述和比較,提出一點個人的見解,供同行和專家參考。
1、重釋文件定義
關于文件的定義,有兩種基本的觀點:一種是傳統的,以1984年國際檔案理事會主持編纂的《檔案學術語詞典》對文件定義的表述為例:文件是由機構或個人在履行其法律義務時或在各種具體事務活動中形成或收到和保管的記錄信息,不管其形成和載體如何。
另一種是現代型定義。1997年國際檔案理事會所屬的電子文件委員會出版的《電子文件管理指南》給文件定義是:文件是由機構或個人在其活動的開始、進行和結束過程中所產生或接收的記錄信息。該記錄信息由足以為其活動提供憑證的內容、背景和結構所構成,而不管記錄的形式或載體。然后從文件這一概念出發定義了“電子文件”的概念。
1995年加拿大的信息管理標準和執行部的《文件管理框架》定義的文件概念是:文件必須只有內容、背景和結構,以便機構和個人能足以控制各種項目,支持各種項目,為項目的移交提供文件,進行各種操作,作出各種決定,及說明政府的活動行為等。其中,文件的背景指文件之間的關系以及文件與產生文件的活動之間的關系。文件的結構指文件的內容結構,即文件的篇章布局。
比較一下現代文件定義與傳統文件定義,可以看出:在文件形成者與形成原因方面二者沒有什么不同。而明顯不同的是:現代文件的定義更強調文件的構成及其憑證作用。發生這一變化的原因在于:傳統文件(主要是紙質文件)的各種組成要素是緊密結合在一起,并且能夠清晰的呈現出來,不需要我們分別地認識和管理它們。而現代文件(主要是電子文件)諸要素之間則是彼此分散的,容易出現一定的混亂和丟失,而且盡管它可能比傳統文件包含了更多的信息,其呈現也許比后者隱晦得多。因此,只有在這樣一種認識的基礎上,才能辨別它“丟失”了哪些關鍵性的信息以及需要補充記錄哪些信息,使它成為真正的文件,這也就是通常所說的電子文件管理的完整性要求。
2.關于電子文件的概念
“電子文件”(electronic records)也稱為“數字文件”(digitalrecords)。目前已有的幾種定義:
*“電子文件是通過數字計算機進行操作、傳遞和處理的文件。”----國際檔案理事會電子文件委員會,《電了文件管理指南》,l997
*“電子文件包括數字的、圖形的及文本的信息,它可以記錄在計算機能夠閱讀的任何一種介質上,并且符合文件的規定。”----《美同聯邦管理法規》,1992
*“其存儲形式只能由計算機處理的文件”。----《美國聯邦文件管理術語手冊》第二版,1993
*“所載信息的形式適合于數字計算機進行檢索、加工和交流的文件”。---- [澳]《記錄未來?電子文件管理的方針與政策》,1995
*“電子文件是由計算機交流與維護的文件。----“澳大利亞檔案館:《澳大利亞管理標準》,1997
*“以代碼形式記錄于磁帶、磁盤、光盤等載體,依賴計算機系統存取并可在通信網絡上傳送的數字代碼序列。”----《檔案工作基本術語》行業標準,報批稿,1999
*“能被計算機系統識別、處理、按一定格式存儲的磁帶、磁盤或光盤等介質上,并可在網上傳送的數字代碼序列”。----《電子文件歸檔與電子檔案管理規范》行業標準,報批稿,1999;----《CAD電子文件光盤存儲、歸檔與檔案管理要求》國家標準報批稿,l999
*“電子文件是電子文件的內容、電子文件內容的存儲載體和對電子文件內容的顯示、修改的電子計算機軟硬件平臺的組合”。----《電子文件歸檔與電子檔案管理概論》,中國檔案出版社,1999年
上述表述最為明顯的一點是技術含量很高,主要差異在于:用什么作屬概念。“文件”還是“數字代碼序列”?目前大部分國家均采用“文件”作為電子文件的屬概念,國際檔案理事會電子文件委員會的《電子文件管理指南》對“文件”和“電子文件”的界定充分體現了這一思想。
3.關于電子檔案的概念在國外學者的著述中,較多使用的是電子文件,但也有少數人使用電子檔案的提法。至于什么是電子檔案,目前的看法不盡相同,主要有以下幾種:
*“具有保存價值的已歸檔的電子文件及相應的支持軟件、參數和其他相關數據”。----《電子文件歸檔與電子檔案管理規范》
*國際檔案理事會電子文件委員會1997年出版的《電子文件管理指南》中把“檔案”接收和保存的電子文件稱為“具有檔案性質的電子文件“(archival electronic record)
*美國國家檔案館1995年重印的《電子文件管理指南》中把由檔案館接收和保存的電子文件直接稱為:“電子文件”;
*國際檔案理事會電子文件委員會1994年至1995年對全世界l00個檔案館關于電子文件管理的問卷調查,凡作為“檔案”接收和保存的電子文件均被稱為“電子文件”,而不稱“電子檔案”。
產生上述現象有兩個方面的原因:一是在電子環境中,文件和檔案的界限不像紙質文件與檔案那么清楚,索性全部稱為電子文件;二是目前電子文件的法律效力尚未得到全面的認可,電子文件尚未取得與“檔案”一樣的法律地位,但是,檔案館又不能等這些問題都解決了再來接收電子文件,因此,姑且把作為“檔案”接收和保管的電子文件稱為“具有檔案性質的電子文件”,這不僅是名稱上的變化,其中蘊涵著深刻的含義。
4.電子文件與機讀文件(machine- readable records)檔案工作者對于機讀文件這個詞一般都比較熟悉,隨著計算機技術的飛速發展,出現了電子文件一詞,在一段時間里,這兩個詞通用或混用,如第十三屆國際檔案大會的報告中,比爾曼用“電子文件”,而諾加雷用“機讀文件”,其實講的是一個東西。
“機讀文件”的概念最早產生于l 890年,當時是指配合一些簡單的電子機械設備而使用的穿孔卡片。20世紀40年代以后,隨著計算機的發明,機讀文件越來越多,漸漸地幾乎專指由計算機處理的文件。上世紀90年代以來,人們越來越多地使用“電子文件”這個概念,在一段時間里,“機讀文件”和“電子文件”幾乎是作為同義詞使用。
用“電子文件”取代“機讀文件”有其技術方面和社會方面的原因。從技術上講機讀的含義不夠確切,一些模擬信息也需要借助機器設備讀取,如唱片、錄音帶、錄像帶、縮微膠片等,而電子文件專指數字信息文件;同時機讀文件包括將編碼信號直接輸出的文件形式,如穿孔卡、穿孔帶等,而電子文件完全在電子環境中存活,其編碼和解碼完全在計算機中完成。
從社會上看,“機讀文件”和“電子文件”在社會屬性上的不同,主要包括(1)產生的工作環境不同。機讀文件產生于本世紀40年代,當時在檔案工作中,計算機僅僅被當作提高信息處理速度的工具,一般用以編制目錄、打印目錄和輔助檢索,文件及檔案產生的環境仍是紙質環境,管理上也仍采用手工管理方法。而電子文件產生的環境是典型的電子工作環境,計算機成為所有管理活動的平臺。(2)身份不同。機讀文件大多是在紙質文件輸入和輸出之間處理過程中產生的轉換性文件,還不是真正意義上的文件或檔案,人們只是關心它的信息屬性,并不強求它的原件屬性。在電子環境中,電子文件是唯一的文件,確認電子文件的憑證地位的要求日益強烈,打印出來的紙質文件反而成為電子文件的一種輔助形式。(3)兩者的名稱反映事物特點的深刻程度不同:機讀文件強調的是文件的閱讀方式,而電子文件是通過描述文件的存在形態來表征事物,更深刻地揭示事物的本質。(4)研究內容的廣度和深度不同。關于機讀文件的研究主要集中于編目、標引、檢索和保護等技術方面的內容,而圍繞電子文件展開的研究觸及了文件?檔案管理的全過程,以至影響到檔案學的思想和理論。
5.電子文件與虛擬文件(virtual records)
目前關于電子文件與虛擬文件的討論很多已見諸報刊,比較有代表性的觀點是:
*方榮認為:電子文件具有“虛幻性”或“虛擬性”,它沒有形狀,沒有規格,沒有記錄符號,看不見,摸不著,和人們頭腦中的思想、印象差不多。既是客觀存在的,又是虛幻的,或者說是虛擬的、假設的。磁帶、磁盤、光盤上的文件是什么樣的?無可知曉。電子文件的記錄方式既不使用文字也不使用圖像和符號,而是使用理論上所說的電磁感應、電脈沖。電子文件在哪里?它在記錄介質、電子計算機、程序三者結合的電子運動中,根本無法按傳統的方式獨立存在。(《電子文件的檔案學審視》,《檔案》1998.1)
*李晨生認為:電子文件也是信息與載體的統一體,它不僅僅是理性的、概念的,而且只有物理形態或曰實態(physical)。他認為:承認不承認電子文件的物理形態及物質屬性,實質上是辯證唯物主義還是形而上學來觀察事物的方法論問題。電子是一種運動著的物質,而非意識。雖然人眼不能直接看到它,但它確實具有物理的實態。由電子運動記錄下來的電子文件怎么能是沒有物理形態的虛擬文件呢?電子文件與紙質文件的根本區別不在于他們是否有實態,他們都具有物理的實態,只是他們的書寫、閱讀方式不同,信息的存儲載體不同而已。可以說,虛擬文件是計算機文件中的一種,不能概括全部的電子文件。(《電子檔案的方法論》,《中國檔案》1998.3)
*傅榮校認為:電子文件并不等于虛擬文件。虛擬文件是存在的,它主要是關系數據庫文件或超文本文件、表、多媒體系統。電子文件的“虛擬”性質實際上由兩方面的因素決定的:一是合成文件的邏輯表達式,二是“動態”數據單元。比如數據庫文件,它往往調動動態數據庫中存儲的數據單元以邏輯關系組合在一起。(《電子文件內容與載體關系變化后的變化》,《浙江檔案》l999,7)
*劉家真認為第一、虛擬檔案是流動狀態下的檔案信息。“虛擬檔案是用來區別于?些客觀存在的檔案實體。”第二、“虛擬檔案與傳統檔案全然不同,也不完全等同于電子檔案。虛擬檔案不僅包括電子檔案,同時也包括了傳統檔案的數據化產物,虛擬檔案有更為廣泛的信息來源。”(《虛擬檔案》,《檔案學研究》1999.2)
分析上述觀點可以得知:從語義上講,與“虛擬”對應的詞應該是“現實”(物理),有的是完全虛構的,有的是對現實的“模擬”。虛擬、模擬的東西在現實中是不存在的,如虛擬法庭、虛擬課堂、虛擬醫院,還有汽車和飛機的電腦模擬培訓系統以及電子游戲中的種種虛擬環境等等,可以統稱為“虛擬現實”,而不是真的現實。這就是為什么只有“虛擬圖書館”,而沒有“虛擬圖書”的提法的原因。電子文件是一種實在,不能說它是虛擬的,紙質文件筆跡和電子文件中的信號都是一種實際存在,是一種mark(痕跡、記號),而不是一種意識。因此,把電子文件等同于虛擬文件是不恰當的。
1、重釋文件定義
關于文件的定義,有兩種基本的觀點:一種是傳統的,以1984年國際檔案理事會主持編纂的《檔案學術語詞典》對文件定義的表述為例:文件是由機構或個人在履行其法律義務時或在各種具體事務活動中形成或收到和保管的記錄信息,不管其形成和載體如何。
另一種是現代型定義。1997年國際檔案理事會所屬的電子文件委員會出版的《電子文件管理指南》給文件定義是:文件是由機構或個人在其活動的開始、進行和結束過程中所產生或接收的記錄信息。該記錄信息由足以為其活動提供憑證的內容、背景和結構所構成,而不管記錄的形式或載體。然后從文件這一概念出發定義了“電子文件”的概念。
1995年加拿大的信息管理標準和執行部的《文件管理框架》定義的文件概念是:文件必須只有內容、背景和結構,以便機構和個人能足以控制各種項目,支持各種項目,為項目的移交提供文件,進行各種操作,作出各種決定,及說明政府的活動行為等。其中,文件的背景指文件之間的關系以及文件與產生文件的活動之間的關系。文件的結構指文件的內容結構,即文件的篇章布局。
比較一下現代文件定義與傳統文件定義,可以看出:在文件形成者與形成原因方面二者沒有什么不同。而明顯不同的是:現代文件的定義更強調文件的構成及其憑證作用。發生這一變化的原因在于:傳統文件(主要是紙質文件)的各種組成要素是緊密結合在一起,并且能夠清晰的呈現出來,不需要我們分別地認識和管理它們。而現代文件(主要是電子文件)諸要素之間則是彼此分散的,容易出現一定的混亂和丟失,而且盡管它可能比傳統文件包含了更多的信息,其呈現也許比后者隱晦得多。因此,只有在這樣一種認識的基礎上,才能辨別它“丟失”了哪些關鍵性的信息以及需要補充記錄哪些信息,使它成為真正的文件,這也就是通常所說的電子文件管理的完整性要求。
2.關于電子文件的概念
“電子文件”(electronic records)也稱為“數字文件”(digitalrecords)。目前已有的幾種定義:
*“電子文件是通過數字計算機進行操作、傳遞和處理的文件。”----國際檔案理事會電子文件委員會,《電了文件管理指南》,l997
*“電子文件包括數字的、圖形的及文本的信息,它可以記錄在計算機能夠閱讀的任何一種介質上,并且符合文件的規定。”----《美同聯邦管理法規》,1992
*“其存儲形式只能由計算機處理的文件”。----《美國聯邦文件管理術語手冊》第二版,1993
*“所載信息的形式適合于數字計算機進行檢索、加工和交流的文件”。---- [澳]《記錄未來?電子文件管理的方針與政策》,1995
*“電子文件是由計算機交流與維護的文件。----“澳大利亞檔案館:《澳大利亞管理標準》,1997
*“以代碼形式記錄于磁帶、磁盤、光盤等載體,依賴計算機系統存取并可在通信網絡上傳送的數字代碼序列。”----《檔案工作基本術語》行業標準,報批稿,1999
*“能被計算機系統識別、處理、按一定格式存儲的磁帶、磁盤或光盤等介質上,并可在網上傳送的數字代碼序列”。----《電子文件歸檔與電子檔案管理規范》行業標準,報批稿,1999;----《CAD電子文件光盤存儲、歸檔與檔案管理要求》國家標準報批稿,l999
*“電子文件是電子文件的內容、電子文件內容的存儲載體和對電子文件內容的顯示、修改的電子計算機軟硬件平臺的組合”。----《電子文件歸檔與電子檔案管理概論》,中國檔案出版社,1999年
上述表述最為明顯的一點是技術含量很高,主要差異在于:用什么作屬概念。“文件”還是“數字代碼序列”?目前大部分國家均采用“文件”作為電子文件的屬概念,國際檔案理事會電子文件委員會的《電子文件管理指南》對“文件”和“電子文件”的界定充分體現了這一思想。
3.關于電子檔案的概念在國外學者的著述中,較多使用的是電子文件,但也有少數人使用電子檔案的提法。至于什么是電子檔案,目前的看法不盡相同,主要有以下幾種:
*“具有保存價值的已歸檔的電子文件及相應的支持軟件、參數和其他相關數據”。----《電子文件歸檔與電子檔案管理規范》
*國際檔案理事會電子文件委員會1997年出版的《電子文件管理指南》中把“檔案”接收和保存的電子文件稱為“具有檔案性質的電子文件“(archival electronic record)
*美國國家檔案館1995年重印的《電子文件管理指南》中把由檔案館接收和保存的電子文件直接稱為:“電子文件”;
*國際檔案理事會電子文件委員會1994年至1995年對全世界l00個檔案館關于電子文件管理的問卷調查,凡作為“檔案”接收和保存的電子文件均被稱為“電子文件”,而不稱“電子檔案”。
產生上述現象有兩個方面的原因:一是在電子環境中,文件和檔案的界限不像紙質文件與檔案那么清楚,索性全部稱為電子文件;二是目前電子文件的法律效力尚未得到全面的認可,電子文件尚未取得與“檔案”一樣的法律地位,但是,檔案館又不能等這些問題都解決了再來接收電子文件,因此,姑且把作為“檔案”接收和保管的電子文件稱為“具有檔案性質的電子文件”,這不僅是名稱上的變化,其中蘊涵著深刻的含義。
4.電子文件與機讀文件(machine- readable records)檔案工作者對于機讀文件這個詞一般都比較熟悉,隨著計算機技術的飛速發展,出現了電子文件一詞,在一段時間里,這兩個詞通用或混用,如第十三屆國際檔案大會的報告中,比爾曼用“電子文件”,而諾加雷用“機讀文件”,其實講的是一個東西。
“機讀文件”的概念最早產生于l 890年,當時是指配合一些簡單的電子機械設備而使用的穿孔卡片。20世紀40年代以后,隨著計算機的發明,機讀文件越來越多,漸漸地幾乎專指由計算機處理的文件。上世紀90年代以來,人們越來越多地使用“電子文件”這個概念,在一段時間里,“機讀文件”和“電子文件”幾乎是作為同義詞使用。
用“電子文件”取代“機讀文件”有其技術方面和社會方面的原因。從技術上講機讀的含義不夠確切,一些模擬信息也需要借助機器設備讀取,如唱片、錄音帶、錄像帶、縮微膠片等,而電子文件專指數字信息文件;同時機讀文件包括將編碼信號直接輸出的文件形式,如穿孔卡、穿孔帶等,而電子文件完全在電子環境中存活,其編碼和解碼完全在計算機中完成。
從社會上看,“機讀文件”和“電子文件”在社會屬性上的不同,主要包括(1)產生的工作環境不同。機讀文件產生于本世紀40年代,當時在檔案工作中,計算機僅僅被當作提高信息處理速度的工具,一般用以編制目錄、打印目錄和輔助檢索,文件及檔案產生的環境仍是紙質環境,管理上也仍采用手工管理方法。而電子文件產生的環境是典型的電子工作環境,計算機成為所有管理活動的平臺。(2)身份不同。機讀文件大多是在紙質文件輸入和輸出之間處理過程中產生的轉換性文件,還不是真正意義上的文件或檔案,人們只是關心它的信息屬性,并不強求它的原件屬性。在電子環境中,電子文件是唯一的文件,確認電子文件的憑證地位的要求日益強烈,打印出來的紙質文件反而成為電子文件的一種輔助形式。(3)兩者的名稱反映事物特點的深刻程度不同:機讀文件強調的是文件的閱讀方式,而電子文件是通過描述文件的存在形態來表征事物,更深刻地揭示事物的本質。(4)研究內容的廣度和深度不同。關于機讀文件的研究主要集中于編目、標引、檢索和保護等技術方面的內容,而圍繞電子文件展開的研究觸及了文件?檔案管理的全過程,以至影響到檔案學的思想和理論。
5.電子文件與虛擬文件(virtual records)
目前關于電子文件與虛擬文件的討論很多已見諸報刊,比較有代表性的觀點是:
*方榮認為:電子文件具有“虛幻性”或“虛擬性”,它沒有形狀,沒有規格,沒有記錄符號,看不見,摸不著,和人們頭腦中的思想、印象差不多。既是客觀存在的,又是虛幻的,或者說是虛擬的、假設的。磁帶、磁盤、光盤上的文件是什么樣的?無可知曉。電子文件的記錄方式既不使用文字也不使用圖像和符號,而是使用理論上所說的電磁感應、電脈沖。電子文件在哪里?它在記錄介質、電子計算機、程序三者結合的電子運動中,根本無法按傳統的方式獨立存在。(《電子文件的檔案學審視》,《檔案》1998.1)
*李晨生認為:電子文件也是信息與載體的統一體,它不僅僅是理性的、概念的,而且只有物理形態或曰實態(physical)。他認為:承認不承認電子文件的物理形態及物質屬性,實質上是辯證唯物主義還是形而上學來觀察事物的方法論問題。電子是一種運動著的物質,而非意識。雖然人眼不能直接看到它,但它確實具有物理的實態。由電子運動記錄下來的電子文件怎么能是沒有物理形態的虛擬文件呢?電子文件與紙質文件的根本區別不在于他們是否有實態,他們都具有物理的實態,只是他們的書寫、閱讀方式不同,信息的存儲載體不同而已。可以說,虛擬文件是計算機文件中的一種,不能概括全部的電子文件。(《電子檔案的方法論》,《中國檔案》1998.3)
*傅榮校認為:電子文件并不等于虛擬文件。虛擬文件是存在的,它主要是關系數據庫文件或超文本文件、表、多媒體系統。電子文件的“虛擬”性質實際上由兩方面的因素決定的:一是合成文件的邏輯表達式,二是“動態”數據單元。比如數據庫文件,它往往調動動態數據庫中存儲的數據單元以邏輯關系組合在一起。(《電子文件內容與載體關系變化后的變化》,《浙江檔案》l999,7)
*劉家真認為第一、虛擬檔案是流動狀態下的檔案信息。“虛擬檔案是用來區別于?些客觀存在的檔案實體。”第二、“虛擬檔案與傳統檔案全然不同,也不完全等同于電子檔案。虛擬檔案不僅包括電子檔案,同時也包括了傳統檔案的數據化產物,虛擬檔案有更為廣泛的信息來源。”(《虛擬檔案》,《檔案學研究》1999.2)
分析上述觀點可以得知:從語義上講,與“虛擬”對應的詞應該是“現實”(物理),有的是完全虛構的,有的是對現實的“模擬”。虛擬、模擬的東西在現實中是不存在的,如虛擬法庭、虛擬課堂、虛擬醫院,還有汽車和飛機的電腦模擬培訓系統以及電子游戲中的種種虛擬環境等等,可以統稱為“虛擬現實”,而不是真的現實。這就是為什么只有“虛擬圖書館”,而沒有“虛擬圖書”的提法的原因。電子文件是一種實在,不能說它是虛擬的,紙質文件筆跡和電子文件中的信號都是一種實際存在,是一種mark(痕跡、記號),而不是一種意識。因此,把電子文件等同于虛擬文件是不恰當的。