錄音檔案是一種重要的檔案資源。目前,在我國(guó),錄音檔案主要是錄音磁帶檔案,使用模擬記錄方式記錄音頻信號(hào),聲音的頻率是從20HZ到20KHZ左右。錄音磁帶屬于磁性載體。磁性載體檔案的耐久性除與磁性載體的理化性質(zhì)有關(guān)外,還強(qiáng)烈地依賴記錄和重現(xiàn)設(shè)備,屬于機(jī)讀檔案,即讀取其內(nèi)容必須依賴相應(yīng)的設(shè)備。1996年1月1日,國(guó)家檔案局頒布了《磁性載體檔案的管理與保護(hù)規(guī)范》,詳細(xì)地規(guī)定了磁性載體檔案的保存環(huán)境、管理制度以及磁性載體檔案的修復(fù)等。整體而言,錄音磁帶檔案的保存成本是比較高的。使用錄音磁帶保存聲音檔案,即使嚴(yán)格遵守磁性載體檔案的保存環(huán)境、管理制度,因?yàn)槭褂玫氖悄M記錄方式,為保證其信息長(zhǎng)遠(yuǎn)流傳下去,每隔10年需要進(jìn)行一次復(fù)制,這會(huì)使聲音檔案的信息損失10%左右。同時(shí),傳統(tǒng)的錄音檔案存儲(chǔ)方式也不利于檔案的檢索和查閱。
數(shù)字音頻的發(fā)展,使我們可以用數(shù)字而不再用模擬的方式表示音頻信息。因?yàn)閷?duì)于模擬音頻信號(hào),每一次的轉(zhuǎn)錄和播放都會(huì)對(duì)信號(hào)產(chǎn)生失真和噪音,這就不可避免地降低了模擬音頻信號(hào)的質(zhì)量。與模擬音頻相比,數(shù)字音頻信號(hào)先將原始的模擬音頻信號(hào)轉(zhuǎn)換為二進(jìn)制數(shù)據(jù),再進(jìn)行處理、存儲(chǔ)和發(fā)送,在處理時(shí)很少會(huì)引入噪聲,因此減少了音頻信號(hào)質(zhì)量降低的幾率,可使音質(zhì)達(dá)到CD音質(zhì)的水平。 數(shù)字音頻將聲音信號(hào)用一系列離散數(shù)字來(lái)描述,它通過(guò)對(duì)模擬音頻信號(hào)進(jìn)行取樣和量化取得,對(duì)采樣后的音頻信號(hào)進(jìn)行編碼和壓縮后可以得到各種格式的數(shù)字音頻信號(hào)。
目前,數(shù)字音頻的格式很多,其中最流行的標(biāo)準(zhǔn)數(shù)字音頻格式有mp3、wav、wma、real audio等,這些標(biāo)準(zhǔn)的格式能夠以高音質(zhì)、低采樣率對(duì)數(shù)字音頻文件進(jìn)行壓縮。換句話說(shuō),采用這些格式處理錄音檔案并經(jīng)過(guò)應(yīng)用數(shù)字水印技術(shù)防篡改后存儲(chǔ)在光盤(pán)上,相對(duì)于傳統(tǒng)的方式而言,因?yàn)閿?shù)字音頻的復(fù)制在理論上不會(huì)產(chǎn)生任何衰減,不會(huì)產(chǎn)生失真和噪聲,能夠在音質(zhì)丟失很小的情況下(人耳根本無(wú)法察覺(jué)這種音質(zhì)損失)把文件壓縮到更小的程度,因而具有很大的優(yōu)越性。 另外,數(shù)字音頻錄放設(shè)備采用數(shù)字電路,其在設(shè)計(jì)和制造上成本低,且不受溫度等因素的影響,極大地增強(qiáng)了可靠性。而且,數(shù)字音頻的檢索和查詢方式相對(duì)于模擬系統(tǒng)有強(qiáng)大的優(yōu)勢(shì),可以實(shí)現(xiàn)聲音檔案信息管理的自動(dòng)化和網(wǎng)絡(luò)化。
總之,在理論和實(shí)踐上,對(duì)檔案工作而言,數(shù)字音頻存儲(chǔ)系統(tǒng)有巨大的優(yōu)勢(shì),在成本上和保真性能上都超過(guò)模擬系統(tǒng)。以數(shù)字記錄方式記錄聲音檔案將是今后的發(fā)展方向,就是因?yàn)閿?shù)字音頻具有模擬音頻不可比擬的優(yōu)勢(shì),不易產(chǎn)生信號(hào)的損失。今后,隨著聲音錄放設(shè)備的數(shù)字化,將出現(xiàn)越來(lái)越多的數(shù)字音頻檔案。對(duì)原有的聲音檔案進(jìn)行數(shù)字化加工就會(huì)成為檔案館工作內(nèi)容之一。 要注意的是,我們?cè)趯⒃新曇魴n案轉(zhuǎn)化為數(shù)字音頻檔案的工作中,除了采用一定的安全手段及一定標(biāo)準(zhǔn)的數(shù)據(jù)格式外,還必須使用數(shù)據(jù)庫(kù)技術(shù),建立音頻檔案數(shù)據(jù)庫(kù),以便于實(shí)現(xiàn)音頻檔案數(shù)據(jù)查閱和檢索。
目前投入使用的數(shù)字音頻檔案數(shù)據(jù)庫(kù),主要是基于文件的多媒體數(shù)據(jù)庫(kù)。這種基于文件的多媒體數(shù)據(jù)庫(kù)主要形式是超文本(hyper-text)或超媒體(hyper-media),用于多媒體數(shù)據(jù)庫(kù)以外部文件的形式存儲(chǔ)于硬盤(pán)、光盤(pán)或網(wǎng)絡(luò)上的環(huán)境。這一方法并不是把實(shí)際的多媒體信息存在數(shù)據(jù)庫(kù)中,而是將包含多媒體信息文件的名字與位置存入數(shù)據(jù)庫(kù)中。因而,在對(duì)原有聲音檔案重新進(jìn)行整理時(shí),如何對(duì)數(shù)字音頻檔案建立滿足檔案要求的標(biāo)準(zhǔn)數(shù)據(jù)庫(kù),是檔案部門(mén)今后要探索研究的課題。
如果簡(jiǎn)單歸納一下對(duì)錄音檔案進(jìn)行數(shù)字化的過(guò)程,即1、用嵌入式系統(tǒng)設(shè)計(jì)一個(gè)檔案專用設(shè)備對(duì)現(xiàn)有聲音檔案進(jìn)行數(shù)字化處理,它采用mp3標(biāo)準(zhǔn)對(duì)數(shù)字音頻進(jìn)行壓縮;2、采用數(shù)字水印技術(shù)對(duì)數(shù)字音頻檔案提供安全手段、防止篡改,保持檔案信息的原始性、可靠性和長(zhǎng)期可讀性;3、采用光盤(pán)存儲(chǔ)技術(shù)將其刻錄在光盤(pán)上;4、在此基礎(chǔ)上按照檔案的編目規(guī)定建立適當(dāng)?shù)臉?biāo)準(zhǔn)數(shù)據(jù)庫(kù),實(shí)現(xiàn)聲音檔案的數(shù)字化管理。
作者:山東省檔案局、山東大學(xué)信息學(xué)院 孫洪魯 王洪君 石鈞
摘自:《中國(guó)檔案》