1、范圍
本標準根據(jù)國家檔案局《電子文件歸檔與管理規(guī)范》、《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》制定,適用于大連市各級檔案館(室)的數(shù)字化工作,其它單位可參照執(zhí)行。
2、基本術(shù)語解釋
2.1 數(shù)字化:指用計算機等設(shè)備和技術(shù)將檔案資料內(nèi)的信息轉(zhuǎn)換為數(shù)字信息的處理過程。
2.2 數(shù)字圖像:表示實物圖像的整數(shù)陣列。一個二維或更高維的采樣并量化的函數(shù),由相同維數(shù)的連續(xù)圖像產(chǎn)生。在矩陣(或其他)網(wǎng)絡(luò)上采樣――連續(xù)函數(shù),并在采樣點上將值最小化后的陣列。
2.3 圖像壓縮:清除圖像冗余或?qū)D像近似的任一種過程,其目的是對圖像以更緊湊的形式表示。
2.4 分辨率:指單位長度內(nèi)圖像包含的點數(shù)或像素數(shù),一般用每英寸點數(shù)(dpi)表示。
2.5 TIFF:標記圖像文件格式。一種基于標記的無損(不丟失信息)壓縮格式,用于在應(yīng)用程序之間和計算機平臺之間交換文件。
2.6 JPEG:聯(lián)合照片專家組。一種丟失少量信息的壓縮格式,尤其適用于屏幕和打印顯示,支持所有主要的計算機平臺和Web瀏覽器。JPEG格式文件小,影像質(zhì)量多數(shù)情況下均可接受。
2.7 灰度值:指進行灰度掃描時把圖像由純黑到純白整個色彩區(qū)域進行劃分的級數(shù),編輯圖像時一般都使用到8位,即256級灰度。
2.8 黑白二值圖像:是與彩色及灰度相對應(yīng)的一種模式,黑白圖在表示圖像時只區(qū)分黑白二值,它把其它色彩根據(jù)其特性轉(zhuǎn)換為黑白兩種,因此形成只有兩種顏色的圖像。
2.9 光學分辨率:指掃描儀光電轉(zhuǎn)換器件的物理精度。
3、基本原則
3.1 數(shù)字化對象的確定原則
應(yīng)當對所要進行數(shù)字化的對象按照一定的原則和方法進行確認,只有符合一定要求的檔案資料才能進行數(shù)字化。
1.1 檔案資料的數(shù)字化,必須符合國家檔案開放規(guī)定以及有關(guān)規(guī)定。
1.2 屬于歸檔范圍且應(yīng)當永久和長期保存的、社會利用價值高的檔案可列入數(shù)字化加工范圍。
3.2 安全原則
數(shù)字化過程中,采取有效措施,確保檔案安全;錄音、影像檔案數(shù)字化時必須遠離強磁場等外部干擾。
3.3 真實性、完整性原則
數(shù)字化過程中應(yīng)檢查檔案原載體質(zhì)量,確保數(shù)字信息的真實、完整。
4、紙質(zhì)檔案數(shù)字化基本要求
4.1 基本流程
紙質(zhì)檔案數(shù)字化的基本流程主要包括檔案整理、目錄建庫、檔案掃描、數(shù)據(jù)處理、數(shù)據(jù)存儲、數(shù)據(jù)檢驗、數(shù)據(jù)掛接、數(shù)據(jù)備份等環(huán)節(jié)。
4.1.1 檔案整理
對需要掃描的檔案進行適當整理,做出標識。
4.1.2 目錄建庫
為數(shù)字化的檔案檢索而建立必要的目錄數(shù)據(jù)庫。
4.1.3 檔案掃描
按照檔案數(shù)字化具體任務(wù)的整體安排按計劃分批次進行掃描。
4.1.4 數(shù)據(jù)處理
4.1.4.1 對掃描圖像進行校對,確保圖像完整無誤,并視需要對有問題的掃描圖像進行糾偏、去污、拼接等技術(shù)處理。
4.1.4.2 對裸數(shù)據(jù)進行驗收前的相應(yīng)處理,包括文件的格式轉(zhuǎn)換、邏輯分盤處理、添加說明性文件,以及數(shù)據(jù)的掛接、檢驗、上載、質(zhì)量檢查和備份。
4.1.5 數(shù)據(jù)存儲
根據(jù)不同的掃描圖像選擇適當數(shù)據(jù)格式、編碼方式和存儲介質(zhì)對信息進行保存。
4.2 檔案整理
在批量掃描之前,按下述步驟對檔案進行整理,視需要作出標識,確保檔案數(shù)字化質(zhì)量。
4.2.1 分件
4.2.1.1 把同一案卷中的掃描件和非掃描件分開,有正式文件的可以不掃描底稿,頁面破損嚴重的檔案,應(yīng)先進行技術(shù)修復。
4.2.1.2 在掃描件中將大圖插入指示頁,便于掃描工序批量掃描,進行圖像掃描時,替換指示頁。
4.2.1.3 對需要特殊處理的頁,標識清楚。
4.2.2 編號
對掃描前的檔案進行頁號、件號的標注。如在標注中與原檔案中的件數(shù)、頁號不一致,應(yīng)以此為準。
4.2.3 拆卷
去除檔案中原來的裝訂物,以便后續(xù)掃描工作的進行。
4.2.4 裝卷
按檔案保管要求恢復原裝訂,做到安全、準確、無遺漏。
4.2.5 檔案整理登記
制作并填寫數(shù)字化加工過程交接登記表。
4.3 建目錄庫
4.3.1 檔案著錄
根據(jù)《大連市文書檔案目錄數(shù)據(jù)庫交流標準》確定檔案著錄項,進行著錄,建立檔案目錄數(shù)據(jù)庫。
4.3.2 數(shù)據(jù)格式選擇
所選定的數(shù)據(jù)格式應(yīng)通用,能直接或間接通過XML文檔進行數(shù)據(jù)交換。
4.3.3 目錄輸入
將著錄好的目錄輸入計算機內(nèi),建立機讀目錄數(shù)據(jù)庫。
4.4 檔案掃描
4.4.1 掃描方式
紙質(zhì)檔案掃描可采用黑白二值圖像、灰度和彩色三種方式。
4.4.1.1 字跡清晰、不帶插圖的檔案,采用黑白模式掃描。
4.4.1.2 頁面為黑白兩色,但字跡清晰度較差或帶有插圖的檔案,以及頁面為多色文字的檔案,采用灰度模式掃描。
4.4.1.3 頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式掃描。
4.4.2 分辨率選擇
4.4.2.1 單色頁面檔案文件,掃描分辨率建議不低于200dpi。
4.4.2.2 彩色頁面檔案文件,掃描分辨率可選擇200dpi以上參數(shù)值進行。
4.4.2.3 大幅面檔案文件,如工程圖紙、報紙等尺寸超過A3的,可選用大幅面圖像掃描儀(如AO)、大幅面數(shù)碼平臺、縮微照相后膠片數(shù)字轉(zhuǎn)換,也可以采用小幅面掃描后的圖像拼接。掃描分辨率應(yīng)選擇200dpi以上。
4.4.2.4 需要時可根據(jù)原件的清晰度適當調(diào)整掃描分辨率。增減的多少以掃描后圖像按原尺寸顯示后是否清晰為準。
4.4.3 文件夾命名方式
文件夾命名方法,以檔案實體的檔號分級命名。
4.5 數(shù)據(jù)處理
4.5.1 圖像處理
4.5.1.1 糾偏
對掃描過程中出現(xiàn)的偏斜圖像進行糾偏處理,以達到視覺上基本不感覺偏斜為準。對方向不正確的圖像應(yīng)旋轉(zhuǎn)還原,以符合閱讀習慣。
4.5.1.2 去污
對影響圖像質(zhì)量的雜質(zhì),如黑點、黑線、黑框、黑邊等進行去污處理,處理過程應(yīng)遵循保證文件內(nèi)容完整的原則。
4.5.1.3 拼接
對大幅面檔案文件進行分區(qū)掃描后,應(yīng)進行圖像拼接處理,合并為一個完整的圖像,以保證檔案數(shù)字化圖像的整體性。
4.5.1.4 校對
4.5.1.4.1 一次校對,檢查掃描完的圖像質(zhì)量情況,對不合格的圖像進行標記,退回重新掃描。
4.5.1.4.2、糾錯處理,根據(jù)一次校對中提出的消除污漬、黑邊、偏斜等圖像質(zhì)量問題,對每份圖像進行相應(yīng)的處理。
4.5.1.4.3 二次校對,對一次校對及數(shù)據(jù)處理后的數(shù)字圖像再次進行檢查,并標記圖像處理過程中不清晰的頁面。不合格的退回重新處理。
4.6 數(shù)據(jù)存儲
數(shù)字信號的存儲管理應(yīng)保持原紙制檔案的保管模式對應(yīng)存儲。
4.6.1 壓縮存儲格式
黑白、灰度及彩色三種掃描方式的檔案數(shù)字圖像存儲統(tǒng)一采用TIFF文件格式。
4.7 數(shù)據(jù)檢驗
4.7.1 對數(shù)據(jù)進行檢驗,給出合格或不合格結(jié)論。
4.7.2 將數(shù)字加工后的數(shù)據(jù)轉(zhuǎn)換為裸數(shù)據(jù)光盤格式,拷貝到活動硬盤上。
4.7.3 系統(tǒng)應(yīng)自動記錄檢驗進度。
4.7.4 數(shù)據(jù)質(zhì)量檢查
4.7.4.1 文字錄入質(zhì)量
對錄入清單上所標明的各著錄項的文字錄入進行正確率控制;保證錯誤率低于3‰。
4.7.4.2 圖像質(zhì)量
對紙質(zhì)文件掃描后形成的圖像文件進行清晰度、污漬、黑邊、偏斜等問題的控制,以達到要求的圖像質(zhì)量。
保證掃描后的數(shù)字圖像清晰,便于清楚閱讀,適應(yīng)各種紙張和手寫、印刷字的情況。
4.7.5 認真填寫紙質(zhì)檔案數(shù)字化驗收登記表。
4.8 數(shù)據(jù)掛接
4.8.1 檔案條目數(shù)據(jù)與圖像文件的對應(yīng)準確程度的控制。
4.8.2 檔案數(shù)字化各工序的數(shù)據(jù)通過網(wǎng)絡(luò)及時上載到數(shù)據(jù)服務(wù)器端匯總,其中數(shù)字信號自動搜索對應(yīng)的目錄數(shù)據(jù),加入對應(yīng)的電子地址數(shù)字圖像文件名,建立起一一對應(yīng)的關(guān)系。
4.9 數(shù)據(jù)備份
4.9.1 定期對服務(wù)器的各類數(shù)據(jù)進行備份,防止數(shù)據(jù)丟失。
4.9.2 數(shù)據(jù)備份后應(yīng)在相應(yīng)的存儲載體上做好標簽,以便查找和管理。
4.9.3 填寫紙質(zhì)檔案數(shù)字化備份管理登記表。
5、照片檔案數(shù)字化基本要求
5.1 技術(shù)要求
5.1.1 前提條件:所有要進行數(shù)字化的檔案必須先按《大連市照片檔案目錄數(shù)據(jù)格式與著錄細則》進行著錄,編制好頁號。
5.1.2 掃描方式:照片按彩色和灰度兩種方式掃描。
5.1.3 分辨率:所使用掃描儀的光學分辨率必須大于或等于300dpi。
5.1.4 掃描辦法:對于所掃的照片,以常見5寸照片大小(12.5cmX8.5cm)為參照,統(tǒng)一采用300dpi;對于其它太大或太小的照片,掃描線數(shù)可作相應(yīng)的調(diào)整;對于一些涉及重要歷史事件和人物的照片,其掃描精度可在以上基礎(chǔ)上適當增加。
5.1.5 文件存儲類型:掃描后的照片以TIF格式存儲,采用LZW壓縮,存入一個統(tǒng)一的照片數(shù)據(jù)庫。
5.1.6 文件存儲方式:檔案照片存儲時按全宗、保管期限、相冊分級建文件夾保存,照片名字以照片號命名。
5.1.7 文件夾命名辦法:以照片檔案的檔號命名,全宗號5位,保管期限4位,冊號3位,照片張?zhí)?位。資料照片名字由資料號、照片所在的頁號、照片在該頁的幅號組成。資料號7位,頁號4位,幅號2位。
5.2 掃描要求
5.2.1 彩色照片采用彩色方式掃描,黑白照片采用灰度方式掃描。
5.2.2 掃描儀有光學分辨率和差值分辨率兩個常用技術(shù)參數(shù),其中光學分辨率反映的是硬件系統(tǒng)確實可以達到的清晰程度,是掃描儀自身性能的反映,因此我們在本標準中以它來要求。
5.2.3 掃描線數(shù)調(diào)整的具體方法為:比較要掃描照片與5寸照片大小的比例,假設(shè)待掃照片大小為5寸照片的N分之一,則掃描線數(shù)變?yōu)?寸照片的N倍,即Nx300dpi;相應(yīng)的,假設(shè)待掃照片為5寸照片的N倍大小,則我們的掃描線數(shù)可相應(yīng)變?yōu)?寸照片的N分之一,即300/N dpi。這樣,我們可達到最佳的精度/容量比,便于保存和利用。
6、錄音檔案數(shù)字化基本要求
錄音檔案數(shù)字化必須保證錄音檔案的真實性、完整性、有效性。在使用時必須保證數(shù)字化數(shù)據(jù)能從存儲載體中正確讀取,并能還原成聲音信號輸出。要進行數(shù)字化的檔案必須先按《大連市音像檔案目錄數(shù)據(jù)格式與著錄細則》進行著錄。
6.1 硬件要求
6.1.1 放音設(shè)備:放音設(shè)備必須能正確地將聲音源輸出。放音設(shè)備應(yīng)根據(jù)原載體型號進行選擇,如盒式錄放機、開盤式放音機等等。
6.1.2 計算機配置:應(yīng)選用性能穩(wěn)定配置較高的計算機作為數(shù)字化設(shè)備。
6.1.3 存儲設(shè)備:聲音信號可存儲在硬盤、磁帶或光盤上,如有必要,應(yīng)異地保存。
6.1.4 聲音卡:聲音卡(聲卡)是聲音數(shù)字化和數(shù)字化聲音轉(zhuǎn)換為可聽到的模擬信號的部件。聲音卡必須符合錄音檔案數(shù)字化要求的技術(shù)指標和功能。
6.1.4.1聲音卡的采樣頻率至少應(yīng)支持11.025kHz、22.05kHz、44.1kHz,最好支持48kHz。
6.1.4.2 聲音卡應(yīng)能夠支持多種聲源輸入,如CD Audio、MIDI、話筒、線性輸入等。
6.2 技術(shù)要求
6.2.1 存儲標準:聲音檔案數(shù)字化時要選用標準和通用的格式。本標準規(guī)定使用的聲音文件存儲標準為:WAV或MP3。
6.2.2 采樣頻率:聲音檔案數(shù)字化選用44.1kHz作為聲音采樣標準。對于DVD中的聲音選用48kHz。
7、影像檔案數(shù)字化基本要求
影像檔案數(shù)字化必須保證其真實性、有效性、完整性。在使用時必須保證數(shù)字化數(shù)據(jù)能從存儲介質(zhì)中正確讀取,并還原成影像信號輸出。要進行數(shù)字化的檔案必須先按《大連市音像檔案目錄數(shù)據(jù)格式與著錄細則》進行著錄。
7.1 硬件要求
7.1.1 放像設(shè)備:放像設(shè)備必須能正確地將影像信息源輸出。放像設(shè)備應(yīng)根據(jù)原載體型號進行選擇。
7.1.2 計算機配置:應(yīng)選用性能穩(wěn)定配置較高的計算機作為數(shù)字化設(shè)備。
7.1.3 存儲設(shè)備:影像信號除存儲在硬盤中隨機使用外,應(yīng)備份至磁帶或光盤上脫機保存,如有必要,應(yīng)異地保存。
7.1.4 視頻采集卡:視頻采集卡分為廣播級視頻采集卡,專業(yè)級視頻采集卡,民用級視頻采集卡。
7.1.5 壓縮卡:壓縮卡是影像檔案數(shù)字化的關(guān)鍵部件。壓縮卡必須符合影像檔案數(shù)字化要求的技術(shù)指標和功能。壓縮卡應(yīng)支持采集MPEG1和MPEG2。壓縮卡的碼流最高值至少應(yīng)為10MB。壓縮卡應(yīng)能夠支持多種影像源輸入。
7.1.6 編輯機:本標準推薦使用非線性編輯機。
7.2 技術(shù)要求
7.2.1 存儲標準:影像檔案數(shù)字化選用MPEG2格式作為影像存儲標準。
7.2.2 數(shù)據(jù)傳輸率:影像檔案數(shù)字化的數(shù)據(jù)傳輸率應(yīng)不低于4Mb/S。
本標準根據(jù)國家檔案局《電子文件歸檔與管理規(guī)范》、《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》制定,適用于大連市各級檔案館(室)的數(shù)字化工作,其它單位可參照執(zhí)行。
2、基本術(shù)語解釋
2.1 數(shù)字化:指用計算機等設(shè)備和技術(shù)將檔案資料內(nèi)的信息轉(zhuǎn)換為數(shù)字信息的處理過程。
2.2 數(shù)字圖像:表示實物圖像的整數(shù)陣列。一個二維或更高維的采樣并量化的函數(shù),由相同維數(shù)的連續(xù)圖像產(chǎn)生。在矩陣(或其他)網(wǎng)絡(luò)上采樣――連續(xù)函數(shù),并在采樣點上將值最小化后的陣列。
2.3 圖像壓縮:清除圖像冗余或?qū)D像近似的任一種過程,其目的是對圖像以更緊湊的形式表示。
2.4 分辨率:指單位長度內(nèi)圖像包含的點數(shù)或像素數(shù),一般用每英寸點數(shù)(dpi)表示。
2.5 TIFF:標記圖像文件格式。一種基于標記的無損(不丟失信息)壓縮格式,用于在應(yīng)用程序之間和計算機平臺之間交換文件。
2.6 JPEG:聯(lián)合照片專家組。一種丟失少量信息的壓縮格式,尤其適用于屏幕和打印顯示,支持所有主要的計算機平臺和Web瀏覽器。JPEG格式文件小,影像質(zhì)量多數(shù)情況下均可接受。
2.7 灰度值:指進行灰度掃描時把圖像由純黑到純白整個色彩區(qū)域進行劃分的級數(shù),編輯圖像時一般都使用到8位,即256級灰度。
2.8 黑白二值圖像:是與彩色及灰度相對應(yīng)的一種模式,黑白圖在表示圖像時只區(qū)分黑白二值,它把其它色彩根據(jù)其特性轉(zhuǎn)換為黑白兩種,因此形成只有兩種顏色的圖像。
2.9 光學分辨率:指掃描儀光電轉(zhuǎn)換器件的物理精度。
3、基本原則
3.1 數(shù)字化對象的確定原則
應(yīng)當對所要進行數(shù)字化的對象按照一定的原則和方法進行確認,只有符合一定要求的檔案資料才能進行數(shù)字化。
1.1 檔案資料的數(shù)字化,必須符合國家檔案開放規(guī)定以及有關(guān)規(guī)定。
1.2 屬于歸檔范圍且應(yīng)當永久和長期保存的、社會利用價值高的檔案可列入數(shù)字化加工范圍。
3.2 安全原則
數(shù)字化過程中,采取有效措施,確保檔案安全;錄音、影像檔案數(shù)字化時必須遠離強磁場等外部干擾。
3.3 真實性、完整性原則
數(shù)字化過程中應(yīng)檢查檔案原載體質(zhì)量,確保數(shù)字信息的真實、完整。
4、紙質(zhì)檔案數(shù)字化基本要求
4.1 基本流程
紙質(zhì)檔案數(shù)字化的基本流程主要包括檔案整理、目錄建庫、檔案掃描、數(shù)據(jù)處理、數(shù)據(jù)存儲、數(shù)據(jù)檢驗、數(shù)據(jù)掛接、數(shù)據(jù)備份等環(huán)節(jié)。
4.1.1 檔案整理
對需要掃描的檔案進行適當整理,做出標識。
4.1.2 目錄建庫
為數(shù)字化的檔案檢索而建立必要的目錄數(shù)據(jù)庫。
4.1.3 檔案掃描
按照檔案數(shù)字化具體任務(wù)的整體安排按計劃分批次進行掃描。
4.1.4 數(shù)據(jù)處理
4.1.4.1 對掃描圖像進行校對,確保圖像完整無誤,并視需要對有問題的掃描圖像進行糾偏、去污、拼接等技術(shù)處理。
4.1.4.2 對裸數(shù)據(jù)進行驗收前的相應(yīng)處理,包括文件的格式轉(zhuǎn)換、邏輯分盤處理、添加說明性文件,以及數(shù)據(jù)的掛接、檢驗、上載、質(zhì)量檢查和備份。
4.1.5 數(shù)據(jù)存儲
根據(jù)不同的掃描圖像選擇適當數(shù)據(jù)格式、編碼方式和存儲介質(zhì)對信息進行保存。
4.2 檔案整理
在批量掃描之前,按下述步驟對檔案進行整理,視需要作出標識,確保檔案數(shù)字化質(zhì)量。
4.2.1 分件
4.2.1.1 把同一案卷中的掃描件和非掃描件分開,有正式文件的可以不掃描底稿,頁面破損嚴重的檔案,應(yīng)先進行技術(shù)修復。
4.2.1.2 在掃描件中將大圖插入指示頁,便于掃描工序批量掃描,進行圖像掃描時,替換指示頁。
4.2.1.3 對需要特殊處理的頁,標識清楚。
4.2.2 編號
對掃描前的檔案進行頁號、件號的標注。如在標注中與原檔案中的件數(shù)、頁號不一致,應(yīng)以此為準。
4.2.3 拆卷
去除檔案中原來的裝訂物,以便后續(xù)掃描工作的進行。
4.2.4 裝卷
按檔案保管要求恢復原裝訂,做到安全、準確、無遺漏。
4.2.5 檔案整理登記
制作并填寫數(shù)字化加工過程交接登記表。
4.3 建目錄庫
4.3.1 檔案著錄
根據(jù)《大連市文書檔案目錄數(shù)據(jù)庫交流標準》確定檔案著錄項,進行著錄,建立檔案目錄數(shù)據(jù)庫。
4.3.2 數(shù)據(jù)格式選擇
所選定的數(shù)據(jù)格式應(yīng)通用,能直接或間接通過XML文檔進行數(shù)據(jù)交換。
4.3.3 目錄輸入
將著錄好的目錄輸入計算機內(nèi),建立機讀目錄數(shù)據(jù)庫。
4.4 檔案掃描
4.4.1 掃描方式
紙質(zhì)檔案掃描可采用黑白二值圖像、灰度和彩色三種方式。
4.4.1.1 字跡清晰、不帶插圖的檔案,采用黑白模式掃描。
4.4.1.2 頁面為黑白兩色,但字跡清晰度較差或帶有插圖的檔案,以及頁面為多色文字的檔案,采用灰度模式掃描。
4.4.1.3 頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式掃描。
4.4.2 分辨率選擇
4.4.2.1 單色頁面檔案文件,掃描分辨率建議不低于200dpi。
4.4.2.2 彩色頁面檔案文件,掃描分辨率可選擇200dpi以上參數(shù)值進行。
4.4.2.3 大幅面檔案文件,如工程圖紙、報紙等尺寸超過A3的,可選用大幅面圖像掃描儀(如AO)、大幅面數(shù)碼平臺、縮微照相后膠片數(shù)字轉(zhuǎn)換,也可以采用小幅面掃描后的圖像拼接。掃描分辨率應(yīng)選擇200dpi以上。
4.4.2.4 需要時可根據(jù)原件的清晰度適當調(diào)整掃描分辨率。增減的多少以掃描后圖像按原尺寸顯示后是否清晰為準。
4.4.3 文件夾命名方式
文件夾命名方法,以檔案實體的檔號分級命名。
4.5 數(shù)據(jù)處理
4.5.1 圖像處理
4.5.1.1 糾偏
對掃描過程中出現(xiàn)的偏斜圖像進行糾偏處理,以達到視覺上基本不感覺偏斜為準。對方向不正確的圖像應(yīng)旋轉(zhuǎn)還原,以符合閱讀習慣。
4.5.1.2 去污
對影響圖像質(zhì)量的雜質(zhì),如黑點、黑線、黑框、黑邊等進行去污處理,處理過程應(yīng)遵循保證文件內(nèi)容完整的原則。
4.5.1.3 拼接
對大幅面檔案文件進行分區(qū)掃描后,應(yīng)進行圖像拼接處理,合并為一個完整的圖像,以保證檔案數(shù)字化圖像的整體性。
4.5.1.4 校對
4.5.1.4.1 一次校對,檢查掃描完的圖像質(zhì)量情況,對不合格的圖像進行標記,退回重新掃描。
4.5.1.4.2、糾錯處理,根據(jù)一次校對中提出的消除污漬、黑邊、偏斜等圖像質(zhì)量問題,對每份圖像進行相應(yīng)的處理。
4.5.1.4.3 二次校對,對一次校對及數(shù)據(jù)處理后的數(shù)字圖像再次進行檢查,并標記圖像處理過程中不清晰的頁面。不合格的退回重新處理。
4.6 數(shù)據(jù)存儲
數(shù)字信號的存儲管理應(yīng)保持原紙制檔案的保管模式對應(yīng)存儲。
4.6.1 壓縮存儲格式
黑白、灰度及彩色三種掃描方式的檔案數(shù)字圖像存儲統(tǒng)一采用TIFF文件格式。
4.7 數(shù)據(jù)檢驗
4.7.1 對數(shù)據(jù)進行檢驗,給出合格或不合格結(jié)論。
4.7.2 將數(shù)字加工后的數(shù)據(jù)轉(zhuǎn)換為裸數(shù)據(jù)光盤格式,拷貝到活動硬盤上。
4.7.3 系統(tǒng)應(yīng)自動記錄檢驗進度。
4.7.4 數(shù)據(jù)質(zhì)量檢查
4.7.4.1 文字錄入質(zhì)量
對錄入清單上所標明的各著錄項的文字錄入進行正確率控制;保證錯誤率低于3‰。
4.7.4.2 圖像質(zhì)量
對紙質(zhì)文件掃描后形成的圖像文件進行清晰度、污漬、黑邊、偏斜等問題的控制,以達到要求的圖像質(zhì)量。
保證掃描后的數(shù)字圖像清晰,便于清楚閱讀,適應(yīng)各種紙張和手寫、印刷字的情況。
4.7.5 認真填寫紙質(zhì)檔案數(shù)字化驗收登記表。
4.8 數(shù)據(jù)掛接
4.8.1 檔案條目數(shù)據(jù)與圖像文件的對應(yīng)準確程度的控制。
4.8.2 檔案數(shù)字化各工序的數(shù)據(jù)通過網(wǎng)絡(luò)及時上載到數(shù)據(jù)服務(wù)器端匯總,其中數(shù)字信號自動搜索對應(yīng)的目錄數(shù)據(jù),加入對應(yīng)的電子地址數(shù)字圖像文件名,建立起一一對應(yīng)的關(guān)系。
4.9 數(shù)據(jù)備份
4.9.1 定期對服務(wù)器的各類數(shù)據(jù)進行備份,防止數(shù)據(jù)丟失。
4.9.2 數(shù)據(jù)備份后應(yīng)在相應(yīng)的存儲載體上做好標簽,以便查找和管理。
4.9.3 填寫紙質(zhì)檔案數(shù)字化備份管理登記表。
5、照片檔案數(shù)字化基本要求
5.1 技術(shù)要求
5.1.1 前提條件:所有要進行數(shù)字化的檔案必須先按《大連市照片檔案目錄數(shù)據(jù)格式與著錄細則》進行著錄,編制好頁號。
5.1.2 掃描方式:照片按彩色和灰度兩種方式掃描。
5.1.3 分辨率:所使用掃描儀的光學分辨率必須大于或等于300dpi。
5.1.4 掃描辦法:對于所掃的照片,以常見5寸照片大小(12.5cmX8.5cm)為參照,統(tǒng)一采用300dpi;對于其它太大或太小的照片,掃描線數(shù)可作相應(yīng)的調(diào)整;對于一些涉及重要歷史事件和人物的照片,其掃描精度可在以上基礎(chǔ)上適當增加。
5.1.5 文件存儲類型:掃描后的照片以TIF格式存儲,采用LZW壓縮,存入一個統(tǒng)一的照片數(shù)據(jù)庫。
5.1.6 文件存儲方式:檔案照片存儲時按全宗、保管期限、相冊分級建文件夾保存,照片名字以照片號命名。
5.1.7 文件夾命名辦法:以照片檔案的檔號命名,全宗號5位,保管期限4位,冊號3位,照片張?zhí)?位。資料照片名字由資料號、照片所在的頁號、照片在該頁的幅號組成。資料號7位,頁號4位,幅號2位。
5.2 掃描要求
5.2.1 彩色照片采用彩色方式掃描,黑白照片采用灰度方式掃描。
5.2.2 掃描儀有光學分辨率和差值分辨率兩個常用技術(shù)參數(shù),其中光學分辨率反映的是硬件系統(tǒng)確實可以達到的清晰程度,是掃描儀自身性能的反映,因此我們在本標準中以它來要求。
5.2.3 掃描線數(shù)調(diào)整的具體方法為:比較要掃描照片與5寸照片大小的比例,假設(shè)待掃照片大小為5寸照片的N分之一,則掃描線數(shù)變?yōu)?寸照片的N倍,即Nx300dpi;相應(yīng)的,假設(shè)待掃照片為5寸照片的N倍大小,則我們的掃描線數(shù)可相應(yīng)變?yōu)?寸照片的N分之一,即300/N dpi。這樣,我們可達到最佳的精度/容量比,便于保存和利用。
6、錄音檔案數(shù)字化基本要求
錄音檔案數(shù)字化必須保證錄音檔案的真實性、完整性、有效性。在使用時必須保證數(shù)字化數(shù)據(jù)能從存儲載體中正確讀取,并能還原成聲音信號輸出。要進行數(shù)字化的檔案必須先按《大連市音像檔案目錄數(shù)據(jù)格式與著錄細則》進行著錄。
6.1 硬件要求
6.1.1 放音設(shè)備:放音設(shè)備必須能正確地將聲音源輸出。放音設(shè)備應(yīng)根據(jù)原載體型號進行選擇,如盒式錄放機、開盤式放音機等等。
6.1.2 計算機配置:應(yīng)選用性能穩(wěn)定配置較高的計算機作為數(shù)字化設(shè)備。
6.1.3 存儲設(shè)備:聲音信號可存儲在硬盤、磁帶或光盤上,如有必要,應(yīng)異地保存。
6.1.4 聲音卡:聲音卡(聲卡)是聲音數(shù)字化和數(shù)字化聲音轉(zhuǎn)換為可聽到的模擬信號的部件。聲音卡必須符合錄音檔案數(shù)字化要求的技術(shù)指標和功能。
6.1.4.1聲音卡的采樣頻率至少應(yīng)支持11.025kHz、22.05kHz、44.1kHz,最好支持48kHz。
6.1.4.2 聲音卡應(yīng)能夠支持多種聲源輸入,如CD Audio、MIDI、話筒、線性輸入等。
6.2 技術(shù)要求
6.2.1 存儲標準:聲音檔案數(shù)字化時要選用標準和通用的格式。本標準規(guī)定使用的聲音文件存儲標準為:WAV或MP3。
6.2.2 采樣頻率:聲音檔案數(shù)字化選用44.1kHz作為聲音采樣標準。對于DVD中的聲音選用48kHz。
7、影像檔案數(shù)字化基本要求
影像檔案數(shù)字化必須保證其真實性、有效性、完整性。在使用時必須保證數(shù)字化數(shù)據(jù)能從存儲介質(zhì)中正確讀取,并還原成影像信號輸出。要進行數(shù)字化的檔案必須先按《大連市音像檔案目錄數(shù)據(jù)格式與著錄細則》進行著錄。
7.1 硬件要求
7.1.1 放像設(shè)備:放像設(shè)備必須能正確地將影像信息源輸出。放像設(shè)備應(yīng)根據(jù)原載體型號進行選擇。
7.1.2 計算機配置:應(yīng)選用性能穩(wěn)定配置較高的計算機作為數(shù)字化設(shè)備。
7.1.3 存儲設(shè)備:影像信號除存儲在硬盤中隨機使用外,應(yīng)備份至磁帶或光盤上脫機保存,如有必要,應(yīng)異地保存。
7.1.4 視頻采集卡:視頻采集卡分為廣播級視頻采集卡,專業(yè)級視頻采集卡,民用級視頻采集卡。
7.1.5 壓縮卡:壓縮卡是影像檔案數(shù)字化的關(guān)鍵部件。壓縮卡必須符合影像檔案數(shù)字化要求的技術(shù)指標和功能。壓縮卡應(yīng)支持采集MPEG1和MPEG2。壓縮卡的碼流最高值至少應(yīng)為10MB。壓縮卡應(yīng)能夠支持多種影像源輸入。
7.1.6 編輯機:本標準推薦使用非線性編輯機。
7.2 技術(shù)要求
7.2.1 存儲標準:影像檔案數(shù)字化選用MPEG2格式作為影像存儲標準。
7.2.2 數(shù)據(jù)傳輸率:影像檔案數(shù)字化的數(shù)據(jù)傳輸率應(yīng)不低于4Mb/S。