一、 紙質(zhì)檔案數(shù)字化相關(guān)參數(shù)定義:
l 黑白二值圖像:只有黑白兩級(jí)灰度的數(shù)字圖像。它對(duì)應(yīng)于黑和白兩種狀態(tài)的文字稿、線條圖等。
l 連續(xù)色調(diào)靜態(tài)圖像:以多于兩級(jí)灰度的不同濃淡層次或以不同顏色通道組合成的靜態(tài)數(shù)字圖像。在紙質(zhì)檔案數(shù)字化過(guò)程中,通常表現(xiàn)為灰度掃描和彩色掃描兩種模式。
l 圖像壓縮:清除圖像冗余或?qū)D像近似的任一種過(guò)程,其目的是對(duì)圖象以更緊湊的形式表示。紙質(zhì)檔案數(shù)字化過(guò)程中,較常見(jiàn)的有TIFF(G4)、JPEG等壓縮格式。
l 分辨率:單位長(zhǎng)度內(nèi)圖像包含的點(diǎn)數(shù)或像素?cái)?shù),一般用每英寸點(diǎn)數(shù)(dpi)表示
二、 根據(jù)對(duì)象不同情況如何選擇掃描參數(shù)
l 頁(yè)面為黑白兩色,并且字跡清晰、不帶插圖的檔案.可采用黑白二值模式進(jìn)行掃描。
l 頁(yè)面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁(yè)面為多色文字的檔案,可以采用灰度模式掃描。
l 頁(yè)面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式進(jìn)行掃描。(建議)
l 掃描分辨率參數(shù)大小的選擇,原則上以掃描后的圖像清晰、完整、不影響圖像的利用效果為準(zhǔn)。
l 采用黑白二值、灰度、彩色幾種模式對(duì)檔案進(jìn)行掃描時(shí),其分辨率一般均建議選擇大于或等于200dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當(dāng)提高分辨率。
三、 掃描圖像的處理
l 圖像命名:以檔案實(shí)體中的檔號(hào)命名 ,如全宗號(hào)-目錄號(hào)-案卷號(hào)-文件順序號(hào)-頁(yè)號(hào),位數(shù)符合機(jī)讀目錄實(shí)際位數(shù)。
l 糾偏:對(duì)出現(xiàn)偏斜的圖像進(jìn)行糾偏處理,保證數(shù)字圖像的偏斜角度小于1度(圖像偏斜不超過(guò)頁(yè)面內(nèi)三分之一個(gè)文字)
l 去污:檔案數(shù)字化圖像的去污遵循不影響可讀度的前提下展現(xiàn)原貌的原則,去除數(shù)字圖像中影響可讀度的雜質(zhì),包括局部去污,如去除黑點(diǎn)、黑線、黑框;整體去污,去除頁(yè)面上的污漬
l 拼接:為保證檔案數(shù)字化圖像的整體性,對(duì)幅面分離的數(shù)字圖像進(jìn)行拼接
l 裁邊處理:采用彩色模式掃描的圖像應(yīng)進(jìn)行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節(jié)省存儲(chǔ)空間。
l 合并:使用工具把掃描的多個(gè)單頁(yè)圖像文件合并成一個(gè)多頁(yè)圖像文件
四、 存儲(chǔ)格式
l 采用黑白二值模式掃描的圖像文件,一般采用TIFF(G4)格式存儲(chǔ)。采用灰度模式和彩色模式掃描的文件,一般采用JPEG格式存儲(chǔ)。存儲(chǔ)時(shí)的壓縮率的選擇,應(yīng)以保證掃描的圖像清晰可讀的前提下,盡量減小存儲(chǔ)容量為準(zhǔn)則。
l 提供網(wǎng)絡(luò)查詢的掃描圖像,存儲(chǔ)為多頁(yè)PDF,或多頁(yè)TIFF(G4)格式,如果一份紙制文件數(shù)字化后分別存在TIFF格式和JPEG格式的圖像文件,用PDF格式進(jìn)行合并,并保持其中的圖像頁(yè)原有壓縮算法不變。