广西壮族自治区纸质档案数字化技术要求
(试行)
本规定对纸质档案数字化的工作流程提出具体的技术要求,适用于档案馆(室)纸质档案的数字化加工、验收及数据管理。
本规定依据国家行业标准 DA/T 31—2005《纸质档案数字化技术规范》而制定。
1 纸质档案数字化基本要求 1.1 加工范围
档案数字化加工的范围为永久或长期保存的、社会利用价值高的档案。 1.2 基本环节
纸质档案数字化的基本环节为:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份、数据管理等。 1.3 过程管理
1.31 建立档案数字化加工安全保密管理制度,确保档案原件和数字化档案信息的安全。
1.32 建立档案数字化的台帐制度,在档案数字化各环节均进行详细登记,以备查考。 2 档案整理
1
在档案进行数字化扫描前,应对档案进行整理,确保档案数字化质量。 2.1 目录审核
目录审核是根据档案的实际情况,按照《档案著录规则》(DA/T 18)等要求,规范档案目录著录内容,核实目录的准确性。如有不规范或错误的文件题名、责任者、档号、起止页号和页数等,应对目录进行修改,为建立目录数据库做准备;已建立目录数据库的,则依据档案实体对目录数据进行检查核实和修改。 2.2 鉴定扫描件和非扫描件
制定扫描件和非扫描件的范围,按要求把同一案卷中的扫描件和非扫描件区分开。原则上重份文件、有正文的底稿或档案经过鉴定后不列入扫描范围的属于非扫描件。 2.3 拆件和装订
以不损伤档案原件为前提,尽量拆除档案装订物,以免影响扫描质量。如拆除装订物可能会对档案原件造成损伤的,应保持原装订。 扫描工作完成后,应进行档案清点,做到准确、无遗漏;拆除过装订物的档案应按原档案卷内文件的排列顺序进行排列,恢复装订,或根据工作需要改变原装订方法。 2.4 页面修整
对已确定扫描的档案进行页面情况检查,页面破损严重,无法直接进行扫描的,应先进行页面修复;页面折皱不平,影响扫描质量的,应先压平或熨平后再进行扫描。
2
2.5 档案整理登记
制作档案整理工作登记表,对档案整理的过程一一进行登记,包括目录审核修改情况,扫描件和非扫描件鉴定情况,页面修整情况等,作为数字化其他工作环节的依据(登记表格参见附表A)。 3 档案扫描 3.1 扫描方式
3.1.1 根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。大幅面档案可采用大幅面平板直接扫描,或采用缩微拍摄后胶片转数字化。没相应设备的一般采用小幅面扫描后进行图像拼接的方式处理。
3.1.2 纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式。 3.1.3 扫描方式的选择以不损伤档案原件为原则。 3.2 扫描色彩模式
3.2.1 扫描色彩模式有黑白二值、灰度、彩色等。
3.2.2 用黑白二值模式扫描,形成的图像文件所占用的空间较小,适用于页面为黑白两色,字迹清晰,不带插图的档案。
3.2.3 灰度模式适用于页面为黑白两色,但字迹清晰度差,或带有插图的档案,以及页面为多色文字的档案。
3
3.2.4 彩色模式扫描形成的图像文件所占用的空间较大,但能直接反映档案的原貌,用途广泛,并且可根据需要把彩色图像转换成黑白二值或灰度。页面有红头、印章或有照片、彩色插图的档案应采用彩色模式。 3.3 扫描分辨率
3.3.1 扫描分辨率参数大小的选择,应以扫描后的图像清晰、完整,不影响图像的利用效果为准。
3.3.2 不论采用何种色彩模式,一般情况下,扫描分辨率大于或等于100dpi即可。如果档案文字偏小、密集、清晰度差等,可适当提高分辨率。
3.3.3 需要进行OCR汉字识别的档案,扫描分辨率应大于或等于200dpi。 3.4 扫描登记
登记扫描档案的页数、色彩模式、分辨率等,如需要进行OCR识别的档案应注明。在登记的同时应注意核对每份文件的实际扫描页数与档案整理登记单填写扫描件的页数是否一致,发现漏扫或错扫时应及时补扫,并在登记表上注明原因和处理方法(登记表格参见附表A)。 4. 图像处理 4.1 图像质量检查
4.1.1 图像质量应达到以下要求:图像完整、清晰,无影响图片美观的黑边和污点,图像不偏斜或倒置,符合正常阅读习惯。
4
4.1.2 检查图像的偏斜度、清晰度以及完整性,发现不符合图像质量要求的应进行图像处理;因操作不当造成图像不完整或无法清晰识别时,应重新进行扫描。
4.1.3 扫描图像的排列顺序与档案原件一致,发现不一致时应进行调整;发现文件漏扫时,应及时补扫并正确插入图像。 4.2 纠偏
对出现偏斜的图像应进行纠偏处理,以达到视觉上不感觉偏斜为准。对方向不正确的图像进行旋转还原,以符合阅读习惯。 4.3 去污
对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边等应进行去污处理,在不影响文字可懂度的前提下展现档案原貌。 4.4 图像拼接
对大幅面档案采用分区小幅面扫描后,形成的多幅图像,应进行拼接处理,合成为一个完整的图像,拼接后应与档案原件核实,确保拼接无误,保证数字化图像的整体性。 4.5 裁边
为缩小图像文件容量,节省存储空间,扫描的图像应去除图像无内容、多余的边。 5 图像存储 5.1 图像存储格式
5