1、档案背景概述
档案是过去和现在的国家机构、社会组织以及个人从事政治、军事、经济、科学、技术、文化、宗教等活动直接形成的对国家和社会有保存价值的各种文字、图表、声像等不同形式的历史记录。
与传统载体、原子形式的档案相比,数字化形式的档案的最大特点是能够通过网络迅速流动。数字档案馆的研究和建设将彻底改变档案的利用方式,冲破档案利用的种种局限,使档案馆从封闭走向开放,为政府决策、企业经营服务,做到"科技服务档案,档案服务经济"。
数字档案馆是具有管理数字化档案能力的一个系统,是综合性档案馆的组成部分,它能够全方位、全过程地对数字档案进行管理,并能够为所属地区立档单位提供数字档案管理服务。数字档案馆包括行政组织、管理规范和支撑其运作的计算机网络应用系统。
通过数字档案馆,档案信息价值可以得到充分体现。数字档案馆的建设将促使综合性档案馆从档案的保管和利用职能向信息采集、管理和信息服务方面职能转变。
数字档案馆是档案从库存资料向信息资源转换的中间站,也是档案信息化、产业化的支撑平台。数字化档案馆主要是强调馆藏的数字化,将数字化的档案信息上网提供利用,是建设数字档案馆的的基础,是建设数字档案馆必不可少的前期准备工作,是构成数字档案馆的一部分。
国家十五计划已对数字化档案馆的建设提出了明确要求和具体实施步骤,这标志着中国数字化档案馆建设工程已进入具体实施阶段,这是一项充满创新和挑战的工程,需要社会各界广泛参与,从而使中国档案管理现代化的步伐跟上世界发展的脚步。
在国家档案局档案科学研究所的指导下,北京汉王科技公司与汉王公司联合推出包括数字档案资源建设、数字档案管理利用两个重要环节的数字化档案馆应用方案。
2、数字档案馆工作流程说明
(1)档案整理检查档案资料是否存在差错,资料是否齐全。档案资料的准备在扫描作业中是很重要的工作。它需要将档案资料进行整理,以方便快速连续扫描及建档作业,资料破损亦需事先修补。档案的整理工作应该由专门人员进行,按有关部门要求进行整理,按档案的类别、时间进行分类,减少索引的工作量。
(2)扫描加工
扫描人员登录,系统会自动记录其扫描员工号,连同系统时间,自动导入到数据库中,此数据和原始数据库系统数据关联,建立电子影像和原始数据库的一 —对应关系,避免二次录入,同时方便定位原始数据库的物理存放位置。
(3) 质量检查
对于扫描好的图像,由质量检查人员进行把关,检查扫描影像质量是否符合最终存储归档标准。对在高速扫描过程中出现的不合格图像做人工处理。如果发现漏页、重张等问题,要求及时补扫或在系统中删除重张那页。对于扫描影像不清晰的,在影像问题记录单上记录并重新扫描。当发现有不符合规则的图像,利用系统提供的功能,对扫描好的图像进行修改或更正。
(4)建立索引
建索引的目的是说明电子影像所代表的意义,方便以后查询,该系统是从键盘人工输入索引信息。鉴于要处理文档资料的不同分类(馆藏档案资料和非馆藏档案资料),在该系统中分两步实施,对于馆藏档案资料,输入相关信息,通过将馆藏档案资料对应的影像、新增添的索引数据与原先的档案资料记录结合起来,可以得到一些基本信息如物理存放位置连同输入人员、扫描日期等信息会自动导入到系统的数据库中,形成新的档案记录,方便以后的一种或多种索引条件进行组合查询。
对于非馆藏档案资料,输入人员对照屏幕所示的影像输入相应信息,如主题、内容等,形成档案记录,然后将这些档案记录送入主机上的档案管理系统的索引模块和存储压缩模块,形成完整的索引信息。
对于不清晰的影像以任务列表的形式通知扫描人员重扫,同时对于每份资料中顺序不对的影像进行可视化动态插入和错单的删除。
(5)数据的存储与备份
当扫描影像、质检和建索引都已完成后,可将资料转储到大容量存储设备,如光盘柜、磁盘阵列上,增加整个系统容量。
在系统中一方面考虑到存储的容量,另一方面考虑到查询的速度。应该采取的方案是:将近期频繁查询的影像资料存储在磁盘阵列中,将远期影像资料存储在海量数据存储设备中。对于影像资料,应进行动态更新,及时把最近不常用的电子影像及时从磁盘阵列转移到离线存储设备上,存放在海量存储数据柜中,并支持单盘调阅功能,同样的将最近频繁查询的影像资料存储到磁盘阵列中。
考虑到可能会发生档案丢失或者被改动的情况。为了确保文档系统的安全性和可靠性,即使文档管理系统即使遇上突发事件也能进行恢复,建议对已存储的文档进行备份。
(6) 本地数据转换
对于存储在硬盘或者光盘上的影像资料,针对不同的需要,可以将其格式进行转换。这样能够充分利用有关客户资料的数据,避免重复录入。通过规定格式的转换,引入信息影像系统数据库,建立信息影像的辅助索引。
(7) 信息查询
影像查询采用IE浏览器的形式进行,使系统查询客户端只要用标准的浏览器,即可实现对信息影像的访问,将系统的维护成本降低到最低。 考虑系统的可扩展性,因为考虑到系统的发展方向是大集中的信息影像管理中心,所以在查询方式上不仅考虑到局域网查询,而且考虑到广域网查询,在系统设计时将采用先进的压缩技术和网络传输技术。当用户进行全文检索以及逻辑运算检索时,选择正确的关键字或者关系,在网页上键入或选择相应的项,文档管理系统内部处理这些项,通过索引得到该索引文件对应的电子影像。这里可能得到不止一个电子影像,可以通过列表的形式将所有搜寻到的所有电子影像列出。可以设置将所有的电子影像按选定的个数(1…N)在屏幕上显示出来(相当于预览),再在其中选择某个具体影像,从而达到我们的查询目的。
因为影像在网络传输时需要占用较多的网络资源,所以操作员可以在是否查看文字信息和是否查看图像信息之间灵活选择。
3、档案数字化的基本流程

(1)档案分类整理
按照档案情况:年度、类别、长短期等进行分类整理,将部门编制不统一的进行统一分类,以便数字化后方便查找与管理。
(2)档案交接
分类整理后的档案按年度、类别提出,提卷时数字化加工方的提卷人员按照要求,编写档案的页号和需要扫描录入的文件页号后及抽取不需扫描的页面,并按实际页数填写详细的档案交接清单,并由双方主管人员签字。
(3)索引著录
标引著录为了方便查阅与管理,打印制作档案目录及档案封面,对文字录入的准确性要求较高,但要录的文本域并不是完全统一的在某一页面上,一些文本域要在多个文件中选择,标引著录时需按照国家档案局有关标准结合的实际情况录入。
文本域录入按照统一的标准对所需录入的文本进行标引、按照录入特征制作相应的《文字录入工作说明书》,供录入员和校对人员参考。
注:案卷目录和卷内目录按照档案进馆标准录入。案卷目录和卷内目录的样式可根据档案的实际情况做相应调整。
(4)档案拆分
档案拆分前要对档案进行统一的编号,编制总页号后,要从中选中需要扫描的页面。再一次编制所需扫描的页号,两个页号需要用铅笔的颜色或位置区分,以确保档案还原时能够清楚区别和核实页数,档案拆分时要严格按照要求对不需扫描的页面进行标注。
(5)档案的扫描
原件的扫描与存储格式完全按照国家档案管理的统一标准要求扫描。扫描人员按照《扫描与处理工作说明书》的要求,填写移交清单(此移交清单是档案拆分人员和扫描人员共同填写)并签字领取后进行纸介扫描。扫描图像使用先进的图像扫描处理软件,扫描人员可根据原稿质量,对系统进行定义,如自动倾斜校正、自动去污、自动分文件等批处理功能。在由系统自动处理功能的同时,扫描人员根据原件的实际情况做相应的调整,如超大页面的处理、纸张颜色深浅及薄厚的处理、扫描时可根据不同原件的情况,调整图像的分辨率、阀值、明亮度以及扫描方式和扫描速度,确保在扫描图像质量清晰的情况下,使原件完好无损。
(6)图像处理
采用自动化处理和人工处理相结合的方式,确保图像质量的完美。通过校对系统对图像进行校对,确保图像顺序正确、去斑点、污渍、黑边、偏斜处理、校验。在校对时发现不合格图像及时返回前一工序进行改正。
(7)质量检验
对扫描处理完成后的图像页面进行检验,对档案拆分、扫描、修正、去污、文本流程图的处理、插图、照片的处理以及文本和图像页的匹配进行检验等质量进行全面检验。
对文本域录入与文本录入域的标引、文件的页号及页数进行对比,对扫描前的图像页的标引与扫描后的图像页的编号与页数进行对比,发现不合格的登记清单并退回上一流程重新处理。
(8)图像与索引挂接
文本域录入和扫描处理检验后的图像成品,按年度进行文字图像与系统的挂接,不需手工挂接即可实现文本与图像页与系统的挂接。挂接到档案管理系统中后,进行再次的成品验收,对各种使用习惯逐页进行检验,验收合格后移交验收小组验收。
(9)案卷整理
档案整理工作严格按照国家档案局规定的相关标准进行有序的整理,公司安排专人负责案卷整理与还原。