档案数字化方案制定与实施
长春市档案局 梁 伟 李学广
馆藏传统载体档案数字化的问题,许多地方档案馆进行了实践,积累了一定的经验,对全国档案数字化建设起到了推动作用。但是,总结以前我国档案数字化建设的不足和失误,往往不是信息技术支持不够,而是绝大多数都知道搞数字化,但档案数字化目的是利用的主题不突出,忽略档案开放鉴定与数字化档案利用的逻辑关系,对先剔除无用档案后开展数字化的思路不明确,没很好研究档案数字化的整体效果就大张旗鼓地做起来了。进而出现数字化目录数据和全文数据不对应、找不着或不好用等问题不少,档案数字化的量虽多,但能上网利用或者说能上互联网利用的很少,数字化返工的现象比较突出,使有限的资金投入并没有体现在数字化档案的利用效益上,这一点已引起档案系统管理和技术高层领导的重视,许多实践工作者已开始进行有益的探索。 面对网络时代公众迫切需要远程、公开、快捷的档案信息,面对馆藏浩瀚如海的案卷,面对当前我国档案数字化需要解决的一系列问题,长春市档案馆与中国人民大学信息资源管理学院共同承担了国家档案局科技项目《档案数字化方案研究》。该项目经过课题研究人员的共同努力,已取得初步研究成果。通过课题研究,对档案数字化方案的研究提出了一些观点和看法,大家交流和讨论。 一、确定档案数字化指导思想与原则档案数字化指导思想是:以需求为导向,以利用为目的,充分利用计算机软硬件功能,最大限度发挥人力资源和数字化加工设备能力,保护馆藏档案原件完好,保证数字化档案真实准确,更好地发挥档案信息资源的作用。档案数字化原则是:遵循重要档案数字化的价值性原则、常用档案数字化的实用性原则、开放档案数字化的开放性原则、褪迹档案数字化的抢救性原则,解密档案数字化的及时性原则,目录数字化与全文数字化分步的时效性原则,档案数字化加工与利用同步的一致性原则。 二、明确档案数字化策略 (一)需求导向,急用先上策略 1.需求导向策略社会需求对档案利用的影响应该是档案工作者特别关注的问题。我们用统计数字加以分析。 (1)随着编史修志工作纳入各地工作规划,1986年全国省(区、市)综合档案馆接待编史修志查档卷数占利用总卷数的69%。随着编史修志阶段性高潮过去,2003年全国省(区、市)综合档案馆接待编史修志查档卷数占利用总卷数的28%。下降41个百分点。(此数据来自国家档案局法规司保存的档案统计年) (2)随着社会保障制度的建立和国有企业改革的深入,长春市档案馆查阅工人调配档案卷数占利用总卷数的百分比,由2002年的1%增加到2004年的占利用总卷数的68%。(此数据来自长春市档案馆利用统计数据库)由此看出,国家、地方新政策的出台和工作部署对档案利用的影响程度。从宏观上讲,档案利用已实现了两个转变,服务重点由政治领域转变为经济领域,服务对象由机关干部扩展到公众百姓,特别是为百姓提供凭证案例急剧上升。用动态观念研究当前与长远社会对档案的需求,并指导档案数字化与利用服务工程实践应该是档案部门的必然选择。 2.急用先上策略 地方档案馆馆藏档案数量众多。但并不是所有档案都在现实中利用,有相当大一部分多年不用。2004年全国省(区、市)综合档案馆档案平均利用率仅为1.6%。虽然档案馆众多全宗中当地党委、政府全宗利用率高是一般规律,但其他全宗利用情况往往和政策、时间的变化而变化,影响更大。所以,各级地方档案馆按照近期利用统计情况和发展趋势确定数字化的先后顺序是科学的选择,利用优化理论进行档案数字化筛选,快速反应,突击完成急用档案数字化任务,能够达到更好地发挥档案作用的目的,实现即时投入使用的预期。(此数据来自国家档案局法规司保存的档案统计年报) (二)本级为主,分步实施策略 (1)本级为主策略 根据档案馆职能分工和档案来源原则,各级地方档案馆永久档案绝大多数是本级机关形成的,一般都占50%以上,这部分档案自然是当地档案馆数字化的重点。同时,地方档案馆都保管着大量的上级档案文件,馆际之间上级档案文件重复是必要的,这些纸质文件来源一般都是上级机关统一印制的。进入信息时代,地方档案馆都面临着保管的上级档案文件全文数字化问题,特别是上级档案文件的开放鉴定审查问题,与其各地分头审查上级档案文件开放和进行数字化,不如国家档案局着手进行档案全文数字化和开放鉴定分工、协作,向馆际共建、共享已有鉴定和数字化成果的方向发展。地方档案馆坚持本级为主的原则,根据需要和可能适时、适量地进行利用频繁政策性上级档案文件的全文数字化,以满足当前工作的急需,尽量减少档案馆多层的重复劳动。 (2)分步实施策略 馆藏档案数字化不可能一步到位,而且档案室进馆范围档案陆续进馆,进馆范围档案实施档案数字化馆室共建、共赢、共享的策略非常重要。在具体实施过程中,文件级目录数据库建设是最基础性的工作,是第一位需要建全的,但并一定是文件级目录数据库建成后再建其它数据库。专题数据库建设是根据现实需要而适时建立。全文数据库建设是满足信息检索需要而必须加快建设的数据库。 (三)剔除无用,避免浪费策略 1.剔除无用策略 地方档案馆馆藏现行档案主要来自于机关各个立档单位,其档案文件进馆的决定权掌握在立档单位文档人员手里,加之国家档案保管期限表几经修改和许多条款至今还比较笼统,所以,不该归档的、不该进馆的、文件重复的档案进馆颇多。特别是建国超过50年以后,半数左右长期保管的档案逐年超过保管期的最上限,这些档案实际上绝大多数已失去保存和利用的价值,但它们仍占据着档案管理的各种资源。 2.避免浪费策略 面对数字化方法的选择,剔除无用,避免浪费应该是一种长久策略,把大量失去保存价值的档案先剔除,避免把无用档案数字化,再造数字化垃圾。 三、优选档案数字化技术与业务路线 档案数字化建设周期长,信息技术又处在快速发展之中,各个档案馆数字化基础和条件不同。从本馆实际出发,优选档案数字化技术与业务路线特别重要。 (一)计算机新技术与档案数字化业务的有机结合信息技术的发展给档案数字化效率和质量的提高带来深刻的影响,本着技术为需求服务的理念,无论是利用哪一种档案管理系统,都要适应档案数字化流程重组和再造需要,适时进行软件升级,通过软件升级固化技术与流程重组与创新,使档案数字化的效果更好。同时,设计符合国家标准与适应自身需要的数据库结构,使档案数字化的过程优化,数字化档案的利用快捷。 (二)档案鉴定与数字化同步 鉴定与数字化同步的目的是加快数字化档案信息的利用。在计算机网络环境下同步进行档案鉴定与数字化工作是发展趋势。这种档案鉴定是以剔除无用档案为前提,以鉴定档案开放为主,按需求筛选全文数字化档案,为适时提供数字化档案信息服务打基础的过程。 (三)档案数字化与上网利用同步 数字化档案分开放与不开放两种。在计算机网络环境中,在确定档案开放与不开放的同时,开放档案即上互联网。开放与不开放档案数据在局域网中即时使用。
档案数字化及管理流程重组不可能一次到位,它是一个管理思想不断地变化的过程,适时把新技术和新理念纳入进去是非常重要的。 四、细化档案数字化操作方法 实践证明,在计算机网络环境下,档案数字化和利用服务工程以建立流水作业线,提高工作效率和效益为最佳方式。 (一)优化配置各种资源 档案数字化建设需要投入,特别是建设初期软硬件配置投入较大,建成后也要保持一定的运行成本。地方档案馆在具备一定档案数字化条件的基础上,要按照成本效益最大化理论,根据不同的情况,进行档案专业人员和数字化技工人员、计算机和扫描设备的合理搭配,优化档案数字化各种资源配置,提高档案数字化建设的投入产出比,构建档案数字化投入小产出大的新模式。 1.计算机网络环境下档案数字化与利用服务工程流水线资源配置案例
(二)首先建立文件级目录数据库 满足一般检索和管理的需要,建好档案文件级目录数据库。目前,绝大多数综合档案馆,由于没有实现全部档案的文件级目录机检,查找档案不快、不准、不全的问题普遍存在。另外,档案的统计单位主要是卷和延长米,而档案的最小单位是文件的件数,以件为单位的底数不清是普遍存在的问题。所以,把文件级目录数据库建设作为一项基础性工作,在提高档案的查全率、查准率的同时,利用计算机实现档案以件数为基本单位的管理是非常必要的。 1.高度重视文件级目录数据录入的前期处理。档案馆的案卷来自各个立档单位,案卷是由文档人员在档案局业务人员指导下形成的。但是,由于文档人员变动频繁、档案业务指导面多线长,案卷质量难以适应计算机精确管理的需要,加之个别文件形成时的先天不足,给文件级目录数据库建设带来许多麻烦。实践证明,进行文件级目录录入的前期处理,抛开原有的文件目录,按卷内实有文件一一录入,把题名不反映主题、目录与实体不符等一系列问题一并处理是非常必要的。 2.科学合理地设计数据库结构。文件级目录数据库结构包含三方面功能为最佳。一是符合国家有关标准及实际情况,文件题名、责任者等满足文件检索需要的字段。二是存毁、开放、扫描等数字化加工阶段利用的字段。三是数据录入、校对、鉴定、审查等标明责任的字段。 3.数据质量是数据库的生命。建立在计算机环境下,以上网公开利用为根本目的文件级目录数据库,与纸质文件目录有本质的区别。纸质文件目录有问题只有档案馆内部少数人知道,利用者并不清楚。但是,文件级目录数据库进入网络,特别是向社会公开的部分,对数据库的质量要求是相当高的,数据质量也是当前制约许多数据上网利用的瓶颈之一。 (三)适时建立专题数据库 满足特殊检索需要,适时建立档案专题数据库。馆藏档案仅靠文件级目录数据库是不可能解决全部检索问题的。随着客观需要的变化,对某一专题档案有集中利用的需求是经常发生的,突击建立专题数据库,满足社会需求,是档案馆与时俱进的突破口,也是充分发挥档案作用的最佳时机。主要把握三个方面:一是根据馆藏档案内容确定专题数据库的总体布局。二是按需求分期建立专题数据库。三是根据文件内容和检索需要分别设