新时代档案工作实用技术探索
工作单位:龙山县档案局
在档案资源体系建设中,最辛苦关键的环节还是档案整理,整理是前期收集、鉴定的总结,整理是后期保管、开发利用的基础。随着档案信息化的逐步推广,档案整理的范围扩大、难度提高,现在的档案整理包括纸质档案整理、纸质档案的信息化录入扫描、电子档案整理。怎样做好新时代档案整理工作,从事档案工作这几年,仅有学习的资料基本上都是档案理论或者档案标准,缺乏一些档案整理过程中实用的操作技能上的心得体会,基层档案部门最需要的是提高具体操作技能,在此分享一下个人在档案整理过程中具体操作技术上的一些实际经验和想法。
1、纸质档案整理的一些小改进
传统的纸质档案整理打印目录是一项很耗时的工作,在实践中对打印目录工作进行了一些改进,打印目录是用word文档,所以为了快速实现相关扩充功能都使用VBA编程。
1.1、采用语音输入法输入
语音输入法输入比用键盘打字效率高,人也轻松得多,极小部分识别不准的再用键盘打字补充,采用语音输入法后整体反响很好,打印目录效率大幅提高。
1.2、自动生成空目录
打印目录我们用的word文档,以前打印目录前都会先复制、粘贴很多空目录,浪费时间又操作不便,通过编程实现空目录自动生成,打印完一张后,双击最后空白处可自动生成下一张空白目录,操作方便。
1.3、自动编号复制目录内容
序号都是顺序的,有些连续的文件也有很多类似之处,在EXCEL中可以快速复制内容、序号自动增加,而word中本身没有此功能,通过编程也实现了这个功能,方便操作。
1.4、自动录入数据库
在档案信息化中,要求建立目录数据库,在纸质档案整理的打印目录过程中,通过编程实现在文档中打印完一条目录立即把目录内容自动插入到目录数据库中,以后完善目录数据库就不再需要一条一条的人工录入,只要在数据库中进行一定的技术处理就行了,减少了打印目录的重复劳动,当然也可以后期成批处理,在这里立即录入数据库主要是为了下一个自动填充的功能。
1.5、读取数据库同文号目录自动填充
整理的档案内容比较多的时候,有些文件内容是重复的,在打印目录过程中,通过编程实现输完文号以后自动在目录数据库中搜索,发现有文号相同的目录,读取目录内容,自动填充余下目录内容,在打印通过电子政务下发的文件时尤其有用,减少很多重复的录入工作。
2、档案信息化的技术探索
在档案信息化方面,我局发展相对比较落后,档案信息化根本没有提上议事日程,实际工作并未开展,所以接下来只是个人的设想,但技术上肯定是可以实现的。在电子文件处理方面需要编程的地方个人建议使用python语言,python编程简洁明了,开发环境安装配置简单,各种开发包健全,调用C语言DLL方便,部分底层实现不了的功能可以用C语言封装,当然作为一个档案工作者实现一些小功能的处理基本上不需要自己再用C语言封装DLL,使用python现有的开发包都基本上都可以实现。
2.1、每年通过技术手段及时更新目录数据库
在各单位完成纸质档案整理工作后,收集各单位打印目录的电子文档,通过编程处理把集中起来的目录电子文档自动录入到目录数据库中(程序遍历目录文件,python有开发包可以操作word和excel对象,目录文件一般都是保存为这两种格式,逐个文件逐页逐行读取目录信息插入目录数据库,实际操作中注意目录数据库字段数一般多于打印目录字段数,可以在程序读取一条信息后自动分析处理后直接插入目录数据库,也可以数据库中建临时表,数据先全部插入到临时表,再对临时表数据集中处理后插入到最终的目录表中,实际操作中视情况而定),在传统的档案整理基础上,几乎不用花多少精力就完成了当年的目录数据库录入工作。相对于以后又得用大量的人把馆藏档案一份份文件的录入目录,节省了大量的人财物,并且及时高效。这种用处理方式需要设计统一的目录格式,方便程序处理,可惜因缺乏规划,没有人认识到打印目录电子文档的重要性,近十几年来电脑打印的目录电子文档没有多少保存下来。
2.2、电子文件归档多利用编程自动处理
电子文件归档与管理过程中有转换文件格式、打印电子文件目录等一些操作,在实际操作过程中如果能及早规划也能节省很多精力,首先保证电子文件存放的路径和文件名格式规范(自行定义规范,方便程序分析处理,例如文件名要与文件标题一致,方便程序自动生成目录,文件名不规范程序要读取文件内容去提取文件标题就太复杂了,各种情形太多做不到100%的正确提取),文件格式转换、照片处理和部分元数据生成可以由程序批量处理,电子文件目录也可以由程序自动生成,不足之处再由人工完善,对电子档案的检测也可以用程序自动检测。
2.3、自动匹配纸质档案与电子档案
纸质档案、电子档案都完成整理后,可以通过目录中的文件名等信息匹配自动把纸质档案与对应的电子档案关联起来,电子档案在一定程度上替代纸质档案信息化扫描,直接就实现了目录数据库和全文数据库挂接。可以把纸质档案目录、电子档案目录都先用程序集中插入到数据库,再到数据库中用SQL语言进行数据处理。
2.4、深入分析档案信息化管理软件系统
上述的几个功能要直接操作档案信息化管理软件系统的数据库,必须建立在对当前系统数据库相当了解的前提下,各档案部门当前使用的档案信息化管理软件系统基本上都是购买的,购买的软件系统只有说明书,没有软件设计文档搞不清楚数据库的数据结构、关联关系,要想深入了解系统还得使用其他手段。档案管理软件系统一旦启用就是要用很多年,花点额外的功夫深入了解一下系统也是有必要的。
第一步:重新安装一套软件系统,这也是以后备份恢复的基本功,必须要学会,系统安装后安装适合的数据库管理软件,不同数据库使用的管理软件不一样,最终结果要能方便的操作数据库,安装数据库过程中牢记超级管理员密码,使用管理工具连接数据库时可以使用超级管理员用户名、密码也可以使用软件系统配置的数据库用户名、密码,通常在服务端的配置文件中可以找到,如果配置文件中的用户名、密码经过加密就通过第四步的代码分析制作解密工具。当然也可以和软件公司联系通过他们技术支持来实施,不过这些比较基础的安装软件、连接数据库都需要软件公司的支持的话也就没有必要考虑后续这些复杂的运用了,只能按部就班的使用软件。
第二步:先制作程序可以导出数据库所有表名及表内记录条数,并且能对比前后两次导出文件,哪些表内记录条数有变化的表名输出。按说明书进行一些关键的操作,例如新建全宗、新建门类、新建案卷目录、新建卷内目录等操作,没次操作前后用工具导出数据库全表名及记录数,并进行对比,表内记录数有变化的表就是此功能操作对应的表,每个功能对应哪几个表记录下来,再逐个分析表内的变化记录。
第三步:全面看一下数据库所有表及字段,所有的存储过程及函数,重点看一下几个关键功能涉及的表、存储过程和函数,例如新增一条卷内目录,哪几个表中添加了数据,数据之间有什么关联,是否存在对应的存储过程或函数,存在就仔细分析代码并调用测试,完成到这一步就基本上可以实现前面所述的直接用程序操作数据库了。
第四步:为了以后更好的运维管理、排查问题甚至更改扩充软件功能,进行这一步分析,分析软件系统开发运行环境,查看软件配置文件,未编译的代码文件分析重点功能代码,编译过的尝试反编译后再分析重点功能代码,不能反编译为高级语言的可以反汇编运行调试。第四步不是必须的,不急于一时,第三步中数据结构、关联关系分析无把握时可以进行第四步代码分析,或者软件出现异常需要解决问题的时候才进行代码分析。
总之在计算机上的操作只要有规律可循尽可能由程序去完成,减轻各机关档案室和档案部门的压力,起到事半功倍的效果更有利于档案信息化工作推动。