谈档案信息管理的轴向与空间维度
王恿鲑 常德市自来水公司
【摘 要】档案是历史的产物,是记录真实历史的纪录,是可以再现历史真实面貌的原始文献。当前,档案信息化发展趋势迅猛,势头良好。为此,本人认为有必要谈谈档案信息管理的轴向与空间维度。因为只有充分考虑并利用了它们,才会使档案信息管理更加高效与实用,才能满足新的历史时期对档管理所提出的新的要求。
【关键词】档案信息管理 轴向 空间维度
档案管理正大步步入信息化的时代,档案信息化为档案工作者与使用者带来了便利,同时,也为档案信息管理带来了机遇与挑战。其中,对档案信息管理的相关人员,如:系统设计者、管理者,提出了更高的要求,要求他们对档案信息的收集、整理、检索、挖掘等各项指标进行全方位的思索,达到安全、便捷、高效、准确的目标。本文以档案信息为主体,谈谈档案信息本身具有的部分属性,以及如何更好的利用这些属性,希望能为档案信息管理的系统设计者、管理者提供新的思路,为档案信息管理跃上新的台阶提供一点帮助。
先谈一谈轴向。信息领域里,数据信息以离散形式分布,通过数据模型组成信息实体,实体与实体之间通过各种形式构成可以拓展的信息空间。简单的二维平面已不能满足信息多样化的要求,因此,为这个二维平面定义一个深度描述,成为信息领域里一个通用方案。比如:在二维平面坐标上定义一个Z轴,就可以形成一个立体空间。这里的Z轴可以描述为纵深。在数据实体模型中,为平面表格指定外部的链接,就会形成一个立体的数据模型。档案信息本身具有一个很重要的属性,那就是历史属性,我们同样可以将这个历史属性定义为时间轴,在时间轴的某一个点上向前拓展,或者向后延深,就会有不同的方向,这就是我所说的轴向。
通过轴向我们可以引申出另一个概念,那就是维度。本文中特指的就是空间维度。是指以某一时间点为参照,以轴向为指引,形成的一个空间范围,在这个空间中,档案信息的内容与另一个空间中的档案信息内容处于不同的空间维度。在不同的空间维度中,信息的提取与展现会有不同的结果,这正是档案信息发展过程中所要面对的问题,也就是如何解决对处于不同轴向与空间维度中的数据模型进行设计,如何才能取得出不同维度里的档案真实信息,如何能安全、高效地利用这一点。
为此,我引出以下的描述。
首先,我例举人事档案中几个对象实体,假设:甲在2000年进企业A,2001年参加国家考试取得X专业中级职称,2001年入党,2005年取得X专业高级职称。2006年进企业B,2007年取得Y专业中级职称等等,另有类似经历,但时间与内容存在不同的对象实体若干。时间参照点设为2012年。通常情况下,信息系统可以查出目前企业(@)(表示查询企业的某项数据)的具体人数、党员、中高级职称数量等信息;但是,如果对于一个设计有缺陷的系统,可能无法查出企业(时间,@)(表示查询某企业某时间段内的某数据)的具体数目,如:要查企业(2002年至2003年,取得X专业中级职称的在职员工)的清单。这个查询看似简单,却需要档案信息系统提供轴向与空间维度的支持,如果在组织信息模型时没有考虑到这一点,就会取得错误的信息,甚至无法完成,只能通过查找原始文献来取对结果。通过这个例子,我们可以看出档案信息的历史属性产生的轴向与空间维度是不能忽视的,而且,对于多样化的档案信息系统,轴向与空间维度会显得更加重要。
通过分析,我们可以看出,要利用档案信息的轴向与空间维度需要从以下几点入手进行处理:
一 信息的完整性
信息的完整性是基于档案信息的根本特性,那就是史实纪录。如果对档案信息的完整性没有充分记录,就会缺少信息组成的基本元素。然而,正是这些基本的信息元素为信息的各项操作,如检索、挖掘提供了基础。主要实施要落脚在数据的收集整理阶段,因为这些要素是在建立档案,累积档案的过程中产生的。但是,有一点我必须强调,那就是客观性。客观性不光存在于档案本身,而且存在于档案收集整理过程中,然而收集整理必然是由人工通过繁复的,长时间的操作来完成的,那么,我所说的客观性是指要尊重收集整理这一客观过程,在这一过程中难免会存在操作的失误与偏差,我们要承认失误与偏差的存在,就是尊重了客观事实。在这个客观基础上,就需要对信息完整性进行一个合理的修补,并保持信息轴向与空间维度的完整。
二 信息的轴向链表
信息的完整性包含很多的方面,但是,没有人能够知道当前或者今后档案信息的组织、内容、格式会发生怎样的变化。甚至对某个区域的数据建模也不可能是一成不变的。那么,我们应当对档案信息本身进行数据抽象,找出其中的基本属性单元,并为这些基本属性单元建立数据链表,本文称之为轴向链表,并且链表应当是双向的、可插入的,就是说可以从链接头部、尾部、中间插入信息节点,或其他轴向链表,这样的结果就形成一个完整的哈夫曼树。
三 节点的空间维度
上面说明了轴向链表,那么链表的节点就是信息的基本点,节点应当具有维度属性,以表明该信息节点处于什么空间维度。当对档案信息进行剖面切割,划分出空间维度时,相应的轴向链表与节点就会进入这个空间维度,在这个空间维度中进行数据的检索、挖掘等操作才会生成正确的结果,并且,在此基础上的数据操作与原有数据操作方法基本兼容,这样就解决了与原有档案信息系统的平稳过渡。
档案信息的轴向与空间维度所要实现的目标是通过建立良好的数据模型,使错综复杂的档案信息具有良好的历史属性,这也正是档案管理所要达到的要求。通过它,可以对不同空间维度的检索要求给出符合条件的结果,从而真实的反映设定历史条件下真实的历史纪录与关联纪录。也只有实现了这一点,档案信息管理才能为信息使用者提供清晰的历史画面。
从实际角度看待档案信息管理中的轴向与维度问题,应该包括以下重要方面。
重要的参数是完整日期。比如:某档案文献中记录甲的信息如下:出生年月:1970年,工龄:9年,本单位工龄:7年。从客观角度看,这段信息是真实有效的。但是从档案信息轴向与维度的角度看,却缺少了一些信息,甚至是必要的参数。如果查询日期是2012年5月8日,就无法查出甲的真实周岁,因为出生年月没有完整日期,存在误差。对于本单位工龄部分,由于期间可能存在工作单位变化,所以要通过工作履历轴向链表中的具体时间才能计算得出,这就要使用轴向链表来完成。再比如:设2012年为当前查询时间,统计2000年12月某企业的在职员工数量。通过完整日期这一重要参数剖析轴向链表,从而形成轴向向后延伸的空间维度,通过这个空间维度,就可以将该维度内存在的在职员工对象提取出来,这里面就不会存在2000年12月以后新进单位的员工,并且,2000年12月后过世的员工就应当被纳入进来。同样的道理,档案信息系统完全可以方便的统计出其他类型的数据结果。
重要的对象是轴向链表。从上例中,可以看出轴向链表发挥了重要的作用,轴向链表的建立就成为档案信息管理的一个重要环节。什么样的信息需要轴向链表呢?我认为凡是存在空间维度特性的对象,包括:姓名、住址、电话、工作履历、政治履历、职称履历等等,这些都需要建立相应的轴向链表,并且,在数据建模阶段,必须保证独立性原则。独立性原则是指各轴向链表所描述的信息彼此之间的耦合点数目=1。如:姓名轴向链表与工作履历轴向链表间只能通过一个点进行耦合,可能有人会说身份证可以耦合,但是我不建议这么做,因为身份证的唯一性不在当前档案信息系统的框架内,需要其他的系统提供这种保障,事实上已经违背了唯一性标准。自定义主键进行描述是一个推荐方案。他的优点在于:1、该主键是当前系统唯一的,2、该主键便于进行内部处理,可以作为很多计算的重要参数。有人会提出问题:在信息系统互联时,各系统的主键会重合。事实上,对于这种情况,可以动态的建立一个主键映射表实现对接。映身表的键部分采用上述自定义主键,值部分采用一个当时时期公认的唯一值。比如当前时期,就可以采用身份证号码作为值部分。这样做的优点在于,各系统可以以这一唯一值进行对接,并且可以按国家要求进行统一更换,在更换过程中不会影响信息系统的其它环节的正常运转。
重要的实物是档案文献。
在信息化高速发展的今天,很多主题在探讨中,但是我认为有一个对象是不允许染指的,那就是档案文献。作为档案信息的客观存在,它始终是档案信息化的基础,同时也是后盾,在信息真实性需要进行裁决时,档案文献才是终极裁判。而且在信息化的过程中,我们也应本着客观的原则,对信息进行收录整理时的误差,只能通过档案文献进行修补。因此,档案文献的存在与完善保存是一项不可或缺的工作。
综上所述,已对档案信息的轴向与维度进行了初步探讨,提出了档案信息存在轴向与维度的这一客观事实,通过部分实例阐述了轴向维度空间的科学依据,初步证明了利用该对象可以真实的还原史实画面的强大功能。同时,本人希望借此文抛砖引玉,为档案信息技术人员提供新的思路,为国家建立统一化、多元化、深层次的档案信息系统提供参考。
【参考文献】
[1]赵军,张显跃. 基于粗集理论的数据离散化技术研究[J]. 重庆邮电学院学报(自然科学版),2006,(06)