书城社科档案信息检索
12551300000022

第22章 电子文件著录

一、电子文件著录与电子档案著录的关系

电子文件的著录是指通过获取、核对、分析、组织和记录关于文件内容、结构、背景以及文件系统的信息,准确描述电子文件的过程及成果。电子文件著录涵盖了电子档案著录的基本要素。一方面,电子文件作为文件的一种形式,具有文件的基本特征,与传统档案形成过程相似,电子文件在完成了其现实作用后也应按照一定程序转化为电子档案,在我国,档案管理的一般原则仍然适用于对电子档案的管理。另一方面,由于电子文件的管理遵循的是全程管理和前端控制的原则,在开展文档一体化管理的过程中,属于电子档案著录的很多项目在电子文件阶段就已经完成著录,所以,对某份电子文件的著录实际上就是对可能作为档案保存的该份电子档案的著录,电子档案的著录工作实际上是从电子文件阶段开始的,且电子文件阶段著录的项目已经涵盖了电子档案著录的基本要素。因此,只要充分重视电子文件阶段的著录工作,就能使电子档案的著录质量得到基本保障。

二、电子文件著录的基本原则

与传统的文件、档案管理相比,电子文件、电子档案的管理涉及更加复杂的因素,由于对计算机技术的依赖性增强,变量增多,技术含量更高,在技术、政策、方法等方面对电子文件的著录都提出了更高的要求。在冯惠玲主编的《电子文件管理教程》一书中提出了电子文件管理的多项原则,包括全程管理原则、前端控制原则、真实性保障原则、完整性原则和可读性原则等。

(一)维护真实性原则

真实性是档案得以存在和受到保存的基本前提。电子文件的真实性是指文件内容、结构和背景信息经过传输、迁移等处理后,直至转化成电子档案时与形成时的原始状态应保持一致。对电子文件进行著录时,应充分保证每一个著录项所指向的内容都是文件内容的真实反映。真实性是保证电子文件有效性和法律证据性的基础,也是保证电子文件转化成电子档案后具有可查考性和凭证性的基础,是电子文件反映历史面貌,构成社会文化价值并能作为社会记忆长久保存的前提条件。维护电子文件内容的真实性是当前档案界面临的难题,原因主要有两方面:一是电子文件的内容被更改后不易被发现,在电子文件的形成、使用和传输过程中,如果不采取控制措施,极易不留痕迹地改动文件信息;二是电子文件对计算机软硬件的依赖性很强,从文件的形成、使用、转移,到文件的传输、保存各环节都与计算机软硬件的性能有极大的关系。由于软硬件的不断升级,原来使用低性能软硬件形成的电子文件的可读性会受到影响,若要保证电子文件信息的可读性,必须对文件进行适时迁移以适应新的计算机技术,在迁移过程中有可能造成文件某些信息的变化或丢失,影响电子文件的真实性。我国国家标准《电子文件归档与管理规范》中对保证电子文件的真实性提出了四条措施:第一,对电子文件的操作者进行可靠的身份识别、权限控制;第二,设置符合安全要求的操作日志,随时记录操作实施的人员、时间、项目、内容等;第三,对具有凭证作用的电子文件逐页加注可靠的防错漏和防调换的标记;第四,对电子化的印记、签章等采取防止非法使用的措施。电子文件著录在设置各著录项时,应充分考虑到电子文件这一特点和要求,通过著录能将电子文件最原始的状态表现出来,或将电子文件的变化过程反映出来。

(二)保持完整性原则

完整性是电子文件价值的重要保证,残缺不全的文件留给后人的是残缺不全的记忆,因此,保持电子文件的完整性是文件档案工作人员的重要职责。电子文件的完整性包括两方面含义:一是文件数量要齐全,即作为记录社会真实活动的,且具有有机联系的电子文件及其他形式的相关文件数量要齐全;二是每一份电子文件的内容、结构和背景信息等基本构成要素要完整,没有缺损。根据相关电子文件研究结果表明,电子文件的基本构成要素包括:载体,即承载信息,具有实体形态的介质;内容,即文件记载的信息;物理和智能格式,即合乎通讯要求的文件表示规则,物理格式是指决定文件外观的一组属性,包括字体、插入符、颜色、语种、数字签字、时间戳等,智能格式是指表示文件生成活动、文件编制及管理背景的所有属性,包括文件内容的表示类型,如文本、图形、图像或混合形式,文件各部分内容及其排列顺序、注释等;活动,即签发文件的各环节,包括以文件管理为手段,创建、维护、改变、结束某项工作的行为;人员,即利用文件开展工作的实体;档案链,即同一业务活动所形成的所有文件之间的联系;背景,即文件产生的司法行政、业务活动以及技术环境。电子文件的完整性就是以上各要素的有机结合。电子文件具有软硬件依赖性,因而归档文件的支持软件及软件的文档、表达电子文件内容的基本格式及有关元数据都应属于归档范围,在对电子文件进行著录时,应尽可能有意识地将这些要素集中起来,全面反映电子文件从形成、保管、传输到使用各环节的特征,维护电子文件的完整性。

电子文件在设置著录项时要尽可能将反映这两方面内容的项目都设置齐全。为了真正做到这点,确保通过著录项目反映出完整的电子文件,可以采用以下办法:(1)事先掌握著录源电子文件的形成规律、分布状况和使用情况,以便确定著录的深浅程度;(2)开列属于归档范围的相关电子文件的清单,掌握著录范围;(3)注意区分不同背景下形成的,但在内容上又具有联系的电子文件的收集,包括不同应用系统下形成的、不同媒体的、不同格式的或通过非正式渠道传递的具有相关内容的电子文件的收集,只有将这些电子文件收集齐全并保持内容上的有机联系才能符合完整性的要求;(4)注意收集与电子文件在内容上有关的其他形式的文件,如纸质文件、缩微胶片等,这些文件虽然在形式上不是电子文件,但是如果在内容上与电子文件有联系,可以将这些文件作数字化处理后作为电子文件著录归档和保存。

(三)保证可读性原则

档案之所以被人们所重视,重要的原因就是因为在档案被保存多年以后,人们仍然可以通过阅读档案信息了解到档案形成时的社会情况。影响档案可读性的因素是多方面的,传统档案的可读性主要受自然因素的影响,如纸张损毁、环境破坏等造成档案内容无法读出。电子文件的可读性是指文件经过存储、传输、压缩、加密、媒体转换、迁移等处理后,能够以人可以识读、可以理解的方式输出,并保持其内容的真实性。影响电子文件可读性的原因更复杂,有来自于载体的原因,但更多的是与技术环境有关。从现有技术条件和使用方式来看,造成电子文件无法读出的原因主要有:(1)系统不兼容导致文件无法读出。电子文件的系统依赖性使得每一份文件只有在相应的系统环境中才能读出,新的系统环境因不接受过时的文件格式而无法读出旧系统生成的文件;(2)与电子文件产生、管理和存储有关的计算机软件和硬件更新换代后导致原有文件无法读出;(3)病毒感染导致电子文件内容无法读出;(4)载体损伤导致电子文件无法读出,一部分电子文件可以通过光盘、优盘、移动硬盘等载体进行存储、保管和传递,当这些载体受到损伤时可能会导致电子文件内容无法读出;(5)加密文件因不知道相应的密码而导致电子文件无法读出。可见,影响电子文件顺利读出的因素从电子文件形成直到归档保存后都可能存在,因此保证电子文件可读性的措施应贯穿于电子文件管理的始终。电子文件的著录应考虑到各种因素对可读性的影响,应根据电子文件的类型和特点,在设置著录项时应注明文件的存储格式、软硬件环境、相关的数据及参数等。通用软件产生的电子文件应同时说明其软件的型号、名称、版本号和相关参数、说明等;专用软件产生的电子文件一般应转换成通用型电子文件,不能转换时应对该专用软件进行说明;对于加密电子文件一般应解密后再归档,如确需加密保存的,应将其密码同时归档保存。以上各方面情况都应在对电子文件著录时通过设置相应的著录项进行说明,以保证电子文件的内容能顺利读出。

(四)坚持前端控制原则

传统的文件、档案管理是按照各自的使用方式和特征,分不同阶段和管理技术进行的,文件管理和档案管理作为两个相对独立的系统分别进行,文件管理和档案管理的全部目标和要求被分解到不同的阶段、环节和步骤中。体现在对文件和档案的著录上也有所区别,文件的著录主要体现出文件在发挥现行效用阶段所应具备的特点,如收发文登记号、发文字号、文件签发人等;当文件转化为档案后,著录就应体现出档案的特点,因此在很多著录项的设置上都反映出档案所独有的特点,如全宗号、档号、案卷号等。对电子文件和电子档案的管理虽然从名称上看有所区别,但由于它们在形成和利用过程中对相同系统的依赖性很强,在电子文件阶段形成的项目到了电子档案阶段仍然具有相同的作用,因此在设置著录项目时就应特别重视全盘考虑,将文件形成的前期阶段、文件运用阶段和档案阶段的相关项目作为一个整体进行研究,这种全盘考虑和研究的原则在档案管理论中就称为前端控制原则。

前端控制是现代文件、档案管理理念的重要内容,它以文件生命周期理论为基础,把文件从形成到永久保存或销毁的不同阶段看做一个完整的过程。在这个过程中,文件的形成是前端,处理、鉴定、整理、编目等具体工作是中端,永久保存或销毁是末端。在电子文件著录工作中体现前端控制原则就是要把可能在文件形成阶段就出现的部分作为著录项目进行考虑。电子文件是在系统中形成和运行的,因此,电子文件管理的前端就应该延伸到系统设计阶段,对著录项目的设计也应考虑到系统的特点,在著录项目的内容中也应该体现系统的特点,尽可能将电子文件在形成前期和形成之中各阶段的特征通过著录项目反映出来。

在电子文件著录时坚持前端控制原则对维护著录项目的完整性和体现电子文件的特点具有非常重要的意义。

第一,由于电子文件具有易流失、易更改的特性,电子文件内容一旦出现差错不易被发现,或不可修复和弥补,即使要进行恢复也需要付出很高的代价。造成这种问题的原因是多方面的,有的是由于系统的原因,有的是由于管理上的问题,有的是由于电子文件载体本身的问题。因此针对电子文件的这种不易控制的特点,最佳的管理方式就是将管理时机提前到可能出现问题的电子文件形成的初期,将电子文件的各种特征设计在文件管理系统中,让该文件从形成开始就加上各种管理标记,将电子文件的原始信息固定下来,确保其安全留存和内容真实。电子文件的管理要遵循前端控制的原则已成为世界各国电子文件专家和档案管理者的共识。加拿大档案专家特里·库克指出:“在电子环境中,如果档案人员不积极介入文件的形成和保管过程,文件将可能不存在,或至少可能不被鉴定、保存、编目和提供利用。”加拿大不列颠哥伦比亚大学的露西安娜·杜兰蒂教授也认为,如果文件形成者不从电子文件产生之时起就采取措施保证它们的内容可靠性和文件本身的可靠性,将来就没有多少电子文件值得保留。

第二,前端控制是优化管理功能,提高管理效率的科学理念。电子文件管理系统不应是对手工管理流程的简单模拟,而应该是在更科学、更合理、更有效的原则基础上对文件、档案进行的管理,采用业务流程重构等方式,进一步消除文件、档案管理过程中可能存在的重复、疏漏甚至矛盾的地方,从而取得更好的管理效果。在对电子文件的管理过程中,把某些分散在各个业务环节的带有一定重复性的作业提前实施,可以有效地减少重复作业和滞后作业,最大限度地提高作业效率。例如,凡是可能在文件形成同时生成的数据,包括描述文件的内容、结构、背景、版本、文件生成环境、存在状态等各方面的信息均应在当时及时采集、存储下来;文件形成时尚无法生成的诸如文件的运转、保管、利用等方面的数据则实时追加。所有数据均为一次采集,终身使用。这种数据库采集方式与各环节独立采集方式相比工作量大为减少,有效地防止了重复采集中的数据误差,并且保证了用于描述文件、检索文件和系统维护所需数据的完整齐全,真实可信。

三、电子文件著录的特点

(一)全要素

对于电子文件而言,需要描述的对象包括文件三要素:内容、结构和背景。同时,因为电子文件具有系统依赖性的特点,因此文件管理系统是著录中不可缺少的内容。对文件管理系统的著录不仅包括文件生成时所在的系统,还应包括文件管理、利用、保存、迁移后所在的系统。电子文件著录全要素的特点决定了著录信息源不仅是文件内容本身,还包括生成、管理电子文件的过程。

(二)全过程

著录将贯穿于电子文件的整个生命周期,包括文件编制、处理、归档、迁移、利用等全过程。在这个意义上,著录信息是与文件同步形成的,著录时间包括文件形成的整个阶段,相当多的著录内容在电子文件形成时就已完成,如文件的生成系统、形成者、编制目的等。著录的全过程性与电子文件管理的全过程性是一致的。

(三)综合性

这里的综合性是指著录手段的综合性。电子文件是在电子环境下生成的,对于电子文件的著录也应在系统中完成。随着计算机技术和档案管理手段的不断成熟和完善,在电子文件管理的初级阶段,采用人工著录的方式是电子文件著录的主导方式;随着自动化程度的加深,人工直接著录的方式将渐渐演变为系统自动著录和人工著录相结合的方式。

(四)多级性

电子文件著录的多级性是由电子文件之间具有有机联系的特点决定的。档案的分类有多种层次,从全宗、大类、属类、小类、案卷直到单份文件,呈现出多级别、多层次的特点。对不同文件进行著录结果是不一样的,但各层次著录线之间又不能截然分开,它们之间有密切的联系,著录时要尽量维护这种联系,使文件著录成为一个整体,能展现各级著录的层次结构,电子文件著录中能通过检索系统建立多级别、多层次的导航系统。

四、电子文件著录的组织

现阶段完整的电子文件著录工作分为两个阶段,归档前文件级和案卷级著录以及归档后案卷级以上著录,它们分别由电子文件的形成部门和电子文件归档后的档案部门完成。

(一)文件级和案卷(盒)级的著录工作

文件级和案卷级的著录工作一般应由电子文件的形成部门来完成,著录文件与电子文件同时归档,如《CAD电子文件光盘存储、归档与档案管理要求》(GB/T17678—1999)中规定归档光盘中存放着相应文件的“著录文件”。获取这些“著录文件”的办法很多,最佳办法就是在文件形成之前便将著录信息的形成和收集工作纳入考虑范围,真正实现“前端控制”。在机构中,为方便文件形成部门的著录,同时又能保证后期电子文件归档后著录形式的一致性和标准性,以便档案部门将著录数据纳入统一的数据库中,可以采用档案部门与文件形成部门合作的方式,由档案部门设计著录单,将需要著录的项目编制成统一的表格软件,如包括记录设计项目的名称、时间、来源、责任者、设计者等,发给文件形成者,由文件形成者在电子文件形成之初就按照相关著录项进行著录。由文件形成者进行文件级和案卷级的著录主要有以下几方面的好处:(1)可以真正实现电子文件管理的前端控制原则,保证文件的形成内容和著录内容的一致性;(2)充分利用文件形成者熟悉文件内容的优势保证著录信息的及时和准确,保证著录信息的高质量;(3)可以较好地避免电子文件归档后由于档案部门不熟悉文件形成之初的情况而可能出现的低效率工作,或避免著录项目的疏漏,保证著录项目的完整性;(4)可以促进档案工作与文件工作的衔接与协作,推动文件、档案管理流程的合理化改革。

(二)案卷(盒)级以上的著录工作

案卷级以上的著录工作一般应由电子文件归档后所在的档案部门完成。因为档案工作者与文件形成者具有不同的工作职责,文件形成者的业务工作只是整个机构职能的一部分,他们负责与自己业务工作有关的文件形成工作,并没有管理机构所有文件的职责;档案工作者则不同,他们负责管理机构所有的文件,需要树立对全部文件统筹管理的思路,即首先将所有文件纳入考虑范围,再在全宗内根据文件之间的联系划分类别。因此,案卷级以上更大类别的划分应该由档案工作者来完成,这样可以更准确地揭示各类文件之间更为广泛的内在联系;同时,归档后的电子文件并非处于静止状态,其每一次的迁移都需要进行记录,这样的记录只能由档案部门承担。当然,档案部门对于文件级和案卷级著录工作仍负有指导责任,在自动化程度不高的情况下,文件级和案卷级的某些著录项目不能通过软件或网络连接一步著录到位时,还需要在电子文件归档后由档案工作者补充完成,如档号、分类号等。因此,在电子文件管理系统的设计过程中,应充分考虑到这两项工作之间的联系,通过一定的规则和方法,将针对相同文件的所有著录项目尽可能全面地联系起来。

五、电子文件的著录项目

针对一份电子文件而言,完整的著录信息包括三个部分:第一,关于文件形成时所在系统的信息,如关于文件的背景、内容、结构、文件系统及其相互关系的著录信息;第二,档案管理系统中关于案卷级以上文件集合、系统、归档后管理活动及其相互关系的著录信息;第三,以纸质形式存在的著录信息,主要包括电子文件登记表、归档电子文件登记表、文件更改登记表、电子文件接收检验登记表、电子文件使用权限保护登记表以及物理载体整理结果的登记表等。可见,完整的电子文件著录既包括数字形式的著录,也包括纸质形式的著录。

所谓著录项目是指描述文件内容、结构、背景及文件系统信息的记录事项。由于电子文件的用户一般不能直接看到电子文件的内容,而是需要在一定的软硬件平台上借助于检索项查询所需信息,而检索项目是从著录结果中提炼加工而来的,因此电子文件著录项目是否全面、准确将直接影响到检索效果。当前,电子文件著录正向着标准化、国际化方向发展,结合《国际档案著录(通则)》[ISAD(G)](第2版),以我国《档案著录规则》(GB/T8—1999)所列出的具体著录项目为基础,一般电子文件著录应该包括以下项目:

(1)题名与责任说明项:小项包括正题名、并列题名、副题名及说明题名文字、责任者、鉴定者、归档者、接受归档者、著录者、迁移者、附件。

(2)稿本与文种项:小项包括稿本、文种、版本及版本说明。

(3)密级与保管期限项:小项包括密级、文件缓急程度、保管期限。

(4)时间项:小项包括文件形成时间或起止时间、文件归档或销毁时间和文件迁移时间。

(5)载体形态项:小项包括载体类型、数量、规格、盘带号、迁移前载体类型、迁移前盘带号。

(6)附注与提要项:小项包括附注、提要、机构史与传记、保存史。

(7)软硬件平台项:小项包括机器名称及型号、网络硬件环境(产品名称及型号)、网络系统名称及版本、操作系统名称及版本、应用软件名称及版本、迁移前硬件环境、迁移前软件环境、文件类型、迁移前文件类型、文件签署所用技术。

(8)排检与编号项:小项包括分类号、档案馆代号、档号、电子文件名、迁移前电子文件名、路径名、迁移前路径名、电子文件编号、缩微号、主题词或关键词。

(9)检索与利用项:包括检索条件、版权/限制复制。

可以看出,电子文件著录项目涉及文件内容、结构、形成背景和文件系统等各方面,较纸质文件的著录项目要复杂得多,尤其是第五项、第七项和第八项中的内容,更是直接反映出电子文件的特点。此外,电子文件的著录项目主要是针对一般的文件级著录而言的,案卷级及案卷级以上的著录还要根据实际情况有所增减,如全宗的著录应增加“全宗号”一项,同时具体的文件编号、成文时间等可以省略不予著录;特殊文件的著录也应酌情补充修改或去除一些项目,如程序文件的著录应增加编程语言一项,等等。