书城社科档案信息检索
12551300000013

第13章 《中国档案主题词表》的结构和使用

一、主题法简介

“主题”一词源于德国,最初是一个音乐术语,指乐曲中最具特征并处于优越地位的那一段旋律———主旋律。它表现一个完整的音乐思想,是乐曲的核心。后来这个术语才被广泛用于一切文学艺术的创作之中。日本将这个概念译为“主题”,我国从日本翻译它时就借用了过来。我国古代对主题的称呼是“意”、“主意”、“立意”、“旨”、“主旨”、“主脑”等。主题是作者对现实的观察、体验、分析、研究以及对材料的处理、提炼而得出的思想结晶。它既包含所反映的现实生活本身所蕴涵的客观意义,又集中体现了作者对客观事物的主观认识、理解和评价。

中华人民共和国国家标准《文献主题标引规则》(GB3860—83)将主题定义为:“主题是一组具有共性事物的总称,用以表达文献所论述和研究的具体对象和问题,即文献的中心内容。”表达文献主题概念的词叫主题词。广义的主题词泛指标题词、单元词、关键词和叙词。标题词是一种检索标志,通常指文献中比较独立定型的、经过规范化处理的、可直接表达文献主题内容的词、词组和短句,而不是指文献“标题”中的词;单元词指来自文献并经过规范化处理的、能表达文献主题的最小的、最基本的词,简称元词;关键词是指从文献题名、文摘和正文中抽出来,不作规范化或只作极少量规范化处理、极有实际意义的词语;叙词指从大量文献中优选出来,并经过多方面严格控制的用以表达文献主题的词或词组。狭义的主题词就是叙词。主题法就是以自然语言词汇为基础,以规范化的主题词(叙词)作为检索标志的文献标引与检索方法。主题词是将自然语言中的名词术语经过规范化处理后直接作为文献标志的检索语言,因此又称为“主题检索语言”。

主题法的优点主要集中体现在:(1)直观性强,因为主题法选用的主题词都是对自然语言进行规范化处理后形成的,比较符合人们的一般用词习惯,容易与自然语言结合使用;(2)检索效率较高,使用主题法检索文献可以不考虑学科体系和分类号码,直接通过主题词所表达的文献主题检索某一类事物,具有检索问题集中、主题突出的优势;(3)使用方法较灵活,主题法的编制和使用较为灵活,在确定了某一主题词的同时,也相应建立了与之具有词间关系的一组词语,明确了各主题词之间的关系,增强了使用的灵活性。《汉语主题词表》和《中国档案主题词表》在实际使用过程中都充分体现了这些优势,成为我国图书文献检索和档案文献检索必不可少的检索工具。

二、《中国档案主题词表》简介

《中国档案主题词表》是由表达档案内容主题的自然语言中优选出的语义相近、族性相关的科学术语组成的规范化词典。在档案标引和检索过程中,它是用以将档案标引人员及用户的自然语言转换为统一的主题词检索语言的一种术语控制工具。它主要供档案馆、档案室及文书处理部门标引和检索档案、文件、资料之用。它是我国第一部用于档案主题标引和检索的大型国家级档案检索语言工具,是国家标准《档案著录规则》的配套项目,对促进我国档案主题标引标准化具有十分重要的作用。1988年《中国档案主题词表》试行本出版,1994年修订再版,新增词目2134条,删除词目5331条,增补词间关系(参照项)1.5万余处;对“词目首字笔画检字表”进行了订正,补充了漏字;将主表款目排序改为以词目音序、语调结合字形画划排列;编制了词族索引和人名、机构名两个附表。这次修订使《中国档案主题词表》有了较大程度的完善和提高。

三、《中国档案主题词表》的选词原则和选词范围

(一)选词原则

力求思想性、科学性和实用性的统一;选用的主题词能够反映综合性档案馆和机关档案室收藏档案内容的主题概念,在标引与检索中具有实用价值和一定的使用频率;选用的主题词符合汉语的结构特点,词形简练,概念明确,词义单一。

(二)选词范围

主要选取20世纪初叶以来,反映党、政府机关各项管理工作内容的名词,党政公文中经常涉及的政治活动、科学研究、生产技术、经济建设等方面的名词术语,以及反映新事物概念的专有名词。同时也选取了以下方面内容的词或词组:(1)中国各民族、各民族文字与语言的名称,世界上其他主要文字、语言的名称,主要宗教名称;(2)常见的党、政、军、群、企事业组织机构名称,在全国范围内有较大影响的知名人士的姓名;(3)行政职务和专业技术职务名称,军职与军衔名称;(4)部分国家法律与规章的名称;(5)节日、节令名称,具有特殊重要意义的会议名称和有重大影响的历史事件名称;(6)学科名称及反映学科具体内容概念的部分词目,重要的、常见的化学元素、矿物、合金、化合物名称;(7)小说、戏曲、曲艺、诗歌、绘画等文学艺术作品的泛称词及其使用频率高的下位词;(8)田径运动、水上运动、冰上运动和体操等体育运动项目名称及其直接下位词;(9)常见的动物、植物、疾病、医药及各类工农业产品的名称;(10)枪械、火炮、弹药等武器称谓及其直接下位词。

四、《中国档案主题词表》的结构体例及其使用

《中国档案主题词表》由主表(字顺表)、词族索引、范畴索引、首字笔画检字表和附表、附录组成。

(一)主表的结构及其使用

主表,也称字顺表,是《主题词表》的正文部分,共收录主题词25891条,其中正式主题词21785条,非正式主题词4106条。非正式主题词是正式主题词的同义词和准同义词,用来指引和查找正式主题词。主表的基本单元是主题词款目,包括款目主题词及其汉语拼音、范畴号、注释和词间关系等内容。

关于主表的说明:

(1)款目主题词,指列于标目位置的主题词,依照首字音序、音调,结合汉字字形笔画排列,首字相同者依第二字音序、调序、字形笔画排列,以此类推。非汉字字符起首的主题词,一律排在汉语拼音音序之前。

(2)范畴号,是款目主题词的范畴分类类目代号,标识在款目主题词的右侧。借助范畴号可以在范畴索引中查询与该主题词同属一类的有关主题词。

(3)注释,是对主题词所作的简要说明。包括限定注释和含义注释两种。

限定注释,用于指明主题词的使用范围(时间或空间),用圆括号注于该主题词之后,是该主题词的组成部分。

如:古田会议(1929)

革委会(文革)

旺季(商业)

庐山会议(1970)

含义注释,用于说明该主题词的特定内容,用圆括号注于该主题词之下,不作为主题词的组成部分。

如:农业八字宪法

(土、肥、水、种、密、保、管、工)

三北地区

(东北、华北、西北)

五爱教育

(爱祖国、爱人民、爱劳动、爱科学、爱护公物)

(4)词间关系,又称参照系统,是用来说明与款目主题词发生关系的一些词,其中包括等同关系、属分关系、相关关系等。词间关系用Y、D、F、S、Z、C分别表示用、代、分、属、族、参六个项目。每一条款目主题词的词间关系项目不等。当款目主题词是非正式主题词时,仅设“Y”(用)项,即仅列出其正式主题词。

等同关系,是指两个或两个以上概念相同或相近的主题词之间的关系,在这些词中选定一个比较科学并常用的词作正式主题词,其余的作非正式主题词。正式主题词和非正式主题词分别用符号“Y”(用)、“D”(代)来表示。

例如:

精简机构正式主题词

D紧缩机构非正式主题词

紧缩机构非正式主题词

Y精简机构正式主题词

属分关系,是指概念上具有隶属关系的一系列主题词之间的关系。下位词即分概念,上位词即属概念,最上位词即族概念。属分关系的词全部排在款目主题词的下面,一般按照“分—属—族”关系排列。即分概念(下位词)排在最前面,用“F”(分)表示;属概念排中间,用“S”(属)表示;族概念(最上位词,也是族首词)排在最下面,用“Z”(族)表示,并注以“※”符号。

例1:

统一战线(款目主题词)

F爱国统一战线分概念(下位词)

国际统一战线分概念(下位词)

民族统一战线分概念(下位词)

爱国统一战线分概念(下位词)

S统一战线属概念(上位词)

例2:

船舶遇难(款目主题词)

S交通运输事故属概念(上位词)

Z事故 ※族概念(族首词)

例3:

电工橡胶(款目主题词)

F硅橡胶分概念(下位词)

S固体绝缘材料属概念(上位词)

Z绝缘材料 ※族概念(族首词)

相关关系,是指主题词之间不存在等同关系和属分关系,但在标引或检索时可以互相参考的一种关系。在主表中用“C”表示。对于不同历史时期所表述的相同或相近概念的词目也视为相关关系。

例1:民主人士

C民主党派工作

民主党派工作

C民主人士

例2:农业税

C田赋

田赋

C农业税

在主表中建立这种词间关系,对于科学使用主表是非常有利的。主表中的正式主题词是根据我国档案信息内容中常见的词语确定的,但由于我国档案信息的来源和组成都非常复杂,对某一种事物只用一种主题词显然是很难全面概括其全部含义的,但同时又为了避免同一类事物主题词过多而造成概念重复,不便检索,于是采用了从词语间的逻辑属性上区别它们之间的关系。这样建立起来的关系,使主表在档案著录和标引时具有很强的可操作性,因为无论事物概念是大是小,都可以在各种词间关系中寻找到相应的归类,从而进行准确的定位。

(二)词族索引的结构及其使用

词族索引,也称族系索引、等级索引,是把属性相同的主题词按照其概念等级阶梯式地排列而成的概念体系。它是把主表中具有属种关系、包含关系和整体部分关系的正式主题词,按所属级别建立的一种词族关系系统,也是一种查询相同属性主题词之间级别关系的索引。这种索引,是在标引和检索中提供系统查词和选定标引词的辅助工具,可以避免人们在查词时概念错位或重复,在计算机检索系统中,是实现自动扩检、缩检、上位词登录及满足族性检索的重要手段。

词族索引主要表示主题词的整体与部分的属分关系,将族首词与隶属于该族首词的下位主题词概念按照等级排列组成索引。族首词为一级,其下每置一个点(·)为二级,每置两个点(· ·)为三级,三个点(···)为四级,以此类推。族首词以下的同级主题词之间按照汉语拼音音序排列,但不注拼音。

例如:

ZHIWU

植物※一级词(族首词)

·园林植物二级词

··花卉三级词

···水生花卉四级词

这种关系在主表中是用F(分)、S(属)、Z(族)表示出来的。

对词族索引的说明:

(1)族首词是具有独立检索意义和族性检索意义的主题词。一般来说,外延过广,类无专属的主题词或外延过窄,覆盖面过小的主题词不宜选作族首词。(2)词族索引为了集中词汇,便于查词,选定了少量的类无专属的一般概念主题词作族首词,但其下分系统可以单独成族者,则另成族。例如,将“试验”、“设备”作为族首词的同时,又设立了“电工试验”、“力学性能试验”、“冶金设备”等作族首词单独成族。

(3)具有属分关系的主题词,一般是以一个词入一个词族为原则,少量主题词按照其属性需跨两个或两个以上词族者,分别在不同词族中显示。如:“档案馆”一词分别在“文化机构”和“档案机构”两个词族中显示,均为二级词。

(4)有少量主题词按其属性需跨两级者,则在两级下重复显示。如:“包装纸板”一词在“包装材料”词族中为二级词,在“纸制品”词族中为三级词。

(5)词族索引与主表之间通过汉语拼音联系,词族索引中的每一个主题词都可以按照汉语拼音在主表中查到。

(6)主表与词族索引之间通过缀以“※”的族首词联系,在主表中缀有“※”的主题词,可在族首词目录中查到该词在词族索引中的页码,继而在词族索引中查到该族首词,并可查到属于该族的主题词。

(三)范畴索引的结构及其使用

范畴索引,又称为范畴分类索引,是将主表中的全部主题词按照既定的类目分类排列,以便按类查词的一种辅助工具。范畴索引是参照《中国档案分类法》的类目设置并结合主题词词目的属性建立的。范畴索引将《中国档案分类法》和《中国档案主题词表》连接起来,两相对照,为主题词进行准确分类提供了重要依据。

它依据《中国档案分类法》的类目设置,将《中国档案主题词表》主表中的全部主题词划分为20个一级类目,103个二级类目,37个三级类目。类目的标识符号采用汉语拼音字母与阿拉伯数字混合号码制,即在一级类目用一个字母标识,二级类目用双字母标识,三级类目用双字母后加阿拉伯数字标识。例如:

A政党(一级类目)

AA会议(二级类目)

AB组织(二级类目)

K财政、金融(一级类目)

KA财政(二级类目)

KA1财政管理(三级类目)

对范畴索引的说明:

(1)一般情况下,一个主题词划归一个类目。

(2)当一个主题词按其属性应划归两个或两个以上类目时,即在有关类目中重复出现。如:“国际运河”一词,在PC(水路)和EB(国际组织与事物)两类中出现。这种将有双重属性的词在范畴索引的不同类目中同时出现的做法,有助于标引人员和检索人员在不同类目中均可查到有关词目,不致因词目的单线排列而造成某些内容的不完整。

(3)范畴索引中的词目,如果是非正式主题词的,一律在其下面用“Y”标出与之相应的正式主题词;是族首词的,一律缀以“※”号。

(四)附表的结构及其使用

附表包括《人名表》和《机构名表》。主表与附表收录的主题词加在一起构成主题词总数。

1.《人名表》的收录范围

人名表主要收录明清时期进士,三品以上命官;国民政府及执政党正部级官员;中华人民共和国中央人民政府及中共中央部委局办一级机构正职以上领导人;其他党派、群众团体主要负责人;上将、正军职人员;全国各界著名人士;著名华侨与国际友人;与中国重大历史事件有关的著名外国人。

对《人名表》的说明:

(1)人名表的款目结构及款目词的排序方法与主表相同,但不标范畴号。

(2)注释由生卒时间、籍贯或出生地构成,注在主题词下面,不作为主题词的组成部分;对出生年不详的,用“?”代替,卒年不详的,1880年以前出生的标“?”,1880年以后出生的,暂不标记。

(3)词间关系只设 Y、D项,对有别名、笔名、字号者,凡党政人物,以从政名为正式主题词,其余为非正式主题词;凡社会名流,以最常用名为正式主题词,其余为非正式主题词。

如:

LINBOQU(汉语拼音)

林伯渠(正式主题词)

1885—1960湖南临澧(注释)

D(代项)林祖涵(非正式主题词)

SHENJUNRU(汉语拼音)

沈钧儒(正式主题词)

D(代项)沈秉甫(非正式主题词)

沈衡山(非正式主题词)

ZHANGMIAOLING(汉语拼音)

张妙玲(非正式主题词)

Y(用项)常香玉(正式主题词)

2.《机构名表》的收录范围

《机构名表》主要收录明清中央政府机构以及著名工矿、学堂名称;辛亥革命以来中央政府及其直属机构及大军区的名称;执政党中央机构和派出机构的名称;其他政党、团体中央机构的名称;有影响的全国学会、协会、宗教团体的名称;中央级企事业单位的名称以及与上述机构有相同级别的临时机构的名称。

对《机构表》的说明:

(1)机构表的款目结构及款目词的排序方法与主表基本相同,但不标范畴号和注释。

(2)必要时在机构名后加词目后缀,如明、清、民国、伪等限定概念。

(3)词间关系设Y、D和C项。

(4)同一时期的机构一般以规范化的简称为正式主题词(无规范化简称用全称)。

少数特殊的机构以俗称为正式主题词,如:

QUANGUOFULIAN

全国妇联(正式主题词)

D(代项)中华全国妇女联合会(非正式主题词)

(5)不同时期且名称有所变更,但职能基本相同的机构互参。如:

JIUSANXUESHE

九三学社(正式主题词)

C(参项)民主科学社(非正式主题词)

《中国档案主题词表》最后附有《首字笔画检字表》、《档案著录规则》、《中国历史纪年表》、《韵目代日表》、《干支次序表》和《化学元素周期表》。《首字笔划检字表》包括词目首字笔画检字表、机构首字笔画检字表和人名姓氏笔划检字表,均按款目主题词的首字笔画顺序排列而成,字后注有该字在主表或机构名表和人名表中最先出现的页码。