书城文学宋代文化研究(第十九辑)
7426200000022

第22章 宋代类书的排检方式探析(2)

数排类书以宋代王应麟的《小学绀珠》为代表,它以数字为纲,用数目来分隶故实,同时对数据主题作出提示性概括,即所谓“以数为纲,以所统之目系于下”[清]永瑢等:《四库全书总目》类书类《小学绀珠》提要,北京:中华书局,1965:1151。实际上是把数字式的子目概括与提示性的数据主题概括结合了起来。如该书“天道类”下统摄的子目有两仪、三才、四大、三无私、九天、五天地、七政、三光、三辰、两曜、六宗、五纪、五星、二十八宿、十二次、三垣、四宫、北斗七星等,子目下先作主题提示,然后详列数据或出处。《四库全书总目》对这种编排方法的评价是:“与诸类书迥异。盖仿世传陶潜《四八目》之例,以数目分隶故实,遂为类事者别创一格也。”[清]永瑢等:《四库全书总目》类书类《小学绀珠》提要,北京:中华书局,1965:1151~1152。这一独具特色的编排方式对后代类书有相当影响。因此,《四库全书总目》指出:“后来张九韶《群书拾唾》、宫梦仁《读书纪数略》,虽采掇编辑较为明备,而实皆以是书为蓝本,踵事者易,创始者难,筚路蓝缕,又乌可没应麟之功欤!”[清]永瑢等:《四库全书总目》类书类《小学绀珠》提要,北京:中华书局,1965:1152。其中的“是书”即指《小学绀珠》。另外,清代《骈字类编》设有“数目”门,门下以数字为纲汇集材料,显然也是受了《小学绀珠》的影响。数排清晰、直观,读来琅琅上口,便于记诵,然而它对类书内容的选取有严格的限制。一般选定的内容均是可以用数字来统领、汇总的传统文化常识。因此,数排应用的范围具有一定的局限性。

二、检索方式

从工具书的角度讲,中国古代类书缺乏完备的检索系统,因而给现代人的利用带来了极大不便。然而类书作为那个时代的新型文献,是当时人所拥有的进行知识查检的最好工具,已融入了他们所能达到的最具前瞻性的检索理念。这些检索理念集中体现于类书的编排系统之中。毫无疑问,“天、地、人、事、物”是类书最传统的分类方式,但这种分类概念毕竟太宽泛,只能满足族性检索的需要。随着社会知识体系的不断丰富,文献中所涵盖的内容之间的关系越发错综复杂,笼统的分类自然很难对有关概念作出准确定位。于是,在传统分类的基础上又出现了主题的概念。主题建立在语言的基础上,用表示概念的词来揭示文献内容。分类与主题相结合的检索体系,在唐代类书中已经出现,《初学记》就是一个很好的例证。该书目录分为三层,前两层在书前,后一层夹在书中。前后两层为分类目录,前一层按照《易传》“天、地、人、事、物”的分类思想序分文献,后一层按照《中经新簿》“经、史、子、集”的分类序分文献。从前一层逐级层递展开而形成的子目一级的中间一层目录,是文献的主题目录,其各款目既是前一级分类目录的下位类,同时又是后一层分类目录的上位类,所以这中间一层的每个子目都兼有三重身份,它们巧妙地把分类目录与主题目录结合在一起:人事-礼部→祭祀、宗庙、社稷、封禅、朝会、婚姻→以经、史、子、集为序排列被选文献。“祭祀、宗庙、社稷、封禅、朝会、婚姻”即为礼部划分的主题。

《初学记》这种独特的目录体系(或检索系统)像一个严密的网,把所收录的几千种文献从纵、横两方面笼罩起来。同时纵横两方面(分类与主题两方面)相互交接,浑然一体。这样既提供了从古人的知识门类去检索文献的途径,达到了族性检索的目的,同时又提供了以文献论述的主题对象去检索文献的途径,达到了特性检索的目的,适应了各类读者的不同检索要求。分类检索与主题检索两种结构相互结合,展示了各自的长处,弥补了对方的短处,提高了检索效率。

如果说唐代类书开启了分类与主题检索相结合的大门,那么宋代类书则是对这种结合的固化与补充。在宋代类书中,《璧水群英待问会元》《事文类聚》《古今合璧事类备要》《记纂渊海》《古今源流至论》《群书会元截江网》《翰苑新书》等都体现了这一结合。其中,《记纂渊海》中的主题均以四字标题式的条目来表示,如“论议部之二”中设有“履而后知”、“噬脐何及”、“随材器使”、“强其所难”、“太刚必折”、“柔能胜刚”、“得不偿失”、“得失相补”、“过犹不及”等主题。由此形成的目录形式是:论议部→履而后知、噬脐何及、随材器使、强其所难→以经、子、史、传记、集、本朝为序排列被选文献。《事文类聚》前集“人道部”中设有“师”、“交友”、“故交”、“市交”、“息交”等主题,每个主题之下所引数据分为“群书要语”、“古今事实”、“古今文集”四类,“古今文集”又细分为“杂着”、“古诗”、“律诗”和“诗话”四类。与《初学记》相比,首先,主题设置更加鲜明,对数据的筛选更为严格,对选录的文献资料的中心思想和潜在主题有了更为深入的挖掘,这在一定程度上保障了文献数据按主题集中,不因分类体系的不同而疏散割裂,不受分类体系的限制而跨类相从,因而在横向上大大开拓了特性检索面;其次,对选取文献的分类突破了原来较为概括含糊的“经、史、子、集”的类分概念,而代之以更加详细具体的分类模式,从而使分类与主题相结合的定位检索更具可操作性。清代《古今图书集成》的检索系统实质上仍是对宋代类书分类与主题检索系统的继续与丰富。

在宋代,分类与主题相结合的检索系统也正适应了科举取士的需要,因而,此类应试类书的编纂盛况空前。以《璧水群英待问会元》为例,卷五“萃新门”下设有“时政急务”、“建立国本”、“进用大臣”、“申敕官刑”、“消弥灾变”等主题。每个主题下又分若干小主题,第一个小主题下辑录的文献分为“名流举业”和“故事源流”两类,其中“名流举业”又分为“立意发端”、“稽古伟议”、“法祖嘉猷”、“时文警段”、“绮语骈珠”、“当今献策”、“生意收结”七类,“故事源流”又分为“经传格言”、“历代事实”、“皇朝典章”、“先正论建”、“文章菁华”五类。其他小主题下的文献分为“策头”、“策段”、“事料”三类。门类下的主题设置如此明确,选取的材料归类如此细密,实为应对科举考试,便于记诵和征引之需。正是由于应试类书能够提供寻求所需“类属”知识的途径和线索,所以至今仍能得以发展和延续。今天冠以“汇编”、“萃编”、“题典”、“大全”、“集锦”等名称的考试用书皆属同类。古今应试类书虽内容、名称有别,但是便于索检和以类聚的工具书性质却没有改变。宋代应试类书对后世影响之深远,由此可见一斑。

就韵排系统而言,也存在韵排与主题相结合的检索系统。“以韵统字,以字隶事”,其中的“字”是指由含韵的标目字所构成的语词,即所谓的“关键词”,即主题。“以字隶事”也就实现了按主题划分。(“编排”部分对此已作论述)当然,韵排检索的局限性也是显而易见的。首先,韵排一般只限于检索含尾字或首字的条目,韵脚字出现在其他的位置则无法进行检索;其次,对音韵系统必须有相当的了解,否则检索无从谈起。

三、古代类书检索系统与当代检索系统之比较

(一)当代类书检索系统

一部类书少则数百万字,多则千万字乃至数亿字,对这么大的文字工程进行组织排比,其难度不言而喻。传统类书多沿用“天、地、人、事、物”的分类框架,这一体系无论从思想还是利用的角度都已不能适宜时代的要求。当代类书必须在编排检索方面另辟蹊径,按照文献的内部特点及今天读者利用的习惯,重新设计体系框架。从检索利用的角度出发,当代类书的编纂者在排比组织数据方面,都脱离了传统意识,进行了新的尝试。20世纪90年代以后,新型类书的编纂和出版开始起步,相继出版了《中国历代文献精粹大典》《中华思想宝库》《中国思想宝库》《中华大典》等多种大型新编类书。其中,《中国历代文献精粹大典》把从3000多种古籍中摘录下来的886万字数据分成政治、文艺、科技、经史、人物五大卷(大类),卷下分类,类下分条,条下设目,数据的分类比较细致。在类目名称也便于人们理解,如政事卷,社会交际类下的条目:君子之交、布衣之交、患难之交、文字之交、乡邻之交、骨肉情谊、师生情谊、扶困救危、胸怀大度、真诚相待、与人为善、化敌为友、知恩必报、尊老爱幼、宽人严己等名称,基本上符合今人的检索习惯。《中华思想宝库》把从经、史、子、集各类文献中采摘的资料分成人伦、治世、人文三大部,部下分篇(类),共25篇。人伦部下分论人、修身、人伦、道德、家庭、世风6篇;治世部下分政治、治道、君道、吏道、战争、民族、西学及中外关系7篇;人文部下分文学、史学、哲学、宗教、经济、教育、法学、儒学学术、文化艺术、科技自然、人物、典籍12篇。篇下设目,共计158个子目,子目下以时代先后排列资料。这一分类体系既照顾到古代文献的实际情况,同时也体现了当代科学分类的特点。《中华大典》将从3万多种文献中摘录的约7亿字的数据,汲取《古今图书集成》的体例,采用经目和纬目相交织的结构模式,同时参照现代科学门类,基本上一个学科列为一个典,如哲学、政治、文学、军事、经济等共22典。典下以分典、总部、部、分部划定,分部下根据各学科特点拟定标目。纬目设9项,依次为:题解、论说、综述、传记、记事、著录、艺文、杂录、图表。纬目用以容纳各级经目的内容,经纬交织,体例完整,便于检索。

当代类书的检索功能得以强化,除了分类编排科学系统外,还对书中的数据进行了多角度的标引,如主题标引、功能信息标引、学术名词标引、文献名称标引、人名地名机构名标引等,还可根据数据的价值大小、内容重要与否进行加权处理,把加工处理的结果组成各种索引附于书后。利用标引系统,可对同一数据,按其涉及的不同主题分别从多个角度予以反映和揭示,这样既提供了多途径检索,又避免了重复收录。此外,由于现代信息技术手段的应用,当代类书在编纂时都有了电子版,甚至网络版,因此,检索系统得到了完善。

(二)网络搜索引擎

在宋代类书的检索系统中,无论是类排,还是韵排,都把主题检索自觉运用其中,从而构成了一种典型的分析分类体系,它在展示文献内容的门类脉络的同时,又揭示出门类之间错综复杂的关系。这对今天网络搜索引擎的发展与完善仍有启示和借鉴意义。

随着信息网络的发展,网上资源异常丰富而易变,客观上要求出现效率较高的检索系统。1994年以后,搜索引擎异军突起,从纯技术(IT)角度讲,它的确解决了检索的时效性问题,给人们的信息查询带来了巨大便利,但是这种单纯的自然语言检索系统也常伴随提供许多风马牛不相及的信息,查全率和查准率难以保证。这就促使搜索引擎由注重信息搜集的数量,转向注重信息搜索的质量,检索组配由单纯的字面组配,转向概念组配。这也表明信息的数量越庞大,检索系统的筛选过滤功能和智能化程度越需得以完善。最可行的解决方案是将人工语言与自然语言结合起来,在两者之间建立对应,因此人工语言在网络信息的整序和检索中受到越来越多的重视。以上是就搜索引擎的检索语言而论。当然,这与类书的检索语言——类序语言(部、类、门、编、典)和音序语言,由于编制技术手段和应用领域的差异,因而属于不同范畴的概念。因此,搜索引擎与类书在检索语言方面,并无可比性。

就检索方法而言,目前搜索引擎主要有两种方式,即分类检索与主题检索。二者各有千秋,任何单一的检索方式即使功能再强,也无法完全满足不同知识背景和不同信息需求者的查询需要,客观上就要求实现分类检索与主题检索的一体化。网络信息的数字化和软硬件技术条件为分类检索与主题检索的真正结合奠定了基础。这一结合也是在网络环境下,对信息进行整序、控制和检索的最有效方法。目前,这一课题正在研发之中。“网络信息的分类、主题一体化整序,就是既对信息进行分类整序,也对信息进行主题整序,把索引数据库的信息通过类目、关键词、信息形式特征、信息编码特征等关联起来,从而向用户提供分类主题一体化的检索功能。所谓分类主题一体化的检索功能,就是用户除了可以独立进行分类检索和主题检索并随意转换检索方式外,还能通过分类与主题的相互限定改变检索范围,达到最佳的搜索效果。”俞君立、陈树年:《文献分类学》,武汉:武汉大学出版社,2001:100~103。

分类主题一体化,早在我国古代类书的检索系统中已得到很好的实现,可以说,这是纸质时代古人智慧的结晶,然而在信息时代的今天,它却是我们在搜索引擎研制方面遇到的一大难题,这不得不引起我们的反思。