书城社科外国语言文化研究(第1辑)
13834400000031

第31章 心理词汇的组织及提取模型探讨(1)

刘颖

内容摘要:心理词汇的组织和提取研究是心理语言学有关言语感知研究中不可缺少的内容之一。有系统、有次序的心理词汇组织结构才能保证词汇迅速、准确地提取。心理词汇的组织和提取模型,形象、具体地展示了词汇在人脑记忆中的储存和组织情况,同时也揭示了言语或阅读时词汇输入记忆后人们的心理反应过程。

关键词:心理词汇、模型、输入、提取

心理词汇一直是心理语言学领域的研究重点之一,因为单词是语言的基本单位,单词信息的构成、表征和加工对语言的理解和产出起着重要的作用。为此,心理学家提出了各种模型和假说。其中,心理词汇的组织模型和提取模型更是众多学者关注和讨论的焦点。人的大脑中的心理词汇是如何被系统地组织起来的?言语感知过程中各层次的语言单位如何作用于心理词汇的提取?影响心理词汇快速准确提取的因素有哪些?是否存在最佳的提取模型?对于这些问题的回答,各个学者的回答也不尽相同。本文旨在对目前较为流行的心理词汇模型研究做一个回顾、总结和比较,借此把握心理词汇研究的发展动态,以期对本领域更深入的研究有所启示。

一、“心理词汇”概念的界定

心理词汇又称内部词汇(internal lexicon),是指储存在一个人内心的一个统一的动态词汇系统。它直接影响着一个人的语言表达系统,决定着语言的准确程度和流利程度。有学者把心理词汇比作一个图书馆,一个词就像一本书,放在心理词汇这个图书馆的一个地方,它的位置可以从不同的索引目录中找到(例如作者目录、书名目录、主题内容目录等等)。那么,一个正常人的记忆中究竟储存了多少词呢?据Aitchison(1978)的归纳,一个受过良好教育的人所掌握的词汇不低于50000,有时可能高达250000。《现代汉语词典》(修订本)收录的词条约为56000条,但这些词条并没有把很多专业词汇包括进去,所以汉语的词汇量究竟有多大,尚未有精确的估算。但是,英美人也好,中国人或其他国家的人也罢,储存在人记忆系统中的这些成千上万的单词不可能胡乱无序地堆砌在一起,这是因为这些单词的提取甚快而且较为准确。桂诗春(2000)教授通过实验指出:“正常人说话的速度是1秒钟6个音节(约3个词),实验结果也证实,我们识别自己母语的单词的速度是200毫秒1个词。”所以人类掌握单词数量之多和提取之快的现象表明,人的记忆系统中储存着高度组织起来的心理词汇。

心理语言学的研究还表明,心理词汇的组织方式和提取的难易程度是息息相关的。譬如:如果我们把已学到的词汇按照学习的先后顺序依次储存起来,我们很容易根据某些词语在列次中的相对位置确定习得这些词的时间。但要确定某个词有多少同义或反义词就决非轻而易举了,因为这个词所有的同义词或反义词可能会出现在心理词汇列次中的不同位置,这个位置被认知心理学家称为“层次网络”中的不同结点。这说明,心理词汇并不是简单的堆积和无序的排列。只有被系统组织过的心理词汇才有可能被快速、准确地提取。下面我们就根据心理词汇的组织和提取以及相关的理论作一下概括性的介绍。

二、心理词汇的组织模型

关于心理词汇的组织结构,一个普遍接受的观点是:心里语言学家Collins等人按照心理词汇的语义及其表征提出的语义网络。他们认为,从横向和纵向看,可把网络分为阶层网络模型和激活扩散模型。在网络中,大脑存储中的每个词都被视为一个“结点”,覆盖性最强的概念处于模型的顶部,同等级别的概念处于该网络的同一层面上,在模型的底部则为具体的下层的概念,而且每个结点之间通过语义关系相互连接,在大脑中构成一个整体的网络并相互激活。这两个模型在一定程度上反映了词汇在大脑中的存储次序。

1.阶层网络模型(Hierarchical Network Model)

阶层网络模型最早是由Collins Quillian(1969)提出来的。按照该模型提出者的说法,阶层网络就是指连接心理词汇的一些元素之间的阶层。首先让我们看一看,也许我们可以从中获得对阶层网络模型的直观了解。

这一部分心理词汇是按照类别和特征有规律、分层次(从属或统领关系)地组织成一个网状结构。在这个网状结构中,每一个词之间都有一定的关系或联系。比如当我们提到“transport”(交通工具)这个单词时,我们会很快地想到与之相关联的“vehicle”(车辆)、“craft”(船只)、“airplane”(飞机)这些概念,并且想到与之相关的一些特征。那么,每个单词所蕴含的意义及其类别和特征又是如何储存在心理词汇中的呢?现在就让我们先来分析一下Bransford(1979)提出的两个例句。

(1)Luckily,Aristotle was not blinded by the incident.

(2)Luckily,the rock was not blinded by the incident.

第一个例句是有意义的,因为我们知道Aristotle(亚里士多德)是个人,而人是有眼睛的这个特征使例一有了逻辑意义(meaning)。然而,第二个例句虽符合语法规则,但没有逻辑意义,因为rock(岩石)不具有(to be blinded)这样的特征。Aristotle有眼睛这个特征信息并不是具体的,也不是在语言习得时单独储存在记忆系统之中的,而是通过我们储存的词汇信息(Aristotle是人,人有眼睛)推断得出的。对此,Collins和Quillian(1969)认为:“用来储存词义信息的空间是有限的,所以在心理词汇这个大网络中,将有用的信息只储存在某一处有利于节省储存空间。这个原则被称为认知节约(cognitive economy)。”例如,汽车是“可以移动的”这一特征信息被储存在“交通工具”这个词汇中,因为所有的交通工具都具备“可移动”这个特征。语言研究者们认为,与其我们将这条信息储存在所有的词汇中,不如通过网络关系将储存的最高级的信息传递给其从属的词汇,因为我们具有推理的能力。这种储存组织方式更有利于储存空间的节约和词汇的有效提取。

Collins和Quillian(1969)通过语义证明实验(semantic verification task)来证明他们所提出的阶层网络模型。在这个实验中,试验者向被试者提问一组结构为“A是B”的句子,如“An apple is a fruit.”,然后让他们尽快地判断出这个句子是对还是错。其结果是被试者很少出现错误。实验者记下被试者每次做出判断所需要的时间,这个时间的长短被认为是心理词汇中信息组织的反映,也就是说,即使被测试者能极快地做出判断,同样也需要时间,而且这个时间是可以被测定的,那么这个时间就被认为可以用来“测量”心理词汇中词与词之间的距离。再来看,“cart”离“transport”的距离要长于“vehicle”的距离,所以,根据Collins和Quillian(1969)的模型,对句子“A cart is transport”做出判断的时间要长于对句子“A cart is a vehicle”做出判断所需的时间,因为我们在看到前一个句子时,我们必须在心理词汇中越过“vehicle”这一级才能搜索到更高一级有关“transport”的信息,然后再做出判断,所以所需时间也就相对较长。再比如,若需要对句子“A boat is movable”做出正误的判断,也必须向上穿越两级,(vehicle,transport)因为“Transport is movable”这条信息储存在“transport”这个最高等级之上。

Collins和Quillian(1969)做了大量的实验来证明自己的设想,他们将在实验中遇到的现象以及他们的设想称为“类别大小效应”(category size effect),也就是说,类别越大,在心理词汇网络组织结构中所处的位置就越高,其词汇搜索也就需要更长的时间。就像“animal”这个概念包含了许多具体的类别,如“bird”、“fish”、“dog”、“horse”等,所以“animal”是一个较大的类别,在这个类别之中还包括许多其他分类别,如两条腿的动物、四条腿的动物、家畜、野生动物等等。

阶层网络模型使我们对心理词汇的组织结构有了一个较为直观的理解,但这个模型本身也存在某些漏洞,其中的一个问题是:阶层网络模型的分层似乎有些过于阶层化,而且这样的分层只限于对可以分类的诸如“transport”、“animals”、“dwellings”、“furniture”等具体概念,而对于一些抽象概念如virtue、good和emotion等却不很适用,至少缺乏明显的适用性。

此外,人们对Collins和Quillian(1969)所提出的“语义距离效应”也提出了质疑。Conrad(1972)做了许多的实验和研究,认为特征或词语的使用频率(frequency)对词汇的反应时间起着关键的作用。例如“has ears”和“moves”是储存在animals这个阶层的两个特征,而“moves”这个特征被提到的频率要高于“has ears”这个特征被提到的频率,所以人们对“moves”的反应速度要快于对“has ears”的反应速度。再如“pulled by horse”是“cart”的明显特征,人们提到“cart”,往往首先想到的是“pulled by horse”而不是“movable”。与此同时,Rips Shoben和Smith(1973)也发现,阶层网络模型将类别中的所有分类别或成员都视为平等的,而在现实中,许多类别中都有其典型的成员。比如在“狗”的类别中,人们认为典型的品种是宠物狗。Rips(1973)认为类别中越是典型的种类或其成员越容易被辨认,反应时间也就越短,这种现象后来被称为“典型性效应”(typical effects)。

还有一些实验产生了与分层网络模型不同的结果。如对“collie”的分类应包括:“collie”,“dog”,“mammal”,“animal”。按照这种分类,根据阶层网络模型的理论,人们对mammal的反应时间(A collie is mammal)应该比对“animal”的反应时间(A collie is animal)要短,可实验结果并非如此:人们往往要用更长的时间来对“mammal”做出反应。这个实验结果表明,严格的认知节约理论并不完全适用于解释心理词汇的组织情况,正如人们也有时不能把储存在“animal”阶层的特征传递给下一阶层的“mammal”一样,因为“mammal”在实际中并不常被提到,所以在“mammal”阶层,其所包含的信息特征需被再次储存。

2.激活扩散网络模型(Spreading Activation Model)

由于Collins和Quillian(1969)提出的阶层网络模型招致了很多的批判,所以Collins Loftus(1975)在网络模型的基础上,放弃了“阶层”的说法,提出了一种新的语义表现模型——激活扩散模型。像阶层网络模型一样,扩散激活模型仍然将心理词汇组织成一个相互连接的网状结构,但不同的是,其结构并不是严格的阶层形式,而是一个更为复杂的概念网和概念关系网。这个模型包含了阶层网络模型的某些方面,同时也放弃了阶层网络模型中的一些观念。激活扩散模型不再认为所有概念间的关系都是平等的,相反,该模型认为网状结构中一些词汇或特征是较易被提取的,提取的难易程度是与其使用频率和典型性有关的。