书城社科新闻学十年(1998-2008):多元与分化
13840400000012

第12章 互联网调查研究方法综述(4)

(4)文献资料分析(documentary analysis)

定性研究者常常希望从研究对象的一些个人资料中,补充和加深他们对所研究问题或现象的理解。这些个人资料主要包括:记录每天活动或时间的日记或日志、个人的传记或自传等。收集这些资料的方法有两种:请示式的和非请示式的(solicited and unsolicited)文献资料征集。

请求式的征集是直接向研究对象提出征集请示,希望他们能提供相关内容的自传资料或日记式记录的资料。这类资料由于内容丰富、具体、生动,具有很好的参考价值。但是由于坚持记录并不是容易的事,因此愿意接受邀请者和不愿意者可能会有显著的差异。与传统的文献资料分析法相比,网上征集的方法也需面对寻求参加者的合作和使之愿意维持合作的问题。但是网上的方法具有一些传统方法所没有的优势:例如可能更快地征集到更大范围、更多地点的文献资料;由于资料是计算机输入,因此手写字体难于辨认的问题就不复存在;更重要的是,与直接和人交谈相比,使用计算机的人们常常更愿意与计算机屏幕“相互倾诉”(Thu Nguyen and Alexander,1996)。为什么“对着屏幕表达思想比对着人容易得多”?Thu Nguyen and Alexander(1996)认为是因为人—机的相互作用可以使得人们投射他们的思想并感受到自己的思想。Matheson and Zanna(1990)认为有两个理由:1.计算机使用者更加放松和更能思考,因为他们感到不那么由于其他人的可能评价而受到抑制;2.他们似乎也能更清楚地了解他们的自我。所敲入内容的熟悉感和非正式的交流似乎能使人更集中于他们自己的反映和判断。Gibson几年前注意到“我所认识的使用计算机工作的每一个人似乎都逐步相信:屏幕后面有某个你看不到但你知道在那里的实际空间”(Kitchin,1998)。“屏幕后面的地方”似乎是个体的人可能与自己的精神对话的一种概念化的表示方式。对于计算机的迷恋,更深层次的是精神上而不是出于功利上的;寻找的是精神和心的一个家。计算机的这种将个人反射回自己的能力,提供了一种理想的研究方法:一些个人的CMC日志可以生成有关个人主观自我的丰富的资料,这是一种自我接近的、联系自己个人意识的一种几乎是完全透明的过程。

非请示式的征集是通过各种可能的手段去收集有关的资料,传统的文献资料研究主要通过图书馆、档案馆、个人收藏品等来收集资料。与传统的方法相比,网上的资料如个人信件等要比写在纸上的资料“短命”得多,但是互联网提供了在众多公共网站寻找有关资料的极好条件。利用现有的网络技术,有可能搜索到各处许多相关的甚至是保密的资料。不过网上资料的著作权问题可能是一个更难解决的世界性问题。此外关于资料的可靠性和真实性问题也同样存在。

3.混合研究方法(Mixed Methods)

在实际的应用研究中,研究者常常希望采用网上和网下、定量与定性研究相结合的方法。网络技术和软件技术的发展使混合方法的应用成为可能。现在,研究者进行文件自动检索、扫描和分析已不是难事,定性分析软件和定量分析软件的接口也很容易,网络上获取的定性数据和定量数据都可以很方便地转换到常规的分析软件中。

例如,如果研究者希望了解网上互动和网下互动之间的差异性和相似性,将CMC方法和FTF方法相结合是至关重要的。Stewart等(1998)和Hodkinson(2000)都曾分别采用面对面访问和网络访问的方法,对有着现实生活和虚拟范畴的群体进行了比较研究。Corell(1995)采用三种方法来研究一个网上社区及其活动。首先,她采用观察法对光顾一个虚拟咖啡馆的老主顾间的访问流量进行每天的观察,偶尔也会问些问题,要求他们解释一下他们的各种行动和对话;其次,她采用半结构式的方法通过e-mail访问了12个老主顾;最后,她又在两个面对面的小组座谈会中访问了8个老主顾。类似的研究者说明网上和网下研究相结合可以提供关于网上和网下互动的宝贵资料,但是这种混合的方法并不一定总是可行的(Kendal1,1999)。

三、测量互联网络使用情况的调查(第二类)方法

由于互联网络的复杂和互联网研究历史的短暂,目前测量互联网络使用情况的调查方法还很不成熟,虽然不同的研究机构和研究者提出了多种不同的方法,但是基本上仍处于探讨性的阶段,还没能形成类似于收视率调查的公认的、成熟的一整套方法和测量系统。

综观目前国际上主要的知名互联网研究机构的测量方法,可以将互联网使用情况的调查方法总结归纳为三大类:以网站为中心的测量、以用户为中心的测量和以广告为中心的测量(Jephcott,2000)。

1.以网站为中心的测量(site-centric measurement)方法

这一类的测量也叫做基于网站的测量(site-based measurement)或服务器方测量(server side measurement),主要通过网站服务器的log进入量的统计来提供网站的使用情况或受众的测量量,提供的是有关网站的“供应量”的数据。这一类的测量需要有专门的软件,例如Web Trends软件等。具体的测量方法主要有三种:

(1)服务器日志文件分析(server log filesanalysis)

日志文件指的是web服务器或代理服务器创建的文件,文件上包含着服务器上访问活动的全部信息。在服务器上安装了相关的统计软件,就可以收集到所有入站的流量。为了保证准确性,一般还要结合人为的检查。目前从事这种受众测量的国际研究公司主要有:Web Trends,Accrue,Net Genesis,I/Pro,BPA,ABC等;中国互联网络信息中心CNNIC目前采用的是Web trends公司的日志分析软件对我国的网站访客流量进行统计认证的。

(2)网站详情分析(Site Specific Analysis)

网站详情分析的方法是在每个网站的每张网页上插入代码,因此每次网页在浏览器上出现时,都会被自动地被记录为访问(Visit)。目前从事这种受众测量的国际研究公司主要有:IMR,Ned Stat,Web Side Story等。

(3)网络广告服务(Ad Network Service)

网络广告服务指的是当网上广告被利用时,广告服务器软件就会编辑数据进行记录。目前从事这种受众测量的国际研究公司主要有:Double click,24/7,Engage,Fly cast,Value Click等。

以网站为中心的测量方法的主要优点是,能得到服务器的全部所有命中(hits)的详细情况;此外,各种大小的网站都能使用这种方法来测量。但是这种测量存在不少问题。首先,这种测量无法得到使用者的基本资料;其次,如果是网站所进行的自我统计,那么就不可能与其他网站做比较;最大的问题可能是在log文件中存在大量的噪声,这主要是由于软件所测量的是命中,而一个命中只表明用户点击了一个文本文件或图形文件,因此得到的统计量可能无法反映真正访问量的大小。例如一个网页可能包含了5个文本和图形文件,那么每次只要进入该网页,就将记录5次命中;此外,不少网站含有帧(frames),一个页面上可能有多个帧,每个帧都会被记录成一个命中,因此含有帧的页面也可能会被多次记录;还有机器人或搜索引擎发出请求(request)时,也有可能被记录成命中;上述噪声反映的是系统作出了过高估计的测量。另一方面,噪声也有可能造成测量量的低估,这主要是缓存(cache)的问题,包括代理服务器(proxy)缓存、PC-RAM缓存、和浏览器(browser)缓存的问题,因为人们从缓存记忆中浏览的网页(一般是浏览率很高的网页)并不会在服务器中生成命中,这种由于缓存造成的测量错误可能是以网站为中心的测量方法所面临的最严重的问题。

2.以用户为中心的测量(user-centric measurement)方法

这一类的测量也叫做用户方测量(user side measurement)或基于用户的测量(user-based measurement),主要通过对使用网络媒体的个人的即时跟踪来提供对受众的测量量,测量的对象主要是互联网用户或网民,提供的是有关用户的“消费量”的数据。目前国际上常用的具体测量方法有两类:固定样本的用户测量;以及用户结构、分布和行为的调查。

(1)固定样本的用户测童

在固定样本(panel)成员的电脑中装上一个测量软件或被动的“测量仪器”,以跟踪网民用电脑去过的所有地方,看过、听过和做过的所有事情。这种方法非常类似电视收视率调查中所采用的方法:在固定样本家庭的电视机中安装“测量仪器”(TV-meter),常用的叫“人员测量仪”(people meter),以监测电视观众所观看过的所有频道、节目和时间等。当然监测用的固定样本应该是尽可能对用户总体有代表性的样本。目前从事这种受众测量的国际研究公司主要有:Media Metrix,NetRatings,PCData,NetValue等。其中NetValue已经开始在中国的北京、上海和广州进行15-65岁的固定样本家庭用户测量(Lee,2000);中国互联网络信息中心(CNNIC)也正在着手筹建中国大陆网民的固定样本测量系统。

(2)用户结构、分布和行为的调查

这种用户调查通常采用传统的入户或通过电话和邮寄的方法以及结合电子邮件的方法进行,以了解目标群体或网民的网上和网下行为。目前从事这种受众测量的国际研究公司主要有@Plan,Media Metrix等。在我国,已经有不少的研究机构和商业性的调查公司在从事互联网用户方面的调查研究,例如:中国社会科学院社会发展研究中心、互联网实验室、华通现代市场信息咨询公司、北京零点市场研究公司,等等。Ismasia2000年8月通过在中国18个主要城市4000多名调查对象的网站使用情况调查,给出了中国家庭用户排名前二十家网站的名单(Boswell,2000);中国互联网络信息中心(CNNIC)于2000年1月发布的第七次中国互联网络发展状况统计报告中,也给出了采用电话调查(6万余个)和面访调查(6千个)得到的我国网民的数量、结构、分布和行为方面的估计结果(CNNIC通讯,2001年)。