书城社科新闻学十年(1998-2008):多元与分化
13840400000013

第13章 互联网调查研究方法综述(5)

以用户为中心的测量方法的主要优点是,能够得到用户的人口背景资料;在固定样本用户的监测中,不再存在由于缓存出现的高估或低估的问题,因为用户所浏览的所有页面都会被测量,而且不会被重复测量;由于采用的是一致的方法,因此可用于比较各个地区和国家内外的不同网站的使用情况。这种测量方法存在的主要问题是:首先,固定样本必须对网民总体有代表性。由于互联网是一个快速发展的领域,网民的总体也在不断地变化,如何使固定样本能适应这个动态总体的情况,在实践中不是一件容易的事。目前解决这一问题的主要方法是进行定期的大样本调查或称之为基础性调查(enumeration survey),以此及时地掌握互联网用户的覆盖率,同时保证用户固定样本的结构能比较准确地反映所在地区或国家网民的社会经济结构。根据NetValue网站所提供的信息可知,一般欧美国家每年进行的基础调查所访问的人数都达到数万人:法国45,000人、德国61,000人、英国34,000人、美国32,000人。而CNNIC于2001年1月完成的基础调查的样本量也高达68,620人。其次,这种测量可能对小网站的覆盖不足,因此测量结果对大网站比较有参考价值;对于小网站而言,由于样本中对应网站的网民数量可能很小,从而导致估计误差过大以至于没有使用价值。这种测量的主要问题是一般只能测量家庭用户的使用量,主要是晚间和深夜的流量;到目前为止,世界上似乎还没有一个机构或公司,能够成功地建立学校或工作单位的固定样本来监测日间的互联网流量,主要是业务上使用的流量。而且,建立和维持用户固定样本监测系统的费用是相当昂贵的。总之,对于一些互联网测量机构所发布的数据,需要注意这些数据一般可能只是根据某个(某些)地区(国家)的家庭用户固定样本得到的,一般并不包括专业用户的使用情况,也不包括其他地区或国家的使用情况。

3.以广告为中心的测量(ad-centric measurement)方法

以广告为中心的测量主要通过广告服务器的log进入量的统计来提供网站的使用情况或受众的测量量。实际上这一类的测量也属于用户为中心测量中的基于固定样本的测量,只是这一类的测量更强调对广告横幅(ad banner)的跟踪,其数据报告一般会详细地给出按照横幅广告、广告主和域名分类的结果。这一类的测量类似于传统媒体中的广告监测,例如将各个电视频道的所有广告录像,然后按照广告的类型、产品/服务的类别、广告主、频道、价格、地区等指标,分类整理成广告监测报告,提供给相关的客户。因此,这一类的测量从软件的技术要求上可能是更高的,不仅能够记录页面的浏览和辨别唯一访问者,还需要准确地、自动地测量对广告的浏览和点击(clicking)。一些专业性的互联网监测机构自行设计了测量的软件,其中比较有名的是Nielsen//NetRatings公司,该公司从测量技术、数据报告技术以及固定样本的建立和维护方面都有其独到之处(B1och,2000以及Nelsen//NetRatings的网站资料)。

四、小结和展望

以互联网络为工具进行的网络调查(第一类),作为一种新的研究手段和方法,正在悄然迅速地发展着。不少的机构和个人已经开始采用或辅助采用这种快速、便利和廉价的研究手段。虽然仍然存在不少未能解决的问题,但是随着上网人数的快速增长,网络调查方法的研究将会引起社会各界更多的重视,也将吸引更多的传播研究者投入更大的热情去从事这方面的研究。相信我国的研究者也会及时地加人这一行列,充分利用国外学者的研究经验、并结合传统的研究方法和中国互联网的发展实际,搞出一套既符合中国实际、又具有一定前瞻性的利用互联网络进行调查研究的科学方法。

测量互联网络使用情况的网络调查(第二类),由于其潜在的商业价值和市场需求,似乎更加受到商业性研究机构的重视。目前国际上已经有数家专业性的机构推出了互联网使用情况的调查和监测服务。但是各个机构所采用的方法特别是监测的软件和技术都不尽相同,而且由于商业上的竞争性和保密性,关于第二类网络调查方法方面的学术性研究和交流就比较难于开展,公开发表的参考文献也就相对较少。作为传播研究工作者,投入更大的精力去探讨一套可以公开的、科学的、标准化的研究方法,将具有十分重要的理论意义和应用价值。

目前第二类网络调查之所以会有那么多不同的做法,原因是多方面的,有指标体系上的问题、有测量技术和软件上的问题、也有方法方面的问题。例如,“唯一用户”的概念虽然提供了一定时间内不同受众数量的统计指标,但是却没有反映出网站的全面的活动,“国际流量”的是否记入及如何记入也是需要探讨的问题;“机器人”和搜索引擎或“蜘蛛”的问题如何处理;“总体”如何定义,只限定家庭用户还是也包括工作单位的用户,重叠和交叉的问题如何解决;“缓存”的问题如何处理(计一次浏览器请示为一次页面阅览其实并不完全准确,例如,代理服务器缓存和浏览器缓存都使得服务器记录的请示数少于显示在访问者浏览器上的页面数);共享工作终端的问题如何统计;此外,缺乏共同的度量单位、没有计算日志文件的统一标准等等,都造成了众多调查统计结果的不一致性。

随着我国国民经济信息化进程的加快,新的信息产品和技术的更新换代速度也在加快。为此,要求我们传播研究工作者的方法研究也应该更具有前瞻性和预见性。例如,我们目前的网络调查关注的上网平台主要是计算机、上网连接主要是拨号电话线和ISDN线。按照前瞻性的要求,我们也应该同时关注非计算机设备的上网平台(例如手机、移动通讯设备、电视机设备等)、非电话线的上网连接(例如广播电缆、无线传送等)以及与之相关的网络使用量的调查统计的方法和技术问题。