普通话水平测试研究是国家语委语言文字应用研究“十五”科研规划重点资助项目,该课题是一个十分庞大的研究系统,具有特殊意义及政策性影响,国家语委普通话培训测试中心组织全国近20个省(市、自治区)语言文字工作机构和20多所高校、科研机构联合申报,目前已获批准立项。本文拟就普通话水平测试研究的现状谈谈我们的构想。
一、普通话水平测试研究现状
1994年10月,国家语言文字工作委员会、原国家教育委员会、原广播电影电视部联合发出《关于开展普通话水平测试工作的决定》的通知,普通话水平测试(PSC)自此在全国正式开展起来。2000年10月颁布的《中华人民共和国国家通用语言文字法》又通过立法手段对普通话水平测试加以强调。近几年全国各地(包括港澳地区)测试工作发展十分迅速,形成了比较科学规范的管理和运行体系,产生了广泛的社会影响。普通话水平测试研究从论证到实施,从理论到实践,经过广大专家和业务人员的辛勤努力,也取得了很大成绩。1991年通过鉴定的由孙修章主持的国家社会科学基金项目“普通话水平测试标准”,奠定了普通话水平测试的基础。刘照雄主编的《普通话水平测试大纲》(国家社会科学基金项目,1994)是目前为止普通话水平测试最重要的研究成果。据统计(王晖,2002),1994年至2001年,全国发表关于普通话水平测试的论文约110余篇。2002年5月国家语委普通话培训测试中心主办了首届全国普通话水平测试学术研讨会,从全国选送的100余篇论文中,精选31篇进行交流。可以说,普通话水平测试研究与工作实践目前正处于互动状态,形成了一个良性循环的发展态势。但是,普通话水平测试毕竟是我国新兴而且复杂的语言测试工程,与我国的汉语水平考试(HSK)及国内外其他一些著名的语言测试相比还显得不很成熟,研究成果与语言学其他领域相比,也显得不够丰硕。在发展过程中,形势和任务迫切要求全国有关领域的专家跨领域合作,共同攻关,采用新的研究手段和方法,解决一系列突出的理论问题与实践问题。
(一)在理论研究方面,陈章太、仲哲明、刘照雄、孙修章、宋欣桥、毛世桢、王渝光、李宇明等进行了有益的探讨。但总体而言,某些具体问题研究较多,系统的基本理论研究仍显薄弱,普通话水平测试的理论框架体系尚未构建成熟。普通话水平测试作为一种独特的语言测试,不仅涉及到普通话本体等语言学及应用语言学方面的内容,而且涉及到考试的方式、方法等教育测量学方面的内容。目前,普通话水平测试的教育测量学研究显得滞后。教育测量学研究成果现在已普遍应用于一些著名的语言测试,如美国ETS的TOEFL、GRE,国内的HSK等,成为这些语言考试的重要理论支撑。张雷、杨志明、王渝光等运用当今国际心理与教育测量领域研究热点之一的概化理论(GT),对普通话水平测试进行了研究,但仍属于初步的探讨。因此,引进先进的现代教育测量理论来深入研究普通话水平测试,不仅十分必要,而且十分紧迫。随着普通话水平测试的不断深入,测试过程中一些心理因素的影响也逐步凸显,影响到测试的准确性和科学性。而该领域的有关研究,国内尚属起步阶段,相关研究很少,而且仅限于描述层面,涉及内容相对表浅和零散,未能深入而系统地揭示普通话水平测试的相关心理因素和调控策略,研究成果更谈不上很好地应用到实际测试中去。普通话与方言的对比研究,目前国内取得了很多成果,但把这些成果运用于普通话水平测试的研究,则尚未出现有影响的著述。普通话水平测试还特别需要比较研究的成果,田小琳《中国内地与香港特区普通话测试之比较研究》作了有益的探索,但总体而言,这方面的研究太少。HSK及国内外其他一些有影响的语言测试在测试理论、试卷设计、题库建设、统计分析、管理现代化、信息反馈、测试与培训互动等方面都有可资借鉴之处,深入而广泛地开展语言测试的比较研究亟需加强。
(二)在规范标准的研究方面,为了进一步规范普通话水平测试的规程,修订考试的内容、评分方法、范围,经国家语委批准,已于2002年初组成以姚喜双、刘照雄为负责人,以国家语委普通话培训测试中心业务人员为主要力量的课题组,在已有的研究基础上,进行《普通话水平测试大纲》(部颁标准)和《普通话水平测试实施大纲》的修订及研制,这是一个带有全局性、指导性的重大课题。普通话水平测试题库建设,是一项关乎普通话水平测试科学性、公平性、客观性、权威性的基础性工作。目前在上海市以及云南等其他一些省区做了实验,取得了一定的经验。但与“标准一致、难度等值、科学性强、数量足够”的建库目标尚有一定差距,甚至存在某些与现行《大纲》规定不一致之处,需要进一步改进。尽快开发与新《大纲》相匹配,适用于全国的高质量的普通话水平测试国家级题库,是摆在我们面前的重要而紧迫的任务。
(三)在施测手段方面,普通话水平测试,目前主要采用主观评测的方法,这使得测试成本很大,测试员劳动强度高,特别是测试信度受到一定局限。而目前无论在国内还是国际上,都还没有一种描述普通话水平的客观参数。近年来实验语音学、语音识别技术和计算机技术的进步,在某些方面为计算机辅助普通话水平测试评分提供了可能。所以借鉴语音分析技术、语音识别技术、现代数理统计技术,利用计算机提供出应试者的参考评分和评分的可信度级别,并进一步研究语音质量的主观评价和客观评价方法,具有重要的开创性的意义。
(四)在测试的现代化管理方面,TOEFL、GRE、GAMT和HSK等著名的语言测试都已全面利用计算机进行考试管理,其系统涵盖了考务信息管理、题库管理等各方面,技术水平和成熟度都较高,产生了相当好的经济效益和社会效益。而在我国,虽有上海、湖北、黑龙江等省市在普通话水平测试科研和管理工作中引入现代化信息技术,但出现各地独立开发,重复建设、互不兼容、技术水平参差的不协调局面。因此急需提高信息管理的规范程度,开发研制出一套技术先进、全国通用的普通话水平测试信息管理系统。
在测试基础性资源库建设方面,普通话水平测试在许多方面还是空白。语音语料库的建设,引起当今许多国家、组织和个人的密切关注,在国家高科技研究发展计划(863计划)的支持下,国内也建立了多个语音数据库。但这些语音数据库大多是面向信息处理领域。建立普通话培训和水平测试用标准语音语料库和“中介语”语音语料库,尽快填补国内这方面的空白,并为深入开展测试研究提供一个技术平台,具有特殊的重要意义。
(五)当今我们已处于一个迅速发展的信息化、网络化的时代,在普通话培训和测试中运用现代网络技术、建设开发普通话水平测试网络培训课程和实现网上测试,已成为时代的需要和广大学习者、应试者的迫切要求。这方面开发需要高额投入,但相关研究应尽快开展。计算机辅助教学(CAI)是一种崭新的现代化教育手段,自上世纪60年代出现以来得到迅速发展,加上70年代中期以来语音合成、人工智能,以及光盘特别是互联网技术的应用,更使这种新型的教学系统、教学方式日臻完善。国外语言教学注重利用多媒体手段进行教学,开发出不少适合于本国学生和外国人学习语言的教学课件。我国的外语教学在这方面做得较好,相比之下,汉语普通话教学多媒体课件的制作远远落在了后面。目前,对外汉语教学方面已有一些院校制作出版了适合于外国人学习汉语的课件产品,香港、、澳门、台湾等地区也有一些汉语普通话教学训练课件,但由于服务对象的不同和文化背景的差异,不能直接为我所用。研制和开发适用于普通话教学和涵盖普通话水平测试大纲内容,有助于各方言区各行业人士进行普通话学习和测试的教学与训练用课件,具有现实意义。