姐的欢喜姐的欢喜姐的欢喜

汉语语体研究回顾与前瞻

钱一华

汉语语体研究回顾与前瞻(图1)

摘  要:汉语语体研究发端于修辞学、文章学,可上溯至古代的文体论。当下语体研究与语料库方法联系紧密,在研究内容上呈现出两大热点:一是语法研究视域中的语体考察;二是语体特征的宏观量化分析。近些年来,汉语语体研究虽然取得了丰硕的成果,但仍存在学科定位不够清晰、缺乏系统性研究等问题;同时,在历时研究、习得研究、机器识别效果等方面,也有待进一步的探索。

关键词:汉语;语体;体裁;综述

一、语体的定义和分类

(一)語体的定义

《语言学名词》中将“语体”定义为语言的社会功能变体,认为它是为适应不同社会活动领域中的交际需要所形成的、具有一定功能风格特点的语文表达体式[1](P144)。尽管学界对于语体的定义尚未达成共识,但大多数学者都认同语体是从社会功能的角度划分出来的语言变体,如郑远汉[2]、王德春和陈瑞端[3]、袁晖和李熙宗[4]等。

随着汉语语体相关研究的进一步深入,“语体”与“语域”“文体”“体裁”“风格”等词语常常交织在一起,形成一组学术近义词,尤其是在现代语体学研究的早期,这些概念之间常常存在混用现象。

从目前学界对以上概念的使用来看,“语体”和“语域”基本上构成一组同义词,均指文本从社会功能角度进行的分类,用于语言学领域。“语域”可理解为语言的使用域,源于国内学者对“register”一词的翻译,最早见于吕叔湘先生的相关论述:“在普通话内部作比较研究,还涉及一个方面:某些句式,某些虚词,用在某种环境很合适,用在另一种环境就不合适。比如‘我们’和‘咱们’,‘被’和‘叫、让’……近年来英文的语言学著作里讨论这个问题,常用register这个字,我想可以译做‘语域’。”[5]吕叔湘先生之所以使用“语域”一词,主要是因为“白话文”曾经也称为“语体文”,使用“语体”容易产生混淆。由于“语体文”的称谓现在已为学界摒弃,因此,使用“语体”来指代语言的功能变体遂逐渐占据主流。

“文体”和“体裁”也基本构成一组同义词,多用于语文学领域,主要指文本从形式特征角度进行的分类。如《语言学名词》中对“文体”定义如下:“文体”指的是文章的体裁或体式。根据用韵的情况,分为韵文和散文;根据作品结构样式不同,分为散文、诗歌、小说、戏剧;根据写作方法不同,分为记叙文、说明文、议论文、应用文等[1](P145)。

就“语体(语域)”和“文体(体裁)”的差别来看,“语体”是现代语言学概念,既存在于书面语交际,也存在于口语交际,其分类依据是在于语言实现的功能;“文体”则是文章学概念,只存在于书面语交际,其分类依据是在于语言的表现形式。由于语言的功能和形式互为表里,相互依托,这就在一定程度上造成了“语体”和“文体”概念的混淆,使得文体的分类(如记叙、说明、议论)也常被用作书面语体的分类。同时,“语体”和“文体”的混淆还与语体研究的发展历程密切相关。现代语体学研究发端较晚,它脱胎于传统修辞学中的文体研究,传统研究的惯性使得学界目前仍然未能在二者之间划清界限。

“风格”一词起缘于南朝梁代刘勰的《文心雕龙》,指“文学风格”或“文章风格”,它同样属于文章学概念,是对作家作品艺术特色的概括和评价。语体学曾在很长时间内被看作是语言风格学的分支之一,如李熙宗即表达了这样的观点[6]。实际上,这同样是缘于语体学早期学科定位的不明确,随着语体研究的发展,其研究视角已逐渐与风格学分道扬镳,最终脱离文章学,而归于语言学门下。此外,风格与语体的混淆也与翻译有关。在西方语言中,“style”是语言风格学、文体学等学科的一个基本术语,具有风格、文体、语体等涵义;当它被吸收进汉语风格学时,汉语中便以“风格”“文体”“语体”等共同作为其对等术语[6],从而造成混淆。

值得一提的是,英语学界也有一组类似的近义词,即“register”“genre”和“style”。其中,“register”和“genre”的使用常有交叉,基本等同于汉语中的“语体”“体裁”等概念。“style”则涵义较宽,既可以指作者风格、文本风格,又可以指时期风格、体裁风格等[7](P23)。Biber & Conrad对三者进行了区分,他们使用“register”指代语言的功能变体,使用“genre”指代语言的结构变体,使用“style”指代由不同个人、时期所形成的语言风格的差异[7](P2)。其中,“register”“genre”均与功能密切相关,但“register”的不同源于功能,而“genre”的不同源于写作传统(如书信、学术论文等的固定结构格式);“style”则和功能无关。

目前学界的主流做法是将英文相关研究中的“register”对应于汉语中的“语体”“语域”;将“genre”对应于“体裁”“语篇”“语类”;将“style”对应于“风格”。但有时也不加区分,将“register”和“genre”都对应于“语体”。当下热门的学术语篇研究多用“genre”一词,尤其是由Swales所开创的语步研究一派;而以Biber为核心的语体变异研究一派,则多用register一词。

(二)语体的分类

对于语体的划分,学界主要有二分法、多分法和多维度划分法三种。

1.二分法

语体最基本的分类方法是二分法,即将其划分为口语体和书面语体。实际上,多分法和多维度划分法也大多是以二分法作为进一步分类的起点的。很多学者都对口语体和书面语体的差异进行了总结,如邵敬敏指出,口语灵活简短,变化多端,用词通俗易懂,多采用俚语俗语和方言词语,多省略句、独词句、非主谓句,多插入、移位、追补、省略、重复、修正等手段,生动活泼,短小精悍,便于口头交际;书面语由于可以反复思考、斟酌修改,所以显得严谨规范,条理清晰,结构比较复杂,句子比较完整[8](P6)。唐松波则把语体分为谈话语体和文章语体两类,认为这种区分是基于语言运用时的一系列差异,而口语和书面语仅仅是对语音或文字两种表达形式的区分[9]。陶红印也谈到口语体、书面语体二分的问题,他同样指出口语体和书面语体的对立只是在于传媒(medium)的不同,但实际上语体间的差异主要体现在表达方式上,如书面广告并不因为其书面传媒的特点而排斥口头语的表达[10]。

2.多分法

王德春、陈瑞端认为,语体首先可以分为谈话语体和书卷语体,后者又可以再分为艺术语体和实用语体,实用语体再细分为政论语体、科学语体、事务语体和报道语体[3]。袁晖、李熙宗则将语体分为谈话语体、公文语体、科技语体、新闻语体、文艺语体和综合语体,然后再进行下位分类[4]。李秉震认为,可以首先区分出叙事语体和非叙事语体两类,叙事语体包括小说、人物传记、民间故事等,非叙事语体则包括法律语篇、操作语篇、新闻语篇、政论语篇、学术语篇等[11]。

3.多维度划分法

最早采用多维度方法进行语体划分的学者是Longacre,他在《篇章的语法》一书中,根据有无时间连续性(temporal succession)和是否关注动作施事(agent orientation)这两组标准,将语体分为如下4类[12]:

在国内学者中,陶红印是较早提出采用多维度方法进行语体分类的,他认为,依靠任何单一的标准把语体(以及文体)作穷尽的分类都是不现实的,并进一步提出了有准备和无准备的对立、庄重和非庄重的对立两个划分角度[10]。

目前,很多学者在语体研究中均持原型范畴观,认为不同语体间并无截然的分界,而是存在着语体的典型成员和非典型成员。陶红印指出,口语语体有典型和非典型之分,如演讲报告、采访、朋友间的谈话,其中,越靠后的越典型;书面语体亦然,如法律条文和文书、学术论文、报纸社论、散文、小说、戏剧等,其中,越靠前的越典型[10]。国外学者Biber首次通过多维度量化方法,计算了多类语体在各维度上的分值,构建了语体分布的连续体[13]。

二、汉语语体相关研究

(一)汉语语体研究发端

汉语语体学发端于修辞学、文章学视角,这一视角下的语体研究可上溯至古代的文体论,如曹丕的《典论·论文》将文章分为四科八体,刘勰的《文心雕龙》则分析了三十三种文体。现代语体学的早期重要学者当首推陈望道,他在《修辞学发凡》中对“文体或辞体”进行了专门讨论,从语文体式任务视角出发,将其分为公文体、政论体、科学体和文艺体;从语言成色特征视角出发,又将其分为语录体、口语体、文言体等[14]。之后,对汉语语体研究作出较大贡献的学者有黎运汉、李熙宗、王德春等,三位学者均著有系列著作。如黎运汉的《现代汉语语体修辞学》[15]、《汉语风格探索》[16]、《汉语风格学》[17];袁晖和李熙宗的《汉语语体概论》[4]、李嘉耀和李熙宗的《实用语法修辞教程》[18];王德春的《修辞学探索》[19]、《语体略论》[20]、王德春和陈瑞端的《语体学》[3]、王德春和陈晨的《现代修辞学》[21]等。从修辞学视角下发展而来的语体学,曾长期与“修辞学”“文体学”“风格学”纠缠在一处,尚未形成独立的学科门类,从以上书名即可见一斑。直到当下,语体学仍然没能很好地从修辞学的母体中脱离出来。

丁金国将中国现代语体风格理论分为两类,分别以黎运汉的《汉语风格学》和王德春、陈瑞端的《语体学》为代表。前者既谈语体,也谈风格,在风格的名义下讨论语体;后者则只谈语体,不谈风格,将前者所论的风格,化作语言特征或语言运用系统概而论之,从而实现了“纯语言分析”[22]。可以说,这两类著作分别代表了修辞学中的语体研究和脱离于修辞学之外的语体研究。丁金国指出,后者才是典型意义上的现代语体论[22]。

总的来看,目前汉语语体研究的热点主要有二:一是语法研究视域中的语体考察;二是语体特征的宏观量化分析。

(二)语法研究视域中的语体考察

从严格意义上来说,这类研究并非正统的语体研究,因为该研究的出发点并不在语体,而在语法,但也加深了人们对不同语体的认识。张伯江指出,“语体问题近年来重新成为热点,很重要的一个原因是语法学者的介入”[23],他将语法学者对语体的关注总结为“在合适的语体里寻找合适的实例;在合适的语体里合理地解释实例”[23]。这一研究趋势与当下功能主义的盛行密不可分。

较早呼吁在语法研究中关注语体差异的学者有朱德熙、胡明扬和陶红印等。朱德熙指出,“为使现代汉语语法研究深入下去,应该对口语语法和书面语语法分别进行细致的研究”[24]。胡明扬通过多种语法现象说明了语体对语法的影响,如形容词的语法功能、动名兼类、“被”字句、存在句等,在口语体和书面语体中均存在显著差异[25]。陶红印指出:“以语体为核心的语法描写应该是我们今后语言研究的最基本出发点,任何严谨的语法学家如果打算忽视语体的区别而提出汉语语法的规律,必须首先在方法论上提出自己的依据来”[10]。陶红印通过语料统计的方法,对“把”和“将”的语体分布差异进行了考察[10],是为经典范例。此后,采用统计手段对语法项目进行分语体的考察遂成为热门。如杨素英、黄月圆探讨了“了1”“着”“在”   “过”四个体标记在不同语体中的分布情况[26];李秉震考察了四类“关于”话题句在不同语体中的分布[11]等。

冯胜利则从韵律语法的视角出发,总结出口语和书面语在词汇句法上的差异[27]。其后,冯胜利继续推进相关研究,并将其命名为“语体语法”研究,从而建立了语体的三大基本范畴:口语体、正式体和典雅体[28]-[30]。他指出,形式和功能之间的对应规律是探讨语体语法的终极目标[29]。王永娜基于冯胜利的语体语法理论,在“韵律、句法、语体对应层级模式”的框架下,探讨了110个介词的句法分布、韵律特征与语体属性[31]。

语法研究视域中的语体考察,体现出将语体差异引入语法研究的趨势。可以说,从王力先生探讨汉语书面语中的欧化语法现象始[32],语法理论即被引入到语体研究之中,此后的语体研究一直重视对语法的考察,围绕包括语法在内的各类语言特征,来探讨语体之间的差异。随着研究的深入,将语体考察引入语法研究以及将语法考察引入语体分析这两股潮流逐渐变得难解难分。冯胜利的“语体语法”理论以及构建完整的“形式—功能对应律”的尝试即在一定程度上代表了二者的融合。

(三)语体特征的宏观量化分析

目前,语体研究的另一热点是语体特征的宏观量化分析,即对可能具有语体差异的语言特征进行穷举式的统计分析,进而比较不同语体之间的差异。

1.语体特征的计量和语体分类研究

丁金国在《语言风格分析的定性与定量》一文中,就已设计过13个语言特征(作者称之为“格素”)用以区分语体,包括总字数、总句数、总词数、句长、词长和各类词语的频率等[33]。丁金国认为,语言特征出现的多少、复现率高低和分布位置,对特定语篇的语体归属具有决定性作用[33]。此后,丁金国进一步区分为语言、语义、语用三个平面,设计了228个语体标记,从而构成语体标记集[34]。该标记集虽然十分细致,但这些特征能否付诸实践以及如何展开计量还有待探讨。范晓选取了公文、科技、政论、文艺、口头五种语体的文本各3万字,统计和对比了19类句子在不同语体中的出现频率[35]。尽管范晓的研究只是考察了句子类型这一类语言特征,但却是较早进行多项语言特征量化分析的一个尝试。王德春、陈瑞端则以Halliday的功能语法理论为框架,设计了涵盖概念功能、人际功能和话语功能的多项指标,并采用科学、事物和报道三类实用语体共18万字的语料,进行了统计和比较分析,揭示出三类语体的语言共性和差异[3]。

同时,还有一些学者从文本自动分类的角度出发,对语体特征展开研究。如冯胜利等选取嵌偶词、合偶词、书面语句型、HSK丁级词、古汉语功能词五个庄雅成分作为特征,合成汉语书面语体的庄雅度测量公式,并使用HSK(高级)考试作文语料验证了其可靠性[36]。黄伟、刘海涛通过现代汉语口语体和书面语体各50万词的语料样本,统计出在两类语料中具有显著分布差异的16个语言结构特征;并以其中的名词、代词、句首位置副词、疑问句等7个作为表示特征,将测试文本聚类为口语体和书面语体两类[37]。吴海燕、刘颖则检验了词、词类、词的依存关系、标点符号、句法结构等多种特征在语体分类上的有效性,探讨了基于注意力网络的语体多元特征的挖掘途径[38]。

2.语体的多维度研究

语体的多维度研究(Multi-Dimensional analysis)开始于Biber对口语体和书面语体的考察。该类研究不仅对各项语言特征进行分语体的统计,而且就语言特征的文本共现情况,将其进一步聚为维度(因子),再由不同的维度来解释语体间的差异。它基于这样的假设之上:在语篇中频繁共现的语言特征至少共有同一个交际功能。Biber认为,单个的语言特征可能同时具有多个交际功能,而通过与其他特征的共现分析,能使某一特征在特定语篇中的实际功能浮现出来,传统研究中对各语言特征的孤立考察则很难做到这一点[13]。多维度分析方法在Biber的Variation across speech and writing一书中得到了进一步的完善,作者将67个语言特征根据因子分析的结果聚合为六个维度,亦即六类交际功能:交互性/信息性;叙事性/非敘事性;语境独立/语境依赖;显性劝诱;抽象信息/非抽象信息;即时信息阐述[39]。之后,学者以此为基础开展了大量研究,将该方法拓展至各专门领域的英语语体研究[40]-[42]、世界英语变体及其他语种的语体研究[43]-[45]之中。

在国内学者中,雷秀云、杨惠中首先引进了这一方法,并使用Biber所提出的六个维度,对学术英语和一般书面英语进行了分析[46]。汉语学界采用Biber的多维度方法进行的语体研究尚不多见,主要有胡显耀、刘艳春、范楚琳和刘颖、朱宇和胡晓丹等。胡显耀基于汉语翻译和原创类比语料库,选取了32个特征进行多维度分析,最终得到3个因子,可以很好地实现文学与非文学、翻译和原创文本的区分[47]。刘艳春使用72个语言特征在17类语体中展开多维度分析,得到7个主要维度,可以对汉语语体变异实现49.4%的解释[48]。范楚琳和刘颖从鲁迅书信、小说和杂文中筛选出58个具有区分度的语言特征,采用多维度分析,得到7个重要因子,并进一步归纳为4个维度,对鲁迅的三类文体进行了分析[49]。朱宇、胡晓丹考察了141项连词在文、史、哲、经、社、法六类学科论文中的分布,共得到4个维度,用以解释人文类和社科类论文的语体差异[50]。

三、汉语语体教学和习得研究

较早专门讨论对外汉语教学中的语体问题的,主要有丁金国和李泉等,两位学者都对语体给予了高度重视。丁金国认为,为了有效提高对外汉语教学的水平,必须将“语体意识”的培育置于教学的核心位置[51];李泉更是认为,从某种意义上说,对外汉语教学就是培养学习者准确把握和正确使用各种语体的能力[52]。同时,李泉还对面向对外汉语教学的语体研究的范围和内容进行了探讨,并提出要构建基于语体的对外汉语教学语法体系,该体系由共核语法、口语语法和书面语语法三部分构成[52]、[53]。其他学者如罗丽[54]、曾毅平[55]等,也都系统探讨了对外汉语教学中的语体问题,提出了具有针对性的建议。

从实证研究来看,相关成果则屈指可数,大多为考察学习者对某类具有特定语体特征的词汇、格式的使用。如盛林基于HSK动态作文语料库,考察了学习者对100多个具有鲜明语体色彩的词语的使用情况[56];莫丹以不同语言水平的欧美留学生近6万字的写作文本为语料,考察了4个正式体和2个庄典体语体特征的运用情况[57];全玉珍、李静峰基于《现代汉语词典》中的口语词,对HSK动态作文语料库中作文的口语化程度进行了检测[58];汲传波、刘芳芳比较了37个汉语口语格式在HSK动态作文语料库和现代汉语平衡语料库中的使用频率[59];此后,汲传波进一步分析了不同水平的日本学生对这37个口语格式的使用情况[60];在《韩国学生汉语学术论文中文言结构使用初探》一文中,汲传波则通过自建汉语学术论文语料库,对比了中国学者和韩国学生在学术论文中使用含“于”“者”“以”“而”“之”字的文言结构的异同[61]。值得注意的是,还有少数研究同时涉及到对多类语言特征的考察。如胡晓慧从词汇、语法和语篇三个层面,对20篇留学生习作中的口语体倾向进行了统计和分析[62];周芸、张婧和周芸、张永芹同样从词汇、语法和语篇三个层面,通过测试手段,调查了泰国学生的汉语谈话语体能力和报道语体能力[63]、[64]。

四、总结和前瞻

总之,汉语中与语体相关的文体和修辞问题自古以来就颇为学者所关注,不过,现代意义上的汉语语体研究直到上世纪三四十年代才逐渐发端,它的真正兴起以及从修辞学中脱离出来,形成自己的研究取向,则不过是近二三十年来的事情。尽管相关研究已取得了比较丰富的成果,但理论层面仍需进一步探索,实践层面也存在可待挖掘的空间。

首先,在理论研究层面,亟需解决的是语体学的学科定位问题。语体学的研究对象、范围与目的是什么,它与修辞学的关系如何,都需要学界进一步探讨。同时,语体的分类问题也需要加强科学性,当下学者对语体的分类多为经验性的,缺乏统一的客观标准。以上两个问题都是语体研究进一步发展的根基。

其次,在研究内容层面,以下几个方面都可继续开拓:一是系统的语体研究,现有研究大多针对语体中的某个或某类语言特征,全面系统的研究成果依然少见,如专门的口语、书面语词典及语法书的研编;二是历时的语体考察,现有研究大多关注于共时的语体现象,对语体的历时变化鲜有探究;三是语体的教学和习得研究,这类实证研究较少,今后可进一步拓展至各专门语体、全面考察多项语体特征,并关注学习者语体能力的动态发展过程;四是语体特征的考察,现有研究较多关注于词汇、语法层面,语义、语篇和功能层面的语体特征则较少涉及,这在一定程度上受限于相关语言理论的发展以及现有语料处理工具的不足,这也是今后研究可进一步探索的方向。

再次,在研究方法层面,则需更多吸收自然语言处理中的相关技术,推进宏观量化的语体研究。英语研究中已有较成熟的软件可以实现对多项语言特征的自动分析,如Coh-Metrix 3.0能够对106项包括衔接连贯指标在内的语言特征进行自动识别和计量,MAT(Multidimensional Analysis Tagger)多维分析工具可以对Biber所使用的67项词汇、语法特征进行自动提取和统计。这些工具大大降低了相关研究的技术门槛,给研究者带来了很大的便利。汉语中还没有类似的功能集成型工具,研究者往往需要自行编写代码、通过人工的方式来提取待考察的语言特征,研究难度较大。因此,汉语语体研究亟需进一步吸收自然语言处理技术,实现更多语言特征的自动识别和处理,切实有效地推动语体研究的创新发展。

参考文献:

[1]语言学名词审定委员会.语言学名词[M].北京:商务印书馆,2011.

[2]郑远汉.言语风格学(修订本)[M].武汉:湖北教育出版社,1998.

[3]王德春,陈瑞端.语体学[M].南宁:广西教育出版社, 2000.

[4]袁晖,李熙宗.汉语语体概论[M].北京:商务印书馆, 2005.

[5]吕叔湘.通过对比研究语法[J].语言教学与研究, 1977,(2).

[6]李熙宗.关于语体的定义问题[J].复旦学报(社会科学版),2005,(3).

[7]Biber,D. & Conrad,S.Register, Genre, and Style[M].Cambridge:Cambridge University Press,2009.

[8]邵敬敏.现代汉语通论(第二版)[M].上海:上海教育出版社,2007.

[9]唐松波.谈现代汉语的语体[J].中国语文,1961,(5).

[10]陶红印.试论语体分类的语法学意义[J].当代语言学, 1999,(3).

[11]李秉震.语体视角下“关于”的语用功能研究[J].中国语文,2016,(2).

[12]Longacre,R.E.The Grammar of Discourse[M].New York:Plenum Press,1983.

[13]Biber,D.Investigating macroscopic textual variation through multifeatured/multidimensional analyses[J].Linguistics,1985,(2).

[14]陈望道.修辞学发凡[M].上海:大江书铺,1932.

[15]黎运汉.现代汉语语体修辞学[M].南宁:广西教育出版社,1989.

[16]黎运汉.汉语风格探索[M].北京:商务印书馆,1990.

[17]黎运汉.汉语风格学[M].广州:广东教育出版社, 2000.

[18]李嘉耀,李熙宗.实用语法修辞教程[M].上海:复旦大学出版社,2007.

12 下页尾页

标签: 语体 体裁 综述

汉语语体研究回顾与前瞻(图2)

姐的欢喜 » 汉语语体研究回顾与前瞻
免责声明:本文由网友提供互联网分享,经供参考,不代表本网的观点和立场。