新書推薦:
《
花外集斠箋
》
售價:NT$
704.0
《
有兽焉.8
》
售價:NT$
305.0
《
大学问·明清经济史讲稿
》
售價:NT$
330.0
《
中国国际法年刊(2023)
》
售價:NT$
539.0
《
早点知道会幸福的那些事
》
售價:NT$
295.0
《
迈尔斯普通心理学
》
售價:NT$
760.0
《
古典的回響:溪客舊廬藏明清文人繪畫
》
售價:NT$
1990.0
《
掌故家的心事
》
售價:NT$
390.0
|
內容簡介: |
人类话语的输出结合了经验和推理,是一个因应环境的综合优选过程,具有两个特征:梯度性和概率性。其形式化难点在于诸多语境因素的参与和筛选,然而都可以在移情特征下获得统一。本书正是探讨这种基于移情的统一优选机制,以期将优选论、移情和人工智能等结合起来,探索言语形式化的一个新的研究路径和应用领域。
|
關於作者: |
李向华,男,1974年生,安徽合肥人。上海师范大学语言学及应用语言学博士,现为九江学院文学与传媒学院副教授,硕士生导师,汉语国际教育教研室主任,江西省认知科学与跨学科重点研究中心兼职研究员。近年来,主持国家社科基金年度项目和省级项目多项;发表各论文20余篇,专著1部;主编教材1部,参编1部;获江西省社科成果优秀奖1次。主要从事认知语言学、语言理论和对外汉语教学等方面的研究。
|
目錄:
|
第1章优选论与预备知识1
1.1优选论出现的背景及述评1
1.2优选论的理论发展模型4
1.3优选论的理论预备16
1.4概率与移情优选46
第2章移情的本质与研究价值66
2.1美学中的移情66
2.2语言学中的移情68
2.3移情现象的本质特征69
2.4语用移情及其在汉语中的表现71
2.5移情优选研究的价值76
第3章移情研究困境与优选论级差模式81
3.1移情现象研究的困境81
3.2句式和移情值之间的共变84
3.3优选论对移情现象描写的可行性93
3.4优选论级差评估模式评价97
3.5移情级差评估模式的案例分析102
第4章概率语法与概率优选模式118
4.1语言的概率性118
4.2概率语法及相关讨论120
4.3概率优选评估模式及特点147
4.4移情概率评估模式的案例分析151
4.5不足之处183
第5章移情优选的制约条件186
5.1制约条件的本质属性186
5.2制约条件的类别192
5.3制约条件的设立与等级排列196
5.4移情制约条件的归纳202
5.5移情制约条件的特点与归纳原则205
5.6汉语移情制约条件的部分构拟与相关讨论208
第6章移情优选与自然语言处理212
6.1自然语言处理中的移情优选212
6.2自然语言处理中移情优选的设计思路224
6.3移情和情感的交叉与机器的处理方式234
第7章神经网络在汉语移情优选上的应用240
7.1机器学习排序模型概述240
7.2基于RankNet的移情优选排序模型247
7.3RankNet算法的改进策略262
7.4特征提取层的主要方式264
7.5特征提取的混合模型与相关探索281
7.6实验结果及分析291
第8章自然语言处理中移情优选发展趋势及相关问题295
8.1自然语言处理中移情优选的可能发展趋势295
8.2自然语言处理中移情优选涉及的相关领域301
附录汉语语用移情神经网络实验模型结构图306
参考文献311
后记321
|
內容試閱:
|
海内外关于语言中“移情”问题的研究很多,但研究现代汉语移情的专著并不多见。李向华博士继2017年出版了《现代汉语语用移情研究》之后,持续在现代汉语“移情”领域进行探索,相隔数年又向我们展现了一部新的专著《汉语语用移情优选机制及其应用研究》,可谓对“移情”情有所钟。
移情是一种心理现象,移情研究涉及诸多领域。目前,就语言学领域来看,主要有两种研究路径: 一种是从功能句法学视角进行研究,主要讨论移情原则和句法配置之间的关系,代表性学者为Susumu Kuno,他用摄影中的拍摄角度比喻言者与话语中涉及对象之间的心理方位关系,即心理距离近的成分移情值就高,反之就低;另一种是语用学中的研究,主要代表是何自然,他从言听者之间情感互动视角探讨移情对话语的影响。这两种研究路径,前者属于句法学范畴,后者属于语用范畴。因此,研究的主要对象并不完全相同。但从整体上看,无论是功能句法视角还是语用视角本质上都是关注话语功能,只是前者侧重于静态,后者侧重于动态而已。静态更关注句内成分的配置、对象的凸显,动态更关注话语的整体语用效果。然而,两者都存在不足,功能句法视角尽管归纳了一些等级原则,但远远不能满足语言分析的需要;语用视角关注话语的效果,但很少讨论内部的动因。而在移情心理影响话语的机制上,两者都讨论不多。
我们的话语交际总是伴随着不断的移情优选过程而进行的。Grice的合作原则本质上也是移情心理在话语策略上的体现。说话过程是形式的优选,听话过程是释义的优选。这两个优选过程都存在移情心理的参与。甚至,话轮的交替也是一种移情优选的过程。因为,我们谈话时选择某个话题,排斥某个话题,并不是任意的,而是有选择性的。例如,我们总是选择对方感兴趣的话题进行话语的延续。对于对方反感的话题我们要尽量避免涉及。这些显然就是一种移情心理在话轮上的反映。再如,话语的主持人或控制者有时会有意识地照顾到在场的每个人,安排他们的话语次序和频次,尽量不冷落任何一个人,不使话语失控。这些都是移情心理的体现。从这个角度看,话语移情优选的研究也是深化言语行为理论的重要途径之一。因此,语言中的移情本质上还是属于语用范畴。
任何话语都是一个优选的结果,受到多种因素制约,传统上,我们笼统称之为语境,而语境是不确定的。但是,确定的是优选的目的是提高交际的效果。所有语境因素的选择都是为这个目的服务的。而为了实现这个目的,拉近话语者之间的心理距离是一个基本的策略。因此,移情因素会贯穿优选的所有过程。这样看,我们可以将语言的优选看成是一种基于移情心理的优选,这是建立移情优选机制的基本前提,也是该书立论的基础。实际上,这不失为一个好的策略,因为如果我们从语境视角考察话语的优选,就会因语境的复杂性而很难做统一描写,而如果从移情视角看,所有的因素都是为了拉进话语者之间的距离,提高表达效果,那么就可以统摄这诸多的因素。换个角度看,优选论模型在构建这种移情优选时并不困难,只要从移情视角构建制约条件体系,模型的运行就会反映话语的移情优选机制。这种设想就是《汉语语用移情优选机制及其应用研究》建立模型的另一个基本假设。在这两个基本假设下,该书的到第五章的理论部分主要阐述了以下几个方面的问题:
1. 对优选论进行了详细的梳理和介绍
书中介绍了优选论出现的背景以及发展出来的几个比较重要的模型,即经典模型、级差模型、概率模型和双向优选模型。通过详细论证,该书认为级差模型和概率模型可以用来分析移情现象,并讨论了概率和移情分析之间的关系。接下来,书中详细介绍了优选论模型的运算过程,尤其是级差模型和概率模型,并对不同模型的运行原理进行了说明。这部分内容对于全面了解优选论有较高的参考价值。
2. 讨论了优选论对移情现象分析的可行性
书中认为,移情是一种具有人际功能特征的普遍性心理状态,是人际交往中带有规约特征的情感策略。因此,移情是一种心理性状,内部是没有界限的,语言由于表达的需要将这种性状按照细粒度分为移情程度不同的单位,从而形成了一组具有移情值差异的级差单位。一般来说,话语默认选择移情值较高的单位,但受到不同语境的影响,使得低移情值的单位值上升,从而成为被输出的单位,而计算这种输出的方式就是概率,即概率越大,输出的可能性越高。这种思想,实际上就是级差优选和概率优选的运行机制。因此,语言中基于移情的话语输出实际上就是级差优选和概率优选。这就证明了优选论分析移情现象的可行性,也使得该书中的模型构拟具有了合理的理论基础。
3. 发展了优选论的移情级差模型
优选论的级差评估模式是由Coetzee提出的一种经典OT模型的改进版本。该模型保留了经典模型的内核,只是对优选涉及的数据在分析方法上加以改进。实际上就是将过于严格单调的经典处理模式在条件上和制约性上放宽,从而极大地提高了经典模式的适用范围和解释力。这个改进使得模型可以处理语言中的级差现象,对语言中多选项的解释以及词语和语音等固化的判断等有很好的解释力。然而,目前为止,我们未见有学者将这种模型用于句法上,更未见用于处理移情现象的。该书通过对移情制约条件的构拟,创造性地提出了构建移情优选模型,并将该模型用于处理基于移情的话语优选。书中通过一组表达相同意义的句子,验证了模型运算结果与我们实际语感输出之间的吻合性,并构建了一整套运算过程以及得到了相关理论的论证。经验证,模型在逻辑上是成立的,在语感上是一致的。因而,该模型有了一定的实用价值和合理性,可以看成是对Coetzee模型的发展。
4. 构拟了移情概率优选模型
书中介绍了传统上的概率语法和概率优选论的基本理论,但这些理论并不符合移情优选的实际需要。在这种情况下,作者提出了一个与前面的级差模型相配套的概率模型。作者认为,前面的级差模型只反映语言中客观的话语移情梯级,然而实际的话语输出却是主客观综合分析的结果。因此,在概率模型中,作者首先运用概率论中的幂率分布原理将级差模型转化成概率模式,作为话语实际优选的客观部分;其次,再将环境中相对固定的因素作为主观因素,构建了话语选项的主观优选序列;后,将客观序列和主观序列按照一定比例加和,从而形成了一个基于移情的动态优选结果。与级差模型不同的是,这种概率模型是实时话语的优选,而不是对语言中移情级差的静态反映。一般来说,人类认知加工的优选输出基于概率,是符合我们的语感的。
5. 关于移情制约条件的构建
OT的制约条件体系就是评估的依据,或者称为评估标准。传统语音模型或语法模型中的制约条件主要还是在范畴内部归纳,如语音上的制约条件或句法上的制约条件。然而,移情制约条件比较特殊,由于其语用属性,决定了它的条件归纳涉及多个领域,因此要从更广泛的维度探讨移情的制约因素。但总体来看,这种开放的条件体系也还是遵守了普遍性原则。这主要表现在言语移情本身的普遍性、条件对不同语言的普适性和符合人类的普遍认知规律三个方面。然而,这种开放的系统也会带来两个方面的主要问题,即移情制约条件和语法制约条件之间的兼容和冲突问题以及这种开放性导致的归纳困难问题。这些在该书中都有详细的理论探讨。同时,在讨论了这些理论问题之后,书中也总结了移情制约条件的特点和归纳的原则,并在此基础上构拟了部分条件用于书中的实例分析。从实例分析和理论论证来看,这些条件也基本上反映了语言的事实和我们的实际语感。
该书的第六到第八章主要讲的是移情优选理论在自然语言处理上的运用。这部分内容过去基本上没有学者涉及过,称得上“首创”。主要阐述了以下几个方面的问题:
(1) 话语移情优选机器学习模型构建的可能思路。书中认为,我们可以有两种构建模型的思路,即基于前面级差模型的学习模型和基于统计的神经网络学习模型。书中详细论述了级差模型的优势和存在的问题,并认为,相比较统计模型,这种级差模型存在两个目前不易处理的问题,即生成器的构建以及机器对意义条件的识别和使用。后者是建立在对文本理解的基础上,而这目前还是科学上的难题。因此,基于统计的模型可能更好处理一些。当然,实际的构建证明这种思路也存在诸多的问题。然而,正如书中所言,我们可以先从基础的核心部分慢慢做起,随着机器语义理解技术的发展,基于大数据的模型应该是未来的趋势。正因为如此,书中也用了大量篇幅论述了这种模型的构建。
(2) 基于Ranknet的移情优选排序模型的构拟。机器学习处理话语优选主要是按照移情值降序排序,即移情值越高位置越靠前,反之就靠后。这种排序模型已经比较成熟了,目前按照训练模型输入数据样例的结构差异,主要有三大类构拟方法,即Pointwise(点对点)、Pairwise(文档对)和Listwise(文档列表)。Pointwise方法中,将训练集中的每一个查询下的每一个文档看成一个训练样例,将文档和查询建立点对点关联,通过反复输入单个文档,获得文档和查询之间的精确匹配,从而实现查询目的。因此,点对点方法和排序关系不大。Pairwise方法是将训练集中的每个查询获得的文档集合中的任意两个具有偏序关系的文档对作为训练样本,输入模型,进行训练。因为每次输入两个样本,所以叫做文档对方法。通过建立任意两个文档之间的偏序关系,再通过偏序计算,就可以获得一个查询下的所有文档的偏序关系,也就是一个降序的等级序列。显然,这种方法能够获得我们想要的结果,也就是一个候选项集合的整体偏序关系。Listwise方法和前面的两种都不同,的不同是不再分解候选项,而是将一个查询下的所有文档作为一个整体处理。模型将整个文档集合作为一个输入样本,然后将这些文档排序,利用打分函数计算不同排序的得分,再将得分按照降序方式排序,获得文档集合的排序,即得分的排序就是文档的终排序。显然,这种方法也能够获得我们想要的结果。列表方法效果好,有吸引力,模型本身高效、简洁、合理,但训练数据构建困难,计算复杂,工作量大,对参与人员的要求高。比较而言,合理的是序对方法,复杂性可以控制,样本构建简单,尽管模型稍微复杂,但可以通过优化获得不错的效果。这也是该书采用这种模型的原因。
在序对模型中,Ranknet也是经典的模型,因此书中就以这个模型作为例子进行了详细的讨论。第七章首先从数据的处理、特征的提取、排序的机制、代价函数的选择和模型的改进等方面详细讨论了模型的构建,并通过建立一个小型的语料库,对这个模型进行了实例验证。其次,通过模型特征提取和合并方式的调整考察模型精度上的变化。后,对实验结果进行了分析。总体来讲,模型效果不是很理想,但从创新来看,是个有益的尝试。
(3) 对自然语言处理中移情优选发展趋势进行了展望。书中认为,话语移情优选的计算机处理本质上属于自然语言处理范畴中的一个子范畴。移情处理与当前的自然语言处理发展水平是一致的。尽管可以有两种处理思路,但基于神经网络的模型可能更为合适。一方面,很少遇到致命困难,另一方面,这种大数据的分析方式也是科学发展的趋势。对于自然语言处理领域来说,移情优选是个全新的子领域,目前处于起步阶段,存在着太多的地方需要我们去探索。其中的随便一个运行模块都是值得研究的,尤其是不同模块之间的整合和优化更是研究的重点和难点。书中提到了五个亟待研究的方面,即移情的本质特点和机器的处理方式、移情优选的模型开发、模型优化技术、语境整合技术以及模型和智能机器人的匹配。显然,这些都与21世纪的主流科学密切相关,非常值得探索。
总起来看,《汉语语用移情优选机制及其应用研究》一书虽然偏于理论,但创新较多,如用优选论分析移情现象,发展了级差模型,构建了基于级差的概率模型,归纳了移情制约条件,发现了移情优选在自然语言处理中的价值,构拟了自然语言处理中的移情优选排序模型,等等。正如书中所言,移情问题涉及很多领域,问题非常复杂,还有很长的路要走,该书可看成是探路的先锋。正因为如此,该书也存在一些的不足,主要表现在:
(1) 应用部分和前面讨论的模型的联系不是很紧密。尽管书中有了交代,阐述了级差模型在机器处理上的难度,神经网络模型更适合处理移情问题,但从整体上看,前后的内容还是联系不够紧密。
(2) 该书长于理论疏于具体分析。书中用了大量篇幅引介了优选论和移情理论,而在具体操作模型对汉语的分析上明显偏弱,尚有较大的提升空间。另外,该书理论色彩浓郁,论述抽象,大量采用了形式化的方法,而且概率优选模型部分,有的细节阐述还不够通俗,背景交代不够,造成了阅读上逻辑线索曲折,给人有模糊感。这些问题使得阅读该书需要有较好的数理基础,而且需要有交叉学科的背景知识。这些都提高了该书成果推广的难度。
(3) 该书对汉语现象的挖掘不够。书中主要讨论汉语中的移情优选问题,但大量篇幅讨论的是普遍的理论,没有紧扣汉语。在实例分析方面,书中也仅仅阐述了两个例子,这对于如此庞大的理论架构来说,明显不足。这需要后期进一步深化研究,将这些理论真正落实到汉语中。
正因为存在诸多问题和不足,该书实际上表明“移情”问题中无论理论建构还是实际应用都值得进一步探索。向华博士长于理论思考和框架建构,希望向华博士在今后进一步拓展研究视野,把现代汉语“移情”研究拓展到汉语作为第二语言教学、语文教学、文学欣赏、文学创作等领域,给学界奉献出更多的“移情”之作。虽也可“移情”别恋于其他研究领域,但不要放弃对“移情”问题探索的“钟情”。
2021年6月6日
|
|