新書推薦:
《
如何打造成功的商业赛事
》
售價:NT$
407.0
《
万千教育学前·透视学前儿童的发展:解析幼儿教师常问的那些问题
》
售價:NT$
265.0
《
慈悲与玫瑰
》
售價:NT$
398.0
《
启蒙的辩证:哲学的片简(法兰克福学派哲学经典,批判理论重要文本)
》
售價:NT$
347.0
《
心跳重置
》
售價:NT$
269.0
《
云中记
》
售價:NT$
347.0
《
中国古代妇女生活(中国古代生活丛书)
》
售價:NT$
214.0
《
你的认知正在阻碍你
》
售價:NT$
296.0
|
編輯推薦: |
《论语言概念空间的总体结构》适合对自然语言理解、人工智能、认知科学、脑科学、语言学等感兴趣的所有读者,特别适合语言信息处理方面的研究者及学生参阅。9787030431615
|
內容簡介: |
《论语言概念空间的总体结构》是《HNC 理论《论语言概念空间的总体结构》》的第五册。HNC 理论以自然语言理解为其核心探索目标,试图为语言理解的探索开启一条新的途径,以语言概念空间的符号化、形式化为手段,实现人类语言脑的纯物理模拟。
《论语言概念空间的总体结构》围绕“概念无限而概念基元有限、语句无限而句类有限、语境无限而语境单元有限、显记忆无限而隐记忆有限”这4 项HNC 理论的基本定理,集中论述语言概念空间的概念基元、句类、语境单元和记忆四层级结,并对语言信息处理中的具体问题作了深入剖析。
|
目錄:
|
目录
作者的话
引文;I:处缩略语对照表
第三卷 卷首语
第一编 论概念基元 1
第一章 概念基元总论 3
第1节 概念基元有限性的形而卜思考 5
第2节 概念基元的抽象与具体两分 15
第3节 抽象概念基元的范畴i分 18
第4节 基元、基本和逻辑概念的“6、2、4”分 23
第5节 广义作用效应链的“二生二四” 28
第6节语境基元 29
第二章 五元组 31
第1节 五元组与词类的异同概述 33
第2节 五元组主要是对基元概念形态世界的描述 37
第3节 五元组的组合特性 39
第4节 五元组特定元素的强存在性 44
第三章 概念树 49
第1节 概念树内容世界回顾 51
第2节 概念树形态世界素描 53
第四章概念延伸结构表示式 61
第1节 概念延伸结构表示式简介 63
第2节 横向延伸的齐备性探求 91
第3节 纵向延伸的透彻性探求 91
第4节 挂靠的哲理描述 92
第五章 概念关联式93
第1 节概念关联式的类型描述95
第2 节概念关联式的编码及标记97
第六章语言理解基因99
第二篇论句类103
第一章语块与句类105
第1节语块类型与要素107
第2节主块构成113
第3节基本句类与广义作用效应链基础概念116
第4节基本句类表示式与句类代码120
第5节混合句类124
第6句蜕与块扩132
第二章广义作用句与格式139
第1节回顾与反思141
第2节广义作用句的类型描述147
第3节格式与块扩是广义作用句的专利152
第4节格式与自然语言的分类155
第三章广义效应句与样式157
第1 节回顾与反思159
第2 节广义效应句的类型描述167
第3 节样式的此山景象169
第四章句类空间与句类知识173
第1 节句类空间与概念基元空间的对应性175
第2 节句类空间类似于一座城市的地理描述180
第3 节主体句类知识就是句类表示式与块码关联式的联姻182
第4 节句类知识类似于一座城市的社会人文描述187
第三篇论语境单元199
第一章语境?领域与语境单元203
第1 节语境与语境基元205
第2节领域DOM218
第3 节语境单元SGU222
第4 节语境单元SGU 是领域DOM 的函数232
第二章领域句类与语言理解基因SCD,LUG251
第1 节领域句类SCD 与情景SIT253
第2 节语言理解基因LUG 与领域意识DOMC269
第三章浅说领域认定与语境分析DD;SGA;BACE+BACA 305
第四章浅说语境空间与领域知识SGS,DOMC317
第四编论记忆323
第一章 记忆与领域327
第1 节同一领域的记忆分置于不同位置是 不可思议的329
第2 节不同领域记忆区块之间的信息传递333
第3 节不同领域记忆区块之间的缓冲区339
第二章 记忆与作用效应链ABS,XY343
第1 节作用与效应侧面的记忆 以殊相记忆为主——XYD,XYN 346
第2 节过程与转移?关系与状态侧面的记忆以共相 记忆为主——PT,RS 353
第3 节广义作用效应链之判断侧面在记忆中的角色369
第三章记忆与对象内容ABS,BC395
第1 节具体概念的记忆唤起397
第2 节抽象概念的记忆唤起400
第3 节记忆索引小议411
第四章 动态记忆DM 与记忆接口IOM 浅说413
第1节动态记忆DM浅说415
第2 节记忆输入接口IM 浅说422
第3 节记忆输出接口OM 浅说474
第五章 广义记忆MEM杂谈477
第1 节关于广义记忆的补充说明479
第2 节记忆特区杂谈480
第3 节拷贝记忆杂谈487
术语索引489 人名索引495
《HNC 理论全书》总目500
|
內容試閱:
|
第一章 概念基元总论
引言
第1 节概念基元有限性的形而上思考
语言概念空间基本景象的描述
本节标题后面的括号里有一个不寻常的短语—语言概念空间基本景象的描述,这个短语可简化成“语言概念空间的基本景象”,还可进一步简化成“彼山基本景象”?这些短语都更适合作本章首节的标题,但考虑再三,还是选用了现在的标题?这不是为了保持撰写风格的一致性,而是为了凸显科学探索的要害所在,对于揭秘语言脑这一极为特殊的探索,这一点乃是攸关成败的第一大事,因为,如果没有形而上思考的足够功力,是很难看清彼山的基本景象的?当然,彼山景象本身的描述非常重要,前文已经用了不少篇幅,后文还会继续这么做,本《全书》以着重描述彼山景象为己任,也有成就一部彼山专著的梦想,但毕竟孤掌难鸣,笔者将仅以披荆斩棘为满足?描述此山景象的专著早已浩如烟海,通俗读物也不乏精彩之作,如果将来能出现兼述两山景象的专著或通俗读物,那将是一件功德无量的事?
“概念无限而概念基元有限”是HNC 探索起步时的一个基本假定?该假定的提出受到两件事的启发或激励:一是黑格尔的名言—哲学的开端就是一个假定;二是汉字的“减而不增”现象,《理论》里对此有符合世界知识阐释标准的论述[*01] ?
基于“概念无限而概念基元有限”假设而得到的第一批探索成果既包括本章后续3 节所描述的内容,也包括本编第二?第三章的内容,那是20 世纪90 年代初期的事?当时,一些研究HNC 的朋友曾把这一初步成果比作“元素周期表”的发现?这个比喻一直使笔者深感不安,因为“概念无限”或许有点类似于物质结构和形态的无限,但“概念基元”不能等同于元素,而“概念基元有限性”更不能等同于“元素周期表”?
“概念基元”是什么?它是所谓的语义基元或概念节点么?这是本节必须回答的第一个问题?“概念基元”如何定义?“概念基元”与“基元概念”是什么关系?这是本节必须回答的第二个问题?“概念基元有限”是假设还是公理?公理之说的依据何在?这是本节必须回答的第三个问题?以下用3 个小节进行论述,每小节的标号方式与前两卷相同,以达到《全书》的统一?
1.1.1 概念基元不是语义基元或概念节点
“语义”是当下中国的热门词语,国家级科技项目都高举着“语义”的大旗?这一景象非常奇特,笔者也不明白其究竟,但有一点是清楚的,多年来主宰着计算语言学的语法派理性主义和语料库派经验主义都遇到了巨大的危机,传统的词法和句法分析已经难以有所作为了,基于语料库的各种统计算法语料库语言学已开始显露出“黔驴”的本相?双方都要寻求出路,不约而同地都求救于语义学,以为语义是一根靠得住的救命稻草?
英语词典里并没有“语义”这个词语,只有“语义学”这个词语,《现汉》也如法炮制,《现范》则反其道而行之,收录了“语义”而未收录“语义学”,因为《现范》原则上不收录带后缀“学”的三字词?《现范》对“语义”的解释十分宽泛,大大超出了《现汉》对“语义学”的解释范围?
《现范》对“语义”的解释[*02] 需要大力依靠“意义”这个通用词语,还要依靠“词汇”?“句子”?“语法”?“语用”?“语境”等专业词语,以及其他一系列通用词语如“概念”?“交际”?“适应”等?《现范》对“语义”的解释在形式和内容两方面似乎都十分到位,但语言脑对“语义”的理解依靠这样的解释么?这里的“依靠”既有“能不能”的问题,又有“需要不需要”的问题?不追问这两个问题是形而下思维或“一根筋”思维的习惯或表现,追问下去才是形而上思维或灵巧思维的习惯或表现,这将在下一小节细说?
下面回到本小节的主题:概念基元不是语义基元或概念节点?先说“概念基元是什么”,然后再说为什么“概念基元不是语义基元或概念节点”?
概念基元是指456 株概念树所对应的各级延伸概念,不包括概念树本身,更不包括居其上位的概念林群和概念范畴?延伸概念这个术语的提出较晚,笔者在使用这个术语之初也没有特意强调它的极端重要性,这是HNC 探索历程中最为遗憾的一件事?基于一种弥补最大遗憾的心情,这里特意写下对应的英语符号:extended concept ,简记为EC?
各级延伸概念的总和是有限的,本《全书》的前两卷已充分揭示了这一点?所谓“概念基元的有限性”就是指“各级延伸概念总和的有限性”?理解了这一点,才算是真正理解了HNC 理论的精髓?
但真正理解这一点并非易事,这既需要向上思考,把握“概念树-概念林-概念范畴”的有限性;又需要向下思考,把握延伸级别纵向延伸的有限性和同级延伸数量横向延伸的有限性?上行思考和下行思考都要力行齐备性和透彻性的原则简称“透齐原则”,前两卷经常使用这个简称,这确实是“一根筋”思维习惯难以适应的?
这里的“上行思考”和“下行思考”是以概念树为参照来说的,如果以概念范畴为参照,则上述“上行思考”也变成了“下行思考”,HNC 之“概念范畴-概念林-概念树”的最终确定是上行思考与下行思考多番交织的结果,“1200 个汉字”虽然曾是此项交织思考的基本依托,但该思考的主心骨还是康德先生所强调的理性法官[*03] ,这就是说,上行思考与下行思考要在不断改变参照层级的过程中交织进行,而关键是:要善于中间切入,先上后下?一味“上而不下”者叫空想家,专注“下而不上”者叫专家,善于“中间切入,先上后下”者才是思想家?上行思考的通俗名称叫“仰望星空”,下行思考的通俗名称叫“俯瞰大地”?语言的“星空”叫作语言概念空间,简称“彼山”,描述彼山景象的东西叫原则或公理;语言的“大地”叫作自然语言空间,简称“此山”,描述此山景象的东西叫规则或定理?乔姆斯基先生虽然自视甚高,但并不明白这个关于原则与规则的区分依据或区别法则?“一根筋”思维的基本特征是:既不仰望,更不俯瞰,而是随波逐流?一个世纪以来,语言和大脑的探索是否处于随波逐流的可悲状态呢?是提出这个问题的时候了?
当然,随波逐流是一股巨大的惯性力量,是文明主体之现代化历程的心理引擎之一,也是一把双刃剑,其积极意义的一面不能抹杀?但是,许多重大的科学探索活动要力求避免随波逐流的消极面,而这项特定的“力避”非常困难,在HNC 探索的《理论》阶段,这种消极影响可谓历历在目,最典型的印迹就是“语义网络”?“语义块”?“语义距离”等术语的提出或使用?其中,“语义块”这一术语最令笔者痛心疾首,因为那个“义”字不仅是多余的,而且为害极大?
语形?语义?语用之“三语”说[*04] 是符号学对20 世纪人文社会学的一项重要贡献,但“三语”说乃是貌似体说而实为线说的典型学说,并未发展成为适用于彼山景象描述的指导理论?语形?语义?语用不过是仅供分析与归纳之用的三条线而已,不能构成符合“综合与分析+演绎与归纳”要求的三维度思考空间,因而也必然不能胜任对彼山景象的描述?语言学界曾应用“三语”说进行此山景象的描述,但收效不大?表面上似乎形成了语形学?语义学和语用学之间的分工与合作,实际上是形成了一幅独特的“推卸责任”景象,把困难矛盾逐级上交,语形学解决不了的问题上交给语义学,语义学解决不了的问题再上交给语用学?其结果是出现了许多有趣的责任纷争,这主要发生在语义学与语用学之间?但是,自然语言处理的基本责任究竟是什么?该项处理所面对的“劲敌”根本问题或战略性问题和“流寇”枝节问题或战术性问题[*05] 有哪些?纷争的参与者们并不明确,甚至都没有认真思考过?
语形学实际上是语法学的“老地盘”,千年老店,品牌价值无与伦比;语义学也有许多不俗的成绩,语用学更是曾风光无限,促成了20 世纪哲学研究的著名语用学转向?但品牌价值?不俗成绩和无限风光几乎丝毫无助于机器翻译遭遇的半世纪尴尬[*06] ?这是一个严酷的现实,但被一些传统的光环掩盖了?当然,不能说学界有人在刻意隐瞒什么,但实际上在起着一种掩盖作用,中国计算语言学界的表现尤为突出,林杏光先生的重庆遭遇[*aaa]就是一个非常值得反思的事件或证据?
这里应该明确告知读者:HNC 探索就是从对这一严酷现实的反思起步的,其理论目标就是试图建立一个符合“语形?语义?语用”体说要求的理论体系?当时对语义学的认识还是比较清醒的,知道它绝对没有能力独立承担起降服“劲敌”和扫荡“流寇”的重任,可是为什么《理论》竟然还是提出了“语义块”的术语呢?现在回想起来,未免感到不可理喻,因为当时已非常清楚:“语义块”不仅是语义的基元,也是语形和语用的基元,是三者的综合基元?这个“义”字添加的失误造成了巨大的贻害,现在不理解此话的读者将来会逐步明白的?
但读者现在就应该理解为什么说“概念基元不是语义基元”了,因为在HNC 的词典里,只有概念基元,没有语义基元;只有语块,没有语义块?子曰:“必也正名乎!”《论语?子路》还是照孔夫子的意见办吧?
概念节点这个术语是怎么流行起来的,笔者也不太明白?这个术语的弊端在于它不区分概念树及其上端的概念和处于概念树之下的延伸概念,后者才是“概念无限而概念基元有限”这一命题里的概念基元?这就是说,概念节点是一个过于笼统的概念,不用为佳?
“概念无限而概念基元有限”的命题是HNC 理论的根基,本《全书》的前两卷就是对该命题的论证?论证的基本思路也可以用上行思考和下行思考这两个方面来表述,上行思考的表述是:概念基元的有限性立足概念树的有限性;概念树的有限性立足于概念林的有限性,概念林的有限性立足于概念范畴的有限性?那么,语言脑的概念范畴是否有限呢?HNC 的答案是:当然?请把这答案当作一项公理来对待吧!下行思考的表述是:延伸概念的纵横结构都是有限的,纵向延伸的边界触及专家知识,横向延伸的边界触及生理脑和大脑之另4 项构成图像脑?情感脑?艺术脑和科技脑的相关知识?诚然,这两大边界也许是一个巨大的模糊地带,那就让它们继续存在吧,不进入或适度进入该模糊地带就是HNC 的基本对策?如果说语言脑概念范畴的有限性是概念基元有限性这一论断的必要性保证,那么,不进入或适度进入的基本对策就成了该论断的充分性保证?
1.1.2 概念和概念基元都需要采取灵巧式定义
上一小节最后说到的基本对策不过是灵巧思维的一次简单应用,本小节要说明的内容就不同了,它不是灵巧思维的简单应用,而是非简单应用?
与灵巧思维对应的东西叫“一根筋”思维,“一根筋”思维的典型样板就是关于语言的定义,国内教科书里的表述如下:语言以语音?为物质外壳,由词汇和语法两部分构成的符号系统??,是人类最重要的交际工具?人们利用它进行思维???,交流思想?,组织社会生产,开展社会斗争,承载信息,传承文明?它有口语和书面语两种形式?它是一种特殊的社会现象?
上面对此段论述加了不同数量的“?”,所指文字以仿宋字体标示?被标示的词汇或短语共计4 个,“?”越多,问题越大,最多的标了3 个问号,相应的问题依次陈述如下?
问题1:“语言以语音为物质外壳?”怎么可以只提语音而撇开文字呢?这也许适合于印欧语系,但绝不适合于汉语,汉语不可能拼音化,还需要为消灭汉字的主张保留退路么?
问题2:“语言符号系统仅由词汇和语法两部分构成?”“词汇和语法”不就是符号学的语形么?怎么可以把“三语”说的语义和语用这两个维度抛开不管,而死守着19 世纪之前的语言学阵地说法呢?乔姆斯基先生不是早在20 世纪50 年代就用一个著名的例句“Colourless green ideas sleep furiously ”否定了“两部分构成”的说法么?
|
|