新書推薦:
《
我从何来:自我的心理学探问
》
售價:NT$
545.0
《
失败:1891—1900 清王朝的变革、战争与排外
》
售價:NT$
390.0
《
送你一匹马(“我不求深刻,只求简单。”看三毛如何拒绝内耗,为自己而活)
》
售價:NT$
295.0
《
秦汉史讲义
》
售價:NT$
690.0
《
万千心理·我的精神分析之道:复杂的俄狄浦斯及其他议题
》
售價:NT$
475.0
《
荷马:伊利亚特(英文)-西方人文经典影印21
》
售價:NT$
490.0
《
我的心理医生是只猫
》
售價:NT$
225.0
《
股权控制战略:如何实现公司控制和有效激励(第2版)
》
售價:NT$
449.0
|
內容簡介: |
《汉语主题词表》是我国*部大型综合性叙词表,由中国科学技术情报研究所(现中国科学技术信息研究所)和北京图书馆(现国家图书馆)主持编制,505个单位参与,1980年6月由科学技术文献出版社出版,包括自然科学和社会科学领域,共收词汇108 568条。《汉语主题词表》是我国情报界与图书馆界20世纪70年代集体协作的智慧结晶。由于它覆盖各个学科专业,收词量大,编制体例规范,主题标引规则通用性强,推动了我国主题标引工作的开展,在促进计算机文献数据库的建立,以及专业叙词表的编制、发展与完善方面,都发挥了极为重要的作用,于1985年获得国家科学技术进步奖二等奖。1991年5月,中国科学技术信息研究所对自然科学部分进行了修订与增补,出版了《汉语主题词表(自然科学增订本)》。增订后主表共收录主题词81 198条,其中正式主题词68 823条,非正式主题词12 375条。
从20世纪90年代末开始,信息网络技术在世界范围内得到普及和应用,以谷歌、百度为代表的网络搜索引擎,逐渐发展成为网络时代主流的信息检索方式。随着数字信息资源的快速增加,网络检索面临严重的检全和检准问题,很多目标信息被淹没在海量信息之中,很多知识被隐藏于数据冗余之间。解决这些问题需要有大型叙词表作为基础工具来强化知识系统建设,深化数据处理和挖掘,推进知识的组织与服务。 《汉语主题词表》是我国*部大型综合性叙词表,由中国科学技术情报研究所(现中国科学技术信息研究所)和北京图书馆(现国家图书馆)主持编制,505个单位参与,1980年6月由科学技术文献出版社出版,包括自然科学和社会科学领域,共收词汇108 568条。《汉语主题词表》是我国情报界与图书馆界20世纪70年代集体协作的智慧结晶。由于它覆盖各个学科专业,收词量大,编制体例规范,主题标引规则通用性强,推动了我国主题标引工作的开展,在促进计算机文献数据库的建立,以及专业叙词表的编制、发展与完善方面,都发挥了极为重要的作用,于1985年获得国家科学技术进步奖二等奖。1991年5月,中国科学技术信息研究所对自然科学部分进行了修订与增补,出版了《汉语主题词表(自然科学增订本)》。增订后主表共收录主题词81 198条,其中正式主题词68 823条,非正式主题词12 375条。
从20世纪90年代末开始,信息网络技术在世界范围内得到普及和应用,以谷歌、百度为代表的网络搜索引擎,逐渐发展成为网络时代主流的信息检索方式。随着数字信息资源的快速增加,网络检索面临严重的检全和检准问题,很多目标信息被淹没在海量信息之中,很多知识被隐藏于数据冗余之间。解决这些问题需要有大型叙词表作为基础工具来强化知识系统建设,深化数据处理和挖掘,推进知识的组织与服务。
鉴于《汉语主题词表》对我国情报检索语言发展的历史贡献,以及图书情报界对网络环境下新型《汉语主题词表》的期待,中国科学技术信息研究所于2009年启动了《汉语主题词表》的重新编制工作。《汉语主题词表》的重编工作分4个阶段逐步开展,依次为工程技术卷、自然科学卷、生命科学卷和社会科学卷。工程技术卷已于2014年9月完成,该卷共13册,收录概念19.6万个,词汇36万条,在国家工程技术图书馆进行了示范应用。考虑到生物学与医学、农业有较大的交叉渗透,将生物学从自然科学卷中分离出来,与医学、农业合编为生命科学卷,放在第三阶段统一编制。目前的自然科学卷主要包括数学、物理学、化学、天文学、地球科学等学科领域,编制工作已于2017年完成。生命科学卷的编制也将在2018年启动,*后将编制社会科学卷。
为配合《汉语主题词表》的编制工作,我们收集并加工了包括文献关键词、用户检索词、百科全书、专业术语、叙词表等词汇资源,建立了收词量达500万条的中文基础词库;研究词汇分类特征,构建了既满足词汇分类又满足文献分类的分类体系;开发了适用于网络环境协同工作的叙词表编制与管理平台;在广泛征求意见并充分论证叙词表机器应用模式的基础上,面向数字信息资源组织,制定了《汉语主题词表》编制规则。
自然科学卷的编制工作于2015年启动,仍沿用工程技术卷的编制方法和组织模式,由中国科学技术信息研究所联合国内7家单位协同编制。在大家共同努力下,《汉语主题词表(自然科学卷)》历经3年完成,如期出版。《汉语主题词表(自然科学卷)》共收录优选词6.5万条,非优选词5.9万条,等同率为0.91,属分参照度为2.09,相关参照度为0.87。《汉语主题词表(自然科学卷)》覆盖多个学科领域,词量庞大,正确地建立复杂的概念关系绝非易事,相关细节之争论或缺陷尚有待于不断交流、完善和持续更新。
本次《汉语主题词表》的重新编制是新时期我国图书情报界全国性大协作工程的成果,是网络在线编制叙词表的协同示范。在此谨向参加编制工作的所有单位和个人及参与论证和指导的研究单位和个人表示感谢。
叙词表具有深厚的理论基础和广阔的应用前景,网络环境下《汉语主题词表》既可以应用于资源组织与知识关联,又可以应用于支撑知识展示与数据服务。通过嵌入信息系统,实现基于《汉语主题词表》的机器标注和语义关联,直接应用到主题标引、智能检索、自动聚类、热点追踪、知识链接、术语服务、科研关系网络构建等多个方面。为促进《汉语主题词表》的应用和发展,我们开发了《汉语主题词表》网络服务系统,提供概念检索服务,通过可视化技术展示各类概念关系,同时提供基于《汉语主题词表》的辅助标引服务。
我们期待着与业界同行继续推进《汉语主题词表》的基础建设和维护更新,期盼社会各界全面推进网络环境下《汉语主题词表》的应用实践,促进知识资源的有序组织和知识服务的深层发展,服务于学术界和社会大众。
|
|