关于我们
书单推荐
新书推荐

《汉语主题词表》构建研究

《汉语主题词表》构建研究

定  价:48 元

        

  • 作者:曾建勋,吴雯娜,常春,刘伟 著
  • 出版时间:2020/9/1
  • ISBN:9787518969487
  • 出 版 社:科学技术文献出版社
  • 中图法分类:G2 
  • 页码:
  • 纸张:胶版纸
  • 版次:1
  • 开本:16开
9
7
9
8
6
7
9
5
4
1
8
8
7

。《汉语主题词表》是我国第一部大型综合性叙词表,是专家与群众相结合,实行社会主义大协作的产物,是我国情报界与图书馆界于20世纪70年代协作的集体智慧结晶,并于1985年获得国家科学技术进步奖二等奖。


随着互联网技术的高速发展,大数据、云计算、机器智能对文本数据处理提出了更丰富的应用需求,对知识组织提出了更细粒度的计算关联要求,如进行切词、信息抽取、聚类、词频统计、情感分析等文本信息处理,在电子政务、电子商务的信息搜索中实现知识自动分类、智能推理和语义聚类,在各类知识管理中实现不同粒度的智能查询、领域监测、知识挖掘,在信息检索发现中实现分类导航和语义分面、英汉跨语言检索和辅助机器翻译等功能。这些都需要借助主题词表进行知识组织和文本处理,即《汉语主题词表》的应用将超越传统主题标引,跨出传统图书情报档案领域,融入整个文本信息处理和知识组织过程之中,应用于情报检索、搜索引擎、知识管理、电子政务、电子商务、数字出版、数据挖掘、知识计算等领域,发挥其更加广泛、更深层次和更有价值的作用,这就需要跨出图书情报视野,借助大数据、云计算和机器智能等新动能,放眼整个知识内容行业和文本信息处理领域,不断完善《汉语主题词表》的内在结构和外在功能,为《汉语主题词表》注入新鲜血液和活力,焕发数字环境下《汉语主题词表》的生命力。为此,中国科学技术信息研究所于2009年启动《汉语主题词表》在网络环境下的重构与修订工作,并分工程技术卷、自然科学卷、生物医学农业卷和社会科学卷依次展开修订。


为此,我们在中国科学技术信息研究所信息资源中心(国家工程技术图书馆)成立了《汉语主题词表》研究编制专项组。我们在剖析和正视传统《汉语主题词表》的内在问题和外在机遇之后,通过分析新时期知识组织和文本处理对《汉语主题词表》的需求,制定新型《汉语主题词表》编制的技术路线,编制新型《汉语主题词表》的重构和修订方案,收集与加工了包括文献关键词、用户检索词、各类百科全书、专业术语、相关专业及综合叙词表等在内的术语资源,建立收词量达400万条的基础词库;研究词汇概念的分类方法,构建概念与文献导航的范畴体系;结合认知计算和机器智能应用需要,制定《汉语主题词表》编制标准和规则,开发基于标准规则的叙词表协同编制管理平台;建立专业术语选词、专业概念归类与同义词归并、关系建立、范畴划分、逻辑关系验证、英文审定、增加参考注释等工作流程;采取先选词再分编最后融合、先选词再集成最后集中编制等多种方式,展开不同领域主题词表的编制工作。目前,《汉语主题词表(工程技术卷)》《汉语主题词表(自然科学卷)》已经修订完成并出版,正联合相关单位编制《汉语主题词表(生物医学农业卷)》。


网络环境下《汉语主题词表》的重构与修订是新时期全国图书情报界再次集体协作的典范项目,是网络在线编制叙词表的协同示范。《汉语主题词表》建设和应用具有深厚的理论基础,网络环境下《汉语主题词表》既可以运用于知识组织与知识关联,又可以支撑知识计算与知识服务,通过有机地嵌入各类信息系统,实现基于《汉语主题词表》的机器标注和语义关联,直接应用到主题标引、知识检索、自动聚类、热点追踪、知识链接、术语服务、科研关系网络构建等多个方面。我们一方面期待与业界同行继续推进《汉语主题词表》的基础建设和持续维护更新;另一方面期盼社会各界全面实施网络环境下《汉语主题词表》的应用及实践,不断推进知识资源的有序组织和知识服务的深层次发展,服务于信息精确检索和数据智能挖掘。



 你还可能感兴趣
 我要评论
您的姓名   验证码: 图片看不清?点击重新得到验证码
留言内容