品牌升级,查看新版
4000-058-056
品牌全面升级,论文检测进入“PaperRight”时代!

科技论文关键词标引方法的误导必须纠正


2015年09月05日 | 作者: paperrater | 分类: 行业动态 | 来源:PaperRater论文检测系统

我国科技期刊界论文标引关键词大多始于20世纪80年代中期。在十几年的实践中,同仁们积累了很多经验,不少有心人对标引关键词的意义、方法和规则进行了有益的研究及探讨,发表了有关的论文和专著,总数有几十篇(种)之多。笔者查阅了其中的大部分论著,通过分析发现有一个较为普遍的看法,就是参照“叙词标引方法”来标引关键词。有的甚至照搬国家标准GB/T38601995,将其用于关键词的标引。

显然,这种多数人的观点与某些导向有关,如1985—1990年间,CUJA(中国高等学校学报论文摘要(英文磁带版))在多次的培训班中,请了情报界和图书馆界的情报语言专家讲授“主题词表”和“叙词标引”;在有关科技期刊及科技论文的专著、“编辑教程”、“期刊编排规范”和“国家标准选编本”中,基本上都将《文献叙词标引规则》作为必须参照的国家标准之一。因此而产生的后果是:由于“叙词表”的容量和专指度不足,新学科的新名词、新术语不能及时补充;叙词标引法不能较好地适应计算机和网络技术环境,影响了标引质量。

按照叙词标引法对论文进行关键词标引给作者和编辑带来很大的困难,因为他们中的绝大部分都是非情报专业出身的,对叙词标引不熟悉。即使作者和编辑们费了很大的气力,学习和查阅“叙词表”,努力按照“叙词标引规则”去做,其结果仍然是标引质量不高,效果不好。

鉴于上述状况,笔者认为:应从概念上区分关键词与叙词的差异,对科技论文关键词的标引不应采用“叙词标引规则”,要简化关键词的标引程序和方法。

1.叙词、关键词及其标引方法

1)叙词(descripter)原称主题词,是用来描述图书资料的主题内容,是专为文献标引和检索而从能表达其主题概念的自然语言中挑选出来并加以规范化处理的标准词汇,即叙词表中能用于表征该文献主题内容的词语。关键词(keyword)是指出现在文献的标题(篇名、章节名)、摘要和正文中,对表征文献主题内容具有实质意义的词语,亦即对揭示和描述主题内容来说是重要的、带有关键性的、可作为检索入口的那些词或短语。叙词和关键词无等同关系,也无隶属关系,是各自独立的自成系统的情报检索语言,二者都是主题描述语言。

2)叙词是人工语言,是从大量的能明确表达文献主题内容的自然语言中优选出来的,将那些同义词、多义词、同形异义词进行标准化处理,转换成概念与词一一对应的单义词,即经规范化后的是一个词对应一个概念。关键词是自然语言,基本上不作规范化处理,不受“词与概念对应关系惟一性”的限制。

3)叙词标引是受控标引,也称赋词标引,是将文献中表达主题内容的有效词转换成系统的受控词———叙词表中的词。因为词表中的词量有限,允许通过表中2个以上的叙词用一定的关系符号将其联系起来,表达一个概念,即叙词的组配。标引的叙词可以是文献中的有效词,也可以用文献中没有出现过的,能准确表达文献中某一概念的词。

关键词标引是非受控标引,也称自由标引,是从文献的标题、摘要和正文的重要部分抽出来的自然语言,不受词表限制。关键词中每个词都是平等的、独立的,词与词之间不一定要求搭配关系(组配)。关键词都是文中的有效词。

4)由于叙词的标引规则要求严格,承担叙词标引者一般应是受过培训,掌握叙词标引规则者。关键词的标引者可以是文章的作者,也可以是具有一定专业知识,能对文献进行主题分析,了解索引词和检索词意义的编辑。即:关键词标引方法简便,易操作,省时省力;叙词标引方法较规范、较复杂,难度较大,要求标引者训练有素。

5)关键词标引原本就是为了适应索引词编制过程自动化的需要而产生的一种方法,所以很容易采用计算机抽取关键词、进行联机检索和适应网络环境。关键词的自由标引方法更适用于科学的不断发展,新概念、新名词术语不断涌现的需求。因为“叙词表”不可能及时收录最新的名词术语,在词表中常常找不到新生学科所对应的词和词组,自由标引方法适应了新学科不断出现的自然规律。叙词虽也可以建立数据库和联机检索,但由于其规则严格和词汇更换慢,限制了它的适应性。

2.关键词的标引方法和建议

作为情报检索语言,关键词的标引应以提供读者快捷、有效检索为目的。GB771387《科学技术报告、学位论文和学术论文的编写格式》中提出:“关键词是为了文献标引工作从报告、论文中选取出来用以表示全文主题内容信息款目的单词或术语。……如有可能,尽量用《汉语主题词表》等词表提供的规范词”。由此可见,国家标准并未对论文的关键词标引给出任何限制和必须使用叙词表的要求。

从学科发展和现代化检索手段的应用观点出发,自由标引关键词有利于非情报专业人员的操作及检索效果。自由标引法可按如下步骤进行:

对文献进行主题分析。通过浏览篇名、摘要、引言、结论乃至正文,正确理解和判断文中的主要内容和要点,抓住创新观点和最有价值的方法及结果,经分析、判断形成“主题概念”。

抽词。从标题、摘要和主要内容中抽取能反映主题概念的、足够数量的词和词组———浅标引;从学科性质、专业专指性和情报语言的特点出发,剔去前后不一致,学科概念和检索价值不大的词,经优选和取舍,保留一定数量的关键词———深标引。

为使标引更加准确地反映文章的主题,提高文章的被检索率,也可参阅有关专业词表(包括《汉语叙词表》),采用其中对应的词,但不必勉强套用叙词和进行组配,尤其不应调换原文献中的有效词,即不得用文献中没有出现的词,以免引起歧义。

注意删去无实际检索意义的词。同义词、近义词不应并列为关键词;化学结构式、反应式和数学式原则上不用;冠词、介词、连词、感叹词、代词、某些动词(连系动词、情感动词、助动词)不宜使用;某些不能表示所属学科专用概念的名词(如理论、报告、试验、学习、方法、问题、对策、途径、特点、目的、概念、发展等)不应作为关键词;慎用副词和形容词修辞及评价;不得用非公知公用的专业术语及其缩写。对于那些反映新技术、新学科而尚未被叙词表录入的新名词术语,也可列为关键词。

适当处理。为了充分揭示文献主题内容,对某些复合词可拆分为2个词;2个单义词可用连字符组成一个专有名词;采用补充词,如材料、方法和设备、地名、人名等都可作为关键词。

关键词的自由标引方法不仅适用于手工标引,也可利用计算机抽词,从文中、索引词中抽取关键词进行浅标引,然后经人工适当处理,完成关键词的标引。