自然语言处理工作中，在自动建构关键词(非控制字汇)时，经常采用的方法是？ - CDA考试专区 - CDA网校-CDA考试、CDA培训、CDA报名 - 150000+ 数据分析师推荐的学习平台！

CDA数据科学研究院 CDA考试中心 CAIE认证 CDA网校企业服务

CDA竞赛 CDA技术答疑 CDA俱乐部 CDA论坛

关于CDA App下载

CDA考试专区加入小组

1096个成员 594个话题创建时间：2017-12-06

自然语言处理工作中，在自动建构关键词(非控制字汇)时，经常采用的方法是？

收藏

发表于09-11 1180次查看

数据分析认证考试介绍：https://www.cdaglobal.com/pinggu.html?utm_source=edu_cda_cn

自然语言处理工作中，在自动建构关键词(非控制字汇)时，经常采用的方法是？

A. Controlled Vocabulary（控制字汇）

B. Inversion of Terms（逐项反转）

C. Inverse Document Frequency (IDF)

D. Full-Text Scanning
参考答案： C
解析：建立关键词的程序(抽取层次:词) - 读取文献 - 分词(中文需要) - 利用 Suffix String 将 Word 重整至最基本字型(Stem Word)(英文需要) - 计算每个 Word 的IDF - 利用一个阀值(Threshold) - 选出代表文献的关键词及其IDF - 产生Stop Words由此，可以看出本题选C

专为CDA数据分析认证考试报考打造的一款小程序。可以帮你快速报名考试、查成绩、查证书、查积分，通过该小程序，考生可以享受更便捷的服务。

扫码加入CDA小程序，与圈内考生一同学习、交流、进步！

只看楼主倒序查看

发表回复

你还没有登录，请先登录或注册！

(大小不能超过 2 MB，文件类型支持png ,jpg ,gif ,doc ,xls ,txt ,rar ,zip .)

文件名	描述	金币	操作

话题作者

CDA网校

一站式数据科学在线教育平台

新加组员

热门小组

CDA考试专区

1096 594

523 12

CDA会员俱乐部

415 140