CDA考试专区 加入小组

844个成员 593个话题 创建时间:2017-12-06

自然语言处理工作中,在自动建构关键词(非控制字汇)时,经常采用的方法是?

发表于09-11 480次查看

数据分析认证考试介绍:https://www.cdaglobal.com/pinggu.html?utm_source=edu_cda_cn

自然语言处理工作中,在自动建构关键词(非控制字汇)时,经常采用的方法是?

A.    Controlled Vocabulary(控制字汇)

B.    Inversion of Terms(逐项反转 )

C.    Inverse Document Frequency (IDF)

D.    Full-Text Scanning
参考答案: C
解析:建立关键词的程序(抽取层次:词) -  读取文献 -  分词(中文需要) -  利用 Suffix String 将 Word 重整至最基本字型(Stem Word)(英文需要) -  计算每个 Word 的IDF -  利用一个阀值(Threshold)    -  选出代表文献的关键词及其IDF    -  产生Stop Words由此,可以看出本题选C

专为CDA数据分析认证考试报考打造的一款小程序。可以帮你快速报名考试、查成绩、查证书、查积分,通过该小程序,考生可以享受更便捷的服务。

扫码加入CDA小程序,与圈内考生一同学习、交流、进步!

发表回复
你还没有登录,请先 登录或 注册!
话题作者
一站式数据科学在线教育平台