数据分析认证考试介绍:https://www.cdaglobal.com/pinggu.html?utm_source=edu_cda_cn
自然语言处理工作中,在自动建构关键词(非控制字汇)时,经常采用的方法是?
A. Controlled Vocabulary(控制字汇)
B. Inversion of Terms(逐项反转 )
C. Inverse Document Frequency (IDF)
D. Full-Text Scanning
参考答案: C
解析:建立关键词的程序(抽取层次:词) - 读取文献 - 分词(中文需要) - 利用 Suffix String 将 Word 重整至最基本字型(Stem Word)(英文需要) - 计算每个 Word 的IDF - 利用一个阀值(Threshold) - 选出代表文献的关键词及其IDF - 产生Stop Words由此,可以看出本题选C
专为CDA数据分析认证考试报考打造的一款小程序。可以帮你快速报名考试、查成绩、查证书、查积分,通过该小程序,考生可以享受更便捷的服务。
扫码加入CDA小程序,与圈内考生一同学习、交流、进步!