CDA考试专区 加入小组

844个成员 593个话题 创建时间:2017-12-06

Word2vec,是一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。关于word2vec模型,下面说法不正确的是:

发表于09-06 194次查看

数据分析认证考试介绍:https://www.cdaglobal.com/pinggu.html?utm_source=edu_cda_cn

Word2vec,是一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。关于word2vec模型,下面说法不正确的是:

A.    得到的词向量维度小,可以节省存储和计算资源

B.    考虑了全局语料库的信息

C.    无法解决多义词的问题

D.    可以表示词和词之间的关系
参考答案: B
解析:文本表示的目的是把文本预处理后的转换成计算机可理解的方式。它的发展过程是从One-Hot编码的词集模型(统计各词在文本中是否出现)->CountVectorizer、IF-IDF这样的词袋模型(考虑了词频、词的重要性,但是会出现词表膨胀的问题)->word2vec、GloVe模型这样的词嵌入模型(将各词映射为实数域上的向量,词向量之间的几何关系表示词之间的语义关系;降低了词向量维度)。因此A、D正确。word2vec的skip-gram、CBOW这两种模型每次都是用一个窗口中的信息更新出词向量,而Glove才是用全局的信息(共线矩阵),也就是多个窗口进行更新的模型。所以B不正确。但是Word2Vec、GloVe模型都不能有效表示自然语言中广泛存在的多义词的问题,因此才有后来的ELMO模型。所以C选择正确

专为CDA数据分析认证考试报考打造的一款小程序。可以帮你快速报名考试、查成绩、查证书、查积分,通过该小程序,考生可以享受更便捷的服务。

扫码加入CDA小程序,与圈内考生一同学习、交流、进步!

发表回复
你还没有登录,请先 登录或 注册!
话题作者
一站式数据科学在线教育平台