Word2vec，是一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络，用来训练以重新建构语言学之词文本。关于word2vec模型，下面说法不正确的是：

【新版上线】《CDA模拟题（2025）》https://edu.cda.cn/goods/show/...

【新版上线】《CDA一级教材》试读已上线:https://edu.cda.cn/goods/show...

【免费活动】AI x 产品设计思维工作坊（2025 年 8 月 31 日开营）https://www...

CDA数据科学研究院 CDA考试中心 CAIE认证 CDA网校企业服务

CDA社区

CDA竞赛 CDA技术答疑 CDA俱乐部 CDA论坛

关于CDA App下载

CDA考试专区加入小组

1166个成员 594个话题创建时间：2017-12-06

发表于09-06 1160次查看

数据分析认证考试介绍：https://www.cdaglobal.com/pinggu.html?utm_source=edu_cda_cn

Word2vec，是一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络，用来训练以重新建构语言学之词文本。关于word2vec模型，下面说法不正确的是：

A. 得到的词向量维度小，可以节省存储和计算资源

B. 考虑了全局语料库的信息

C. 无法解决多义词的问题

D. 可以表示词和词之间的关系
参考答案： B
解析：文本表示的目的是把文本预处理后的转换成计算机可理解的方式。它的发展过程是从One-Hot编码的词集模型（统计各词在文本中是否出现）->CountVectorizer、IF-IDF这样的词袋模型（考虑了词频、词的重要性，但是会出现词表膨胀的问题）->word2vec、GloVe模型这样的词嵌入模型（将各词映射为实数域上的向量，词向量之间的几何关系表示词之间的语义关系；降低了词向量维度）。因此A、D正确。word2vec的skip-gram、CBOW这两种模型每次都是用一个窗口中的信息更新出词向量，而Glove才是用全局的信息（共线矩阵），也就是多个窗口进行更新的模型。所以B不正确。但是Word2Vec、GloVe模型都不能有效表示自然语言中广泛存在的多义词的问题，因此才有后来的ELMO模型。所以C选择正确

专为CDA数据分析认证考试报考打造的一款小程序。可以帮你快速报名考试、查成绩、查证书、查积分，通过该小程序，考生可以享受更便捷的服务。

扫码加入CDA小程序，与圈内考生一同学习、交流、进步！

只看楼主倒序查看

发表回复

你还没有登录，请先登录或注册！

(大小不能超过 2 MB，文件类型支持png ,jpg ,gif ,doc ,xls ,txt ,rar ,zip .)

文件名	描述	金币	操作

话题作者

CDA网校

一站式数据科学在线教育平台

新加组员

热门小组

CDA考试专区

1166 594

题库专区

529 12

CDA会员俱乐部

421 142

CDA考试专区加入小组