假设你正在使用一个包含6个编码器层的Transformer模型,那么多少次自注意力操作会被执行?
A. 6
B. 12
C. 18
D. 36
参考答案: A
解析:在标准的Transformer模型中,每个编码器层只执行一次自注意力操作。因此,对于6个编码器层,将执行6次自注意力操作。
CDA人工智能社区
工作时间:9:00-19:00
陈老师:13077998983
邮箱: edu_cda_cn@foxmail.com