单项选择题

Transformer中的Attention机制主要是用来做什么的?()

A.将输入序列直接映射到输出序列
B.生成新的词嵌入向量
C.替换Encoder和Decoder中的全连接层
D.计算输入序列中每个词的重要性