史上最小白之Transformer详解-CSDN博客
文章浏览阅读10w+次,点赞2.1k次,收藏1w次。1.前言博客分为上下两篇,您现在阅读的是史上最小白之从Attention到Transformer详解(下)上篇博客地址:史上最小白之从Attention到Transformer详解(上)在上篇中我们已经介绍了Encoder-Decoder,Attention机制,self-Attention,今天就来一起看看近两年大火的Transformer。2.Transformer 原理2.1 Tr..._transformer