About 50 results
Open links in new tab
  1. 一文了解Transformer全貌(图解Transformer)

    Sep 26, 2025 · 网上有关Transformer原理的介绍很多,在本文中我们将尽量模型简化,让普通读者也能轻松理解。 1. Transformer整体结构 在机器翻译中,Transformer可以将一种语言翻译成 …

  2. 如何从浅入深理解 Transformer? - 知乎

    Transformer升级之路:1、Sinusoidal位置编码追根溯源 Transformer升级之路:2、博采众长的旋转式位置编码 猛猿:Transformer学习笔记一:Positional Encoding(位置编码) 解密旋转位 …

  3. Transformer模型详解(图解最完整版) - 知乎

    Transformer 的整体结构,左图Encoder和右图Decoder 可以看到 Transformer 由 Encoder 和 Decoder 两个部分组成,Encoder 和 Decoder 都包含 6 个 block。Transformer 的工作流程大体 …

  4. 如何从浅入深理解 Transformer? - 知乎

    Transformer 的整体结构,左图Encoder和右图Decoder 可以看到 Transformer 由 Encoder 和 Decoder 两个部分组成,Encoder 和 Decoder 都包含 6 个 block。 之前自然语言处理主要的算 …

  5. 如何最简单、通俗地理解Transformer? - 知乎

    Transformer最开始应用于NLP领域的机器翻译任务,但是它的通用性很好,除了NLP领域的其他任务,经过变体,还可以用于视觉领域,如ViT(Vision Transformer)。 这些特点 …

  6. 你对下一代Transformer架构的预测是什么? - 知乎

    2. 引入随机化(Randomized Transformer) Transformer巨大的规模使得不管训练还是推理都极具挑战。 然而,很少有人知道的是,引入随机化矩阵算法可以减少Transformer需要的FLOPs。 …

  7. 有没有比较详细通俗易懂的 Transformer 教程? - 知乎

    Transformer目前没有官方中文译名,暂时就叫Transformer吧。 在该论文中,作者主要将Transformer用于机器翻译 [2] 任务,后来研究者们发现Transformer在自然语言处理的很多任 …

  8. Transformer与图神经网络本质的区别是什么? - 知乎

    想要理解Transformer与图神经网络本质的区别,可能需要从三个问题去入手。 1.Transformer与图神经网络(GNN)的区别: 设计初衷与处理的数据类型:Transformer最初是为处理序列数 …

  9. 想问问 Transformer模型 的参数量是怎么计算的? - 知乎

    前文所述,一次前向传递中,对于每个token,每个模型参数,大约进行2次浮点数计算。 所以使用激活重计算的一次训练迭代中,对于每个token,每个模型参数,需要进行 次浮点数运算。 在 …

  10. Transformer架构是否已触及天花板?光靠Transformer能走通AGI …

    Transformer 还远未触顶,但天花板还在那里,光靠它很难单独支撑 AGI 落地。 如今它是业界最高效的特征提取器,是实践 Scaling Law 的不二载体,这一地位目前几乎无可替代。但长线来 …