Back
按概念递进顺序:网络结构、梯度下降、嵌入向量、Transformer、注意力机制、MLP 事实存储。
deep-learning
3b1b
transformer
neural-network
gpt
llm