Llama
Internals
本文主要介绍Llama的模型结构和主要优化特性。
Model Architecture
Llama结构整体如上,是个典型的decoder-only结构,它包含如下部分:
Embedding
Transformer stack
RMS Norm
Linear
Softmax
Transformer stack包含多个Transformer...