Llama.cpp源码浅析

ggml

源码结构

学习入口函数

简单以llama.cli作为推理学习的入口。其入口函数main位置为:
llama.cpp/tool/main.cpp/main()

关键数据结构

内存管理

Arena 分配器

“批发内存,零售指针,整单清场”

批发内存:

image-20250731203157358

image-20250731203603357

零售指针

image-20250716213636373

image-20250716213622044

整场清除:

image-20250731203642921

mmap

模型加载流程:

核心步骤:

image-20250731222324509

llama_model_loadre 核心对象.

之后加载模型架构arch\超参数hparams\词表vocab\元数据信息、以及张量tensors


本站由 Zane Jiang 使用 Stellar 1.33.1 主题创建,一款很棒的 Hexo 主题!

总访问 次 || 本页访问
总访客 人 || 本页访客