mac arm64 使用 gpu 构建 llama

系统运维 2023-08-13 Escape 手机阅读

本地 pc 跑大模型

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp


# 如果要使用 gpu 计算 （gpu 硬件卸载（cpu）计算开销）
LLAMA_METAL=1 make


# -ngl 1 表示使用 gpu
./main -m ./models/7B/ggml-model-q4_0.bin -n 128 -ngl 1

当然你也可以在没有 GPU 的 linux上跑，或者 windows，甚至可以分布式的在多个机器上跑

参考: github.com/ggerganov/l…

win7激活密钥

如何在 CentOS 9 Stream 上安装 Tor 浏览器

Ubuntu LTS哪个稳定吗？详细对比分析

Win11怎么修改应用获取位置

如何在Linux改变Gradle下载目录