源码方式安装llama.cpp及调试

llama.cpp源码方式安装和调试配置

构建和编译

注意这里是cuda，且要开启debug模式

cmake -B build -DGGML_CUDA=ON -DCMAKE_BUILD_TYPE=Debug
cmake --build build --config Debug

正在编译：

配置launch.json用于调式：

要根据自己的环境路径做相应修改

{"version": "0.2.0","configurations": [{"name": "(gdb) 启动","type": "cppdbg","request": "launch","program": "${workspaceFolder}/build/bin/llama-simple", // "args": [    // "-m", "output.gguf","-n", "32","-ngl", "99","Hello my name is" ],"stopAtEntry": false,"cwd": "${workspaceFolder}","environment": [],"externalConsole": false,"MIMode": "gdb", // "setupCommands": [{"description": "为 gdb 启用整齐打印","text": "-enable-pretty-printing","ignoreFailures": true},{"description": "将反汇编风格设置为 Intel","text": "-gdb-set disassembly-flavor intel","ignoreFailures": true}],"miDebuggerPath": "/usr/bin/gdb" // }]
}

转换模型为gguf格式

python convert_hf_to_gguf.py --outtype f16 --outfile "output.gguf" "/raid/home/huafeng/models/Meta-Llama-3-8B-Instruct"

运行第一个程序

在这里插入图片描述

调试程序（llama.cpp/examples/simple/simple.cpp）

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/21706.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

源码方式安装llama.cpp及调试

llama.cpp源码方式安装和调试配置

构建和编译

配置launch.json用于调式：

转换模型为gguf格式

运行第一个程序

调试程序（llama.cpp/examples/simple/simple.cpp）

相关文章

【Ubuntu】GPU显存被占用，但显示没有使用GPU的进程

第4章 4.1 Entity Framework Core概述

【DeepSeek】本地部署，保姆级教程

数据结构——字符串匹配KMP

排查JVM的一些命令

使用vue3框架vue-next-admin导出表格excel（带图片）

懒人精灵本地离线卡密验证系统教程(不联网、安全稳定、省钱、永久免费、无任何限制)

基于Flask的租房信息可视化系统的设计与实现

JUC并发—8.并发安全集合二

docker 改了镜像源为阿里云，还是下载失败

mysql总结

【Linux网络编程】应用层协议HTTP（请求方法，状态码，重定向，cookie，session）

城市地质安全专题连载⑦ | 加强国土空间规划管控，规避城市地质安全风险

内部知识库：安全协作驱动数字化转型新路径

【分布式理论11】分布式协同之分布式事务（一个应用操作多个资源）：从刚性事务到柔性事务的演进

ARM Linux平台下 OpenCV Camera 实验

Modbus协议基础

电脑想安装 Windows 11 需要开启 TPM 2.0 怎么办？

node 使用 Redis 缓存

解决双系统开机显示gnu grub version 2.06 Minimal BASH Like Line Editing is Supported