400-638-8808
|
微信公众号
DeepSeek-R1 大模型凭借其强大的推理与深度思考能力,在数学计算、编程及自然语言推理等任务上表现卓越。然而,在线服务存在不稳定性,同时数据隐私问题也是许多个人和企业关注的焦点。因此,选择本地部署 DeepSeek-R1 开源模型不仅可以提高稳定性,还能保障数据安全。
DeepSeek-R1 模型的最大参数规模为 671B(6710 亿参数),同时官方提供 1.5B ~ 70B 版本的蒸馏模型,用户可根据 显存 和 计算资源 选择合适的版本:
蒸馏模型介绍:
DeepSeek 提供的 1.5B ~ 70B 小参数模型是通过 知识蒸馏 生成的,即使用 DeepSeek-R1 大模型 训练较小参数的模型,使其在大幅降低计算需求的同时,仍能保留部分推理能力。
量化与存储需求:
本教程采用 Ollama 作为模型管理框架,该工具可 下载、运行、管理 大模型,是目前最便捷的本地推理工具。
本次部署以 8 块 A800 GPU 为例,配置如下:
成本预估:
- A100/A800 单张显卡 价格约 10 万元
- 租赁价格 约 5 元/小时/卡
- 高端配置可选 H100/H800、H20 等显卡
检查显卡状态(Linux 终端命令):
nvidia-smi
Ollama 支持 Windows、MacOS、Linux,安装步骤如下:
curl -fsSL https://ollama.com/install.sh | sh
安装成功后,运行:
ollama -v
如能正确显示版本号,则说明安装成功。
在运行 DeepSeek-R1 671B 前,需要调整 Ollama 运行参数 以优化性能:
export OLLAMA_MODELS=/datadisk # 更改模型存储路径(默认 ~/.ollama/models) export OLLAMA_DEBUG=1 # 开启 debug 日志 export OLLAMA_LOAD_TIMEOUT=120m # 设置模型加载超时时间(默认 5 分钟) export OLLAMA_KEEP_ALIVE=-1 # 让模型常驻显存,防止自动卸载 export OLLAMA_SCHED_SPREAD=1 # 多 GPU 均衡调度 export OLLAMA_NUM_PARALLEL=8 # 允许并发请求(根据显存调整)
注意事项:
- 并发配置 OLLAMA_NUM_PARALLEL 需根据显存情况合理调整,每增加 1 并发请求,额外占用 10~15GB 显存。
- OLLAMA_KEEP_ALIVE=-1 可防止模型 长时间无访问 后被卸载。
nohup ollama serve & # 在后台运行 Ollama
tail -f nohup.out
ps -ef | grep ollama
kill -9 <进程 ID>
ollama pull deepseek-r1:671b
注意:
nohup ollama run deepseek-r1:671b > run.out 2>&1 < /dev/null &
tail -f run.out
nvidia-smi
加载时间:
model load progress 1.00 llama runner started in 3770.15 seconds
ollama run deepseek-r1:671b
输入问题,即可与模型对话。
Ollama 兼容 OpenAI API,本地服务器监听 0.0.0.0:11434,可用 curl 访问:
curl --request POST --url http://127.0.0.1:11434/v1/chat/completions --header "Content-Type: application/json;charset=utf-8" \
--data "{
"model": "deepseek-r1:671b", "messages": [ { "role": "user", "content": "你是什么模型" } ] }"
DeepSeek-R1-671B 的 推理速度 取决于 token 长度 与 并发量。评估方式:
python3 model_stress_test.py
部分测试结果(tokens/s/req):
并发数 | 速率 |
---|---|
1 | 17.05 |
16 | 3.13 |
64 | 0.93 |
128 | 0.85 |
优化方向:
本教程详细介绍了 DeepSeek-R1-671B 的本地部署,包括 环境搭建、下载运行、API 调用及性能优化。如果你希望在本地体验 大模型推理,按本教程操作即可快速上手!DeepSeek大模型一体机部署方案找天下數据专注于IDC行业20多年,经验丰富,咨询电话4--0-0-6-3--8-8-8-0-8 !
天下数据手机站 关于天下数据 联系我们 诚聘英才 付款方式 帮助中心 网站备案 解决方案 域名注册 网站地图
天下数据18年专注海外香港服务器、美国服务器、海外云主机、海外vps主机租用托管以及服务器解决方案-做天下最好的IDC服务商
《中华人民共和国增值电信业务经营许可证》 ISP证:粤ICP备07026347号
朗信天下发展有限公司(控股)深圳市朗玥科技有限公司(运营)联合版权
深圳总部:中国.深圳市南山区深圳国际创新谷6栋B座10层 香港总部:香港上環蘇杭街49-51號建安商業大廈7樓
7×24小时服务热线:4006388808香港服务电话:+852 67031102
本网站的域名注册业务代理北京新网数码信息技术有限公司的产品