DeepSeek R18 是 DeepSeek 系列中的高性能语言模型版本,适用于需要高精度推理与生成能力的场景。以下为推荐的设定模板,可用于本地部署、API 调用或微调任务。
基础配置模板(JSON 格式)
{
"model": "deepseek-r18",
"temperature": 0.7,
"top_p": 0.9,
"max_tokens": 2048,
"presence_penalty": 0.5,
"frequency_penalty": 0.3,
"stop": ["\n\n", "用户:", "助手:"]
}
使用建议
- temperature:控制输出随机性,值越低越确定,适合事实性问答;值越高更具创造性。
- max_tokens:根据上下文长度合理设置,避免超出模型窗口限制(通常为 128K tokens)。
- stop sequences:可自定义对话结束符,提升多轮交互稳定性。
更多技术细节请参考官方文档或社区资源。