DeepSeek 是由深度求索(DeepSeek)公司推出的一系列大语言模型(LLM),旨在通过先进的人工智能技术,为用户提供高质量的文本生成、问答、编程辅助、内容创作等能力。
DeepSeek 能够理解并生成自然语言和代码,支持多轮对话、逻辑推理、数学计算、文档摘要、翻译等多种任务。它适用于开发者、学生、内容创作者以及企业用户。
DeepSeek 基于 Transformer 架构,采用大规模预训练与指令微调,并结合人类反馈强化学习(RLHF),确保输出内容既准确又符合人类偏好。部分版本支持超长上下文(如 128K tokens),适合处理长文档。