个人简介
DeepSeek 创始人是中国人工智能领域的重要推动者之一,拥有深厚的学术背景和丰富的产业经验。他致力于将前沿的大模型技术应用于实际场景,提升人机交互效率与智能搜索体验。
教育背景
- 清华大学,计算机科学与技术,博士
- 北京大学,信息科学技术学院,学士
职业经历
- DeepSeek(深度求索)创始人兼 CEO(2023年至今)
主导研发了多款开源与闭源大语言模型,推动中文大模型生态发展。 - 某头部科技公司 AI 实验室高级研究员(2019–2023)
专注于自然语言处理、信息检索与生成式 AI 技术。 - 国际顶级会议(如 NeurIPS、ICML、ACL)论文作者
技术贡献
作为 DeepSeek 技术架构的核心设计者,他提出了多项创新机制,包括多头潜在注意力(MLA)、多Token预测(MTP)等,显著提升了模型在长文本理解与生成任务中的表现。
愿景与使命
“让每个人都能平等地使用先进的人工智能工具。” —— 这是 DeepSeek 创始人始终秉持的理念。他希望通过开源与开放协作,构建一个更智能、更公平的 AI 未来。