截至目前(2025年),DeepSeek 主要定位为大语言模型(LLM),其核心能力集中在文本生成、代码编写、问答对话等自然语言处理任务上。
官方并未提供内置的录音转文字(语音识别 / ASR)功能。这意味着 DeepSeek 本身不能直接接收音频输入并将其转换为文本。
不过,你可以通过以下方式实现“录音转文字 + DeepSeek 处理”的组合流程:
- 使用第三方语音识别工具(如讯飞听见、百度语音、Whisper 等)将录音转为文字;
- 将生成的文字粘贴到 DeepSeek 中进行总结、翻译、润色或分析。
这种“语音识别 + LLM”协同模式在实际应用中非常高效,也是当前主流 AI 工作流的常见做法。
如果你希望 DeepSeek 未来支持端到端的语音输入,可关注其官方更新或社区动态。