2025年2月9日,阿里云宣布在其百炼平台上推出DeepSeek大模型系列,包括DeepSeek-V3、DeepSeek-R1及其蒸馏版本。这一举措不仅标志着AI技术的又一次飞跃,也为广大用户提供了更强大、更便捷的AI工具。无论你是开发者、企业还是普通用户,DeepSeek都能为你带来前所未有的体验。
DeepSeek模型概览:六大模型,总有一款适合你
阿里云的PAI(人工智能平台)支持DeepSeek-V3、DeepSeek-R1及其蒸馏版本的云部署。目前共有六款全尺寸AI模型可供选择:
模型名称 | 参数量 | 激活参数量 | 主要功能 | 价格(元/百万token) |
DeepSeek-R1 | 671B | 37B | 数学、代码、自然语言任务 | 4.0 |
DeepSeek-R1-Distill-Qwen-32B | 32B | – | 轻量级推理 | 1.0 |
DeepSeek-R1-Distill-Qwen-14B | 14B | – | 轻量级推理 | 0.7 |
DeepSeek-R1-Distill-Qwen-7B | 7B | – | 轻量级推理 | 0.5 |
DeepSeek-R1-Distill-Qwen-1.5B | 1.5B | – | 轻量级推理(限时免费) | 免费 |
DeepSeek-V3 | 671B | 37B | 长文本、代码、数学、百科、中文任务 | 4.0 |
免费福利:百万token等你来拿
阿里云为所有用户提供了丰厚的免费福利:每位用户可免费获得100万token,分别用于DeepSeek-R1和DeepSeek-V3模型。这意味着你可以免费体验这些强大的AI模型,无需任何前期投入。
价格优势:最低至0.5元/百万token
DeepSeek系列模型不仅在性能上表现出色,价格也非常亲民。其中,DeepSeek-R1-Distill-Qwen-7B的输入价格仅为0.5元/百万token,是目前市场上最低的价格。而最小的DeepSeek-R1-Distill-Qwen-1.5B模型更是限时免费,适合预算有限的用户。
功能亮点:从数学到中文,无所不能
- DeepSeek-R1:拥有671B参数,激活37B,采用强化学习技术,显著提升了在数学、代码和自然语言任务中的推理能力。
- DeepSeek-V3:同样是671B参数,激活37B,预训练数据量高达14.8T token,在长文本、代码、数学、百科和中文任务中表现优异。
使用便捷:无需编程,轻松上手
阿里云平台提供了从模型训练到部署和推理的全流程支持,用户无需编写代码即可轻松实现。无论你是AI新手还是资深开发者,都能快速上手。
API调用:灵活高效
百炼平台提供了调用DeepSeek模型的API接口。DeepSeek-R1和DeepSeek-V3各有100万免费token,部分蒸馏模型还提供限时免费试用,方便用户进行测试和开发。
功能限制:部分功能暂不支持
需要注意的是,DeepSeek-R1目前不支持Function Call和JSON Output功能,而DeepSeek-V3也不支持Function Call。如果你需要这些功能,可能需要等待未来的更新。
结语:AI的未来,由你掌控
阿里云DeepSeek系列的推出,不仅为AI技术的发展注入了新的活力,也为广大用户提供了更多选择和可能性。无论你是开发者、企业还是普通用户,都能从中找到适合自己的AI解决方案。快来体验DeepSeek,开启你的AI新纪元吧!
互动环节:你对DeepSeek系列模型有什么疑问或需求?欢迎在评论区留言,我们将为你提供更详细的解答和个性化建议。