DeepSeek R1正式版app下载最新版是ai领域领先全球的ai模型工具,不仅免费体验,还可以完成智能对话、深度思考、ai搜索等内容功能强大,小编为大家准备了DeepSeek R1正式版的下载安装包,以及如何将DeepSeek R1本地部署的教程附在下方了,有需要的快来下载吧!
官方说明
DeepSeek 官方推出的 AI 助手,免费体验与全球领先 AI 模型的互动交流。
使用一经开源即在海内外引起震动、总参数超过 600B 的 DeepSeek-V3 大模型,多项性能指标对齐海外领先模型,用更快的速度、更加全面强大的功能为你答疑解惑,助力高效美好的生活。
应用特色
1、智能对话
高智商模型,顺滑对话体验。
2、深度思考
先思考后回答,解决推理难题。
3、AI 搜索
全网搜索,信息实时掌握。
4、文件上传
阅读长文档,高效提取信息。
DeepSeek R1本地部署教程
一、网页端使用
最简单就是网页使用。打开网页,或者在应用商店搜索下载App。
官网地址:https://chat.deepseek.com/
【深度思考】,就是R1的推理模型,可以自动思考。
【联网搜索】,就可以搜索到最近最新的内容,特别是查看最新的新闻。
选择文件(右下角),比如说图片、文档等等,让它提取图片或文档中的文字内容。
不过最近不了Deepseek 的服务器访问有点大,经常会显示服务器有问题,使用不了,这个时候我们就需要使用API,不过Deepseek 官方API 暂时也使用不了。
如果你打游戏或者有专门的显卡,可以自己在本地部署。
如果你没有显卡,可以使用第三方的API,速度也特别快,也很强大,虽然和官方的差一点,但也足够使用。
然后使用第三方的客户端连接就可以使用。
二、本地安装Deepseek R1
Ollama本地安装Deepseek R1 模型
Ollama官网:https://ollama.com/
打开官网,然后点击下载,之后安装到本地。
然后打开Ollama 的模型列表,搜索到DeepSeek R1
https://ollama.com/library/deepseek-r1
像我们普通的电脑安装1.5B,7B就可以使用,然后在【右上角的的代码】复制在命令行中运行。
安装需要一段时间,我们等一下就可以等success,就代表安装成功。
输入【ollama list】,就可以查看安装的模型。
设置安装之后,我们只能在命令行中使用会特别的不方便。
我们需要找到一个第三方客户端。
第三方客户端
客户端推荐Chatbox 和Cherry Studio,都很优秀,帅客以Cherry Studio 来演示。
Cherry Studio:https://cherry-ai.com/
Cherry Studio 是一个特别强大的AI 客户端,支持国内外很多模型。
还内置很多提示词,文生图,文档等功能。
按照下面步骤添加即可。
我们在Cherry Studio 客户端配置Ollama 安装过的模型。
默认API:http://localhost:11434/v1
模型名:deepseek-r1:1.5b
第三方API
如果大家的电脑没有GPU,不建议在本地安装,可以使用API。
我们使用【硅基流动】来给大家举例子。
首先就是注册一个账号,注册送14 块,可以用好久。
然后打开【模型广场】,找到Deepseek R1,需要复制对应的模型。
然后再打开API Key 页面,https://cloud.siliconflow.cn/account/ak,创建一个api-key,再打开Cherry Studio。
模型配置好,打开聊天页面,在顶部选择R1 模型就可以使用了,爽歪歪。
免费API
大家想使用免费或者便宜的APP,可以在这个网站上查找,它有各种价格的对比。还有免费,目前来说还有两种免费提供。
https://openrouter.ai/deepseek/deepseek-r1:free
不过其他提供API 的价格还是很感人的,大家可以暂时使用。
不过和官方比,很多还是很贵的;等官方API 恢复,价格快还便宜。
Prompt
https://api-docs.deepseek.com/prompt-library
这个是deepseek 官方的一个提示词网站,它上面包含了很多提示词网站,大家可以参考使用。
可以让它生成提示词,还可以扮演各种角色,格式化输出,代码改写,仿写功能。
使用Deepseek R1,明确【关键词】,提供【上下文】,避免【歧义】,如果有时效性,把联网功能打开。
deepseek r1和v3的区别
1、设计目标
R1版本:是推理优先的模型,侧重于处理复杂的推理任务,为需要深度逻辑分析和问题解决的场景而设计。
V3版本:是通用型的大语言模型,重点在于可扩展性和高效处理,目标是在多种自然语言处理任务中实现高效、灵活的应用。
2、架构与参数
R1版本:基于强化学习优化的架构,有不同规模的蒸馏版本,参数范围在15亿到700亿之间。
V3版本:采用混合专家(MoE)架构,总参数6710亿,每token激活370亿参数。
3、训练方法
R1版本:训练过程注重思维链(CoT, chain of thinking)推理,R1-zero完全使用强化学习训练,R1在此基础上增加了监督微调(SFT, supervised fine tuning)阶段。
V3版本:采用混合精度FP8训练,其训练分为高质量训练、扩展序列长度、进行SFT和知识蒸馏的后训练三个阶段。
4、性能表现
R1版本:在需要逻辑思维的基准测试中表现出色,如在DROP任务中F1分数达到92.2%,在AIME 2024中通过率为79.8%。
V3版本:在数学、多语言任务以及编码任务中表现优秀,如在Cmath中得分90.7%,在Human Eval编码任务中通过率为65.2%。
5、应用场景
R1版本:适用于学术研究、问题解决应用程序和决策支持系统等需要深度推理的任务,也适合作为教育工具,帮助学生进行逻辑思维训练。
V3版本:适用于大规模自然语言处理任务,如对话式AI、多语言翻译和内容生成等,能够为企业提供高效的AI解决方案,满足多领域的应用需求。.
包含的服务
准确翻译:提供准确流畅的翻译服务,帮助用户轻松融入多语言环境。
智能解题:解决理科难题,提供详细的解题思路和步骤,帮助用户抓住重点,深入理解。
文件解读:用户可以将文献书籍、资料报告等上传给DeepSeek,APP会帮助梳理重点,快速理解。
创意写作:根据指令自动生成创意文案,撰写各类文章和报告,快速构建
- 安卓版
- PC版
- IOS版
热门评论
最新评论