欧博普通人如何免费用上满血版Deepseek
满血版 deepseek-R1, 参数 671B,欧博理论上需要 350G 以上显存/内存才能够部署 FP4 的量化版本。对于家用电脑来说,这是不可能的,即使采用压缩、分层等优化方法,使用最新的 Nvidia RTX5090 显卡(32G 显存),每秒低于 10tokens 的推理输出速度不具备实用价值。普通人能实际部署的仅仅是 Deepseek-R1-distill 蒸馏版模型,这是大家可以真正用得上的版本;模型大小从 1.5B 到 70B 都有。那么问题来了,普通人为什么要部署呢?作者是没有“雅兴”在自己电脑上部署大模型的,而之前采用 tencent cloud studio 部署的最大尺寸就是 14b,距离“白嫖”上 671b 满血版本还差得远。
在线使用方面,deepseek 官方频繁提示“服务器繁忙,请稍后再试”并且停止了 API 充值,普通用户使用 API 可以是解决在线翻译、本地 UI 调用等需求的,好在 Deepseek-R1 是开源的,那我们就来看看哪些地主家有余粮(显卡/计算卡),要求当然是提供全尺寸 R1 模型的推理服务和一定的免费 API 额度。
NvidiaNvidia 要是没余粮了,那其他家就更不可能有余粮了。无需注册,打开「Nvidia NIM Deepseek-R1」就可以在网页端直接使用上满血版的 deepseek r1 推理服务了,「Nvidia NIM Deepseek-R1」是当下最稳定、响应最快的平台,没有之一。目前,匿名用户使用 deepseek r1 会存在排队现象,但一般不会超时。本文示例在不进行注册登录的前提下,对话排序为第 149(line 149),发送问题到实际输出显示的等待时间约 10 秒,老黄家的余粮一定是最充足的。
作为测试对比,在 deepseek 官方 api 调用出现错误的情况下,匿名状态在网页端翻译本文标题,没有任何排队等待,使用下文的硅基流动 api 也很慢,某为不是纯国产不受任何制约吗?舍不得堆量!登陆后同样使用 nvidia nim 提供的 api 也没有报错,并且响应输出快速。
Nvidia 提供免费免注册的在线全尺寸 deepseek r1 推理服务的同时,也可以注册 nvidia nim 账号以使用 api,注册用户赠送 5000 点积分。在右侧 api 调用代码区,可以直接使用给出的 base_url(https://integrate.api.nvidia.com/v1/chat/completions),api_key 则可以通过点击右上方的『Get API Key』进行注册并创建。
点击页面右上角的『Login』或右侧的『Get API Key』,都可以打开注册界面。输入电子邮箱开始注册,注册过程参考「视频分享」。
完成注册后,将获得 1000 点积分,使用企业邮箱、额外填写企业信息,进一步获得 4000 点积分,也就是说,普通用户通常可以获得 5000 点积分。企业信息的角色、行业等都可以随意填写,但建议尽量保证企业名称的真实性。填写完成之后点击『Continue』就可以完成填报,会自动进行验证、积分增加和页面重定向。
接下来,就可以将创建 API key 并在相关应用中使用。本文以沉浸式翻译为例,打开设置后,选择『翻译服务』,不要下拉选择 deepseek,而应该点击顶部的添加OpenAI兼容服务。
在自定义 AI 设置页面,关键信息如下:
API 接口地址(Base_url):https://integrate.api.nvidia.com/v1/chat/completions
API KEY:你的 api key
模型(Model name):deepseek-ai/deepseek-r1
填写完毕之后,可点击页面顶部右侧的『点此验证服务』进行验证,填写无误的情况下,都会验证成功。接下来,就可以无视 deepseek 官方抽疯,继续爽玩全尺寸 deepseek-r1 了。
硅基流动硅基流动是一家中国 AI 公司,自 deepseek 2.5 时代就广为人知,提供有平价 API 接入,并且一直有注册送 2000万 tokens 的活动,额外还有邀请推广机制(邀请新用户注册送 2000 万 tokens)。硅基流动和华为合作,由华为昇腾提供算力支持提供满血版的 Deepseek-R1 推理服务。
硅基流动采用邀请推广方式,邀请者和受邀请用户都可以获赠 2000 万 Tokens。有需要的可以点击作者的邀请链接。
💎「硅基流动赠送 2000 tokens 的邀请链接」💎
新用户注册后,即进入首页的模型广场,顶部的 deepseek r1/v3 都是全量 671b 模型,任选其一,直接点击即开进入对话模式。
点开左侧『余额充值』即可查看到赠送的等值 14 元赠金,在『API 密钥』页面可以创建 API Key,用于翻译、编程等工具的远程调用。
在线体验也是需要消耗 token 的,不过硅基流动一直是平价的,并且可以观察到推理过程是不计费的。
硅基流动的 API 接入可参考官方文档,这里不做赘述。
其他
其他仅提供了非独家 API 接入的平台这里不做详细介绍,为什么?因为所有人都可以接入某个平台,并不需要持有或独占算力。国内可直连访问、提供 deepseek r1 推理服务的平台还包括以下机构:
国外还有一些提供免费全尺寸 deepseek r1 推理服务和 api 接入的平台,考虑到可访问性,本文不做列举,后续在进行介绍和演示。