3 分钟解锁NIM：零成本顶级模型 API 接入 OpenClaw/Cherry Studio

NIM（Nvidia Inference Microservices）是 Nvidia 专为生成式 AI 模型推理设计的产品，它为开发者提供了多种使用方式，如以 API 形式开放调用等，通过这些方式，用户可以灵活选择最适合自身需求的 NIM 部署方案，从而充分利用 Nvidia 的 AI 推理能力。说人话就是，老黄留点卡在手上，攒个平台让大家名正言顺地薅羊毛。白嫖 Nvidia NIM 的具体操作过程参考「视频教程」。

build

当前，Nvidia 提供的最新的顶级国产开源模型就包括：

Step-3.5-Flash
Kimi-k2.5
Glm4.7
Minimax-m2.1
Deepseek 系列

当然，还有其他很多模型是普通用户很少用到的，例如像 Openfold3 这样的专用模型。Nvidia 平台上的模型都可以匿名使用，但是如果需要 api ，以接入 openclaw 之类的智能体应用，从而实现“一站式白嫖”，那还是需要注册账户的。

k2.5

注册与验证账户

一个邮箱就可以注册 nvidia ，国内用户建议使用 outlook 或 qq 邮箱，避免邮件验证时需要代理。打开 build.nvidia.com ，点击右上角的『login』，输入你的邮箱，然后点击『Next』。

在账户创建也，进行人机验证、输入并确认密码，勾选同意隐私条款，然后点击『创建账户』。

create account of nvidia cloud

接下来，一般会要求提供一个 Nvidia Cloud（英伟达云）账户名称，随便填一个就行。

account-name

点击『Create Nvidia Cloud Account』，就完成了账号创建过程，页面会自动重定向至首页。我们需要在首页进行账户验证，使用一个国内的 +86 手机号接收短信验证码，通过验证后，将获得无限 API 调用、GPU 沙箱等服务。

verify-account

Nvidia Cloud 不接受同一手机号多开，需要多个账户的，可以尝试家人、朋友的号码。国家/地区的选择可以不理会，如果你吹毛求疵，按照下图顺序先填写 +86 手机号，再选择国家地区即可。如果收不到短信验证码，说明你的手机号已经被用过了，Nvidia Cloud 不允许一号多开。

sms-2

使用 Nvidia Cloud 上的开源模型

如何创建 API Key

完成账户的注册、验证后，我们可以点击右上角账户图标，在展开的菜单中选择『API Keys』。我们可以观察到，Nvidia 给已验证用户不仅提供无限 API 调用，而且调用的 RPM （每分钟请求次数）是 40，看上去不高，实际很大气。国内有些平台写的 RPM 1500，实际连 15 都到不了。

apikey-1

点击右上角的『Create API Key』，为你的 API Key 起个名字，例如我使用 appmark，选择有效期（过期时间），最长 1 年/12 个月。然后点击『Create Key』。

create-key

API Key 很快就可以创建出来，并且会立刻显示且仅显示一次，务必及时拷贝，因为后续不会再显示，避免需要使用时还要删除重建。

copy-key

如何接入 AI 应用

创建并获取自己的 API Key，马上就可以开始白嫖之旅了。Nvidia NIM 的 baseURL 和不同模型的 ModelID 都可以在平台查到。

API baseURL:
https://integrate.api.nvidia.com/v1

部分modelID:
stepfun-ai/step-3.5-flash
moonshotai/kimi-k2.5
z-ai/glm4.7
minimaxai/minimax-m2.1
deepseek-ai/deepseek-v3.2

这样，我们就可以在 cherry studio、openclaw、opencode、kelivo 等应用中接入 nvidia 上的模型了。例如，在我的 kelivo 应用中，我就选择性地将 nvidia nim 上的较新的国产顶级模型接入。

Kelivo 定位是一个 Flutter LLM 聊天客户端，是一款开源的全平台智能聊天工具，支持智能对话、自主 Agent，集成 300+ 主流大模型，可随时自由切换等。

nv-models

实际测试 kimi 2.5 当前几乎不可用，step-3.5-flash 快速响应，首 token 响应延迟不超过 1 秒，如果不需要原生多模态（主要是识图功能）支持，在 openclaw 等 token 消耗大户中完全可以使用免费的 step-3.5-flash。

step-3.5-flash

写在最后

除了日常聊天应用外，国内的顶级开源大模型在编程、写作等热门垂直领域都着力加强，用来当作 Claude 4.5/4.6、Gemini 3 等 SOTA 模型的免费平替，也是勉强够用的。当然，40 的 RPM 上限，也决定了你不可能将这些免费的模型用于密集调用型的 Agent 任务，必然会撞到 429 的墙。

总而言之，Nvidia NIM 就像是老黄为全球开发者摆下的一场“免费盛宴”，只需一个邮箱和手机号就能入场。虽然 40 的 RPM 限制了它在大规模商业生产中的上限，但作为日常办公辅助、代码生成或轻量级 Agent 的动力源，它的响应速度和稳定性（毕竟是英伟达的基建）在免费梯队中堪称“天花板”。在这个模型层出不穷的时代，与其在各家平台间疲于奔命地签到领点数，不如把 Nvidia NIM 收入囊中，让它成为你 AI 工具箱里最稳的一块基石。

更多精彩，敬请关注「老E的博客」！

本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可