NIM(Nvidia Inference Microservices)是 Nvidia 专为生成式 AI 模型推理设计的产品,它为开发者提供了多种使用方式,如以 API 形式开放调用等,通过这些方式,用户可以灵活选择最适合自身需求的 NIM 部署方案,从而充分利用 Nvidia 的 AI 推理能力。说人话就是,老黄留点卡在手上,攒个平台让大家名正言顺地薅羊毛。白嫖 Nvidia NIM 的具体操作过程参考「视频教程」。

当前,Nvidia 提供的最新的顶级国产开源模型就包括:
- Step-3.5-Flash
- Kimi-k2.5
- Glm4.7
- Minimax-m2.1
- Deepseek 系列
当然,还有其他很多模型是普通用户很少用到的,例如像 Openfold3 这样的专用模型。Nvidia 平台上的模型都可以匿名使用,但是如果需要 api ,以接入 openclaw 之类的智能体应用,从而实现“一站式白嫖”,那还是需要注册账户的。

注册与验证账户
一个邮箱就可以注册 nvidia ,国内用户建议使用 outlook 或 qq 邮箱,避免邮件验证时需要代理。打开 build.nvidia.com ,点击右上角的『login』,输入你的邮箱,然后点击『Next』。

在账户创建也,进行人机验证、输入并确认密码,勾选同意隐私条款,然后点击『创建账户』。

接下来,一般会要求提供一个 Nvidia Cloud(英伟达云)账户名称,随便填一个就行。

点击『Create Nvidia Cloud Account』,就完成了账号创建过程,页面会自动重定向至首页。我们需要在首页进行账户验证,使用一个国内的 +86 手机号接收短信验证码,通过验证后,将获得无限 API 调用、GPU 沙箱等服务。

Nvidia Cloud 不接受同一手机号多开,需要多个账户的,可以尝试家人、朋友的号码。国家/地区的选择可以不理会,如果你吹毛求疵,按照下图顺序先填写 +86 手机号,再选择国家地区即可。如果收不到短信验证码,说明你的手机号已经被用过了,Nvidia Cloud 不允许一号多开。

使用 Nvidia Cloud 上的开源模型
如何创建 API Key
完成账户的注册、验证后,我们可以点击右上角账户图标,在展开的菜单中选择『API Keys』。我们可以观察到,Nvidia 给已验证用户不仅提供无限 API 调用,而且调用的 RPM (每分钟请求次数)是 40,看上去不高,实际很大气。国内有些平台写的 RPM 1500,实际连 15 都到不了。

点击右上角的『Create API Key』,为你的 API Key 起个名字,例如我使用 appmark,选择有效期(过期时间),最长 1 年/12 个月。然后点击 『Create Key』。

API Key 很快就可以创建出来,并且会立刻显示且仅显示一次,务必及时拷贝,因为后续不会再显示,避免需要使用时还要删除重建。

如何接入 AI 应用
创建并获取自己的 API Key,马上就可以开始白嫖之旅了。Nvidia NIM 的 baseURL 和不同模型的 ModelID 都可以在平台查到。
API baseURL: https://integrate.api.nvidia.com/v1 部分modelID: stepfun-ai/step-3.5-flash moonshotai/kimi-k2.5 z-ai/glm4.7 minimaxai/minimax-m2.1 deepseek-ai/deepseek-v3.2
这样,我们就可以在 cherry studio、openclaw、opencode、kelivo 等应用中接入 nvidia 上的模型了。例如,在我的 kelivo 应用中,我就选择性地将 nvidia nim 上的较新的国产顶级模型接入。
Kelivo 定位是 一个 Flutter LLM 聊天客户端,是一款开源的全平台智能聊天工具,支持智能对话、自主 Agent,集成 300+ 主流大模型,可随时自由切换等。

实际测试 kimi 2.5 当前几乎不可用,step-3.5-flash 快速响应,首 token 响应延迟不超过 1 秒,如果不需要原生多模态(主要是识图功能)支持,在 openclaw 等 token 消耗大户中完全可以使用免费的 step-3.5-flash。

写在最后
除了日常聊天应用外,国内的顶级开源大模型在编程、写作等热门垂直领域都着力加强,用来当作 Claude 4.5/4.6、Gemini 3 等 SOTA 模型的免费平替,也是勉强够用的。当然,40 的 RPM 上限,也决定了你不可能将这些免费的模型用于密集调用型的 Agent 任务,必然会撞到 429 的墙。
总而言之,Nvidia NIM 就像是老黄为全球开发者摆下的一场“免费盛宴”,只需一个邮箱和手机号就能入场。虽然 40 的 RPM 限制了它在大规模商业生产中的上限,但作为日常办公辅助、代码生成或轻量级 Agent 的动力源,它的响应速度和稳定性(毕竟是英伟达的基建)在免费梯队中堪称“天花板”。在这个模型层出不穷的时代,与其在各家平台间疲于奔命地签到领点数,不如把 Nvidia NIM 收入囊中,让它成为你 AI 工具箱里最稳的一块基石。
更多精彩,敬请关注「老E的博客」!





文章评论