火山引擎是字节跳动旗下的云服务平台。前些天,火山引擎也上线了 DeepSeek-r1、v3 模型(包括满血版和一些蒸馏版),并且还向用户赠送了 50 万 Token 的免费额度。用完后“续杯”的价格也不贵- 目前 DeepSeek-R1 满血版仍然半价优惠-每 100 万 Token 输入 2 元、输出 8 元。更重要的是,火山引擎不仅将模型的初始吞吐量(TPM)提升至500万,还成功将推理延迟压缩至 30 毫秒,极大增强了用户体验与应用的灵活性。在官网动辄“服务器繁忙,请稍后重试”以及其他商家对话卡顿甚至失败的…