近日,groq 火爆出圈。Groq平台采用 Mixtral 8x7B-32k 模型可以实现每秒生成 500 个 tokens,GPT-4 (基于 GPU)一般情况下是每秒40 tokens,更是比 GPT-3.5 快 18 倍,自研LPU(Language Processing Units)推理速度是英伟达 GPU 的10倍。 需要强调的是,Groq 并没有研发新模型,它只是一个模型启动器,运行的是开源模型Mixtral 8x7B-32k 和 Llama 270B-4k。所以,结论一是 groq 超越 ChatGP…