神秘大象登顶OpenRouter热榜：免费100B模型，挺顺手的

鸿渐说:来吧，展示

比起之前从0开始重构用的模型，个人感觉还行。可能第一次需要对比hermes源码以及moonbit源码，这次只需要阅读moonbit重构后的hermes。有兴趣的可以自己去测试下，是否能带来惊艳的感受

一、大象来了

4月13日深夜，OpenRouter平台悄然上线了一款名为 Elephant Alpha（大象） 的模型。不到48小时，它就冲上了OpenRouter热榜（Trending）第一名，调用量突破 1850亿token，日调用量排名全球第八。更关键的是—— 完全免费 。

参数	规格
参数量	100B（1000亿）
上下文窗口	256K
最大输出	32K
价格	$0/M 输入 + $0/M 输出
速率限制	100次/分钟

支持函数调用、结构化输出、提示缓存、工具使用——功能集比大多数免费模型更完整。

二、为什么火了？

1. 极致的速度

67 token/s 的平均输出速度，首token延迟仅 0.89秒。有开发者感叹："这是我用过最快的模型，让我想起了Grok Fast 1的体验。"

2. 高token效率

同样的任务，Elephant的token消耗远少于其他模型，基本和 GPT-5.4 Mini 持平。这对Agent场景尤其重要——Agent工作流是多轮循环过程，每一轮都消耗token。高效率意味着有限的上下文和预算内可以执行更多轮操作。

3. 指令遵循满分

在AI Benchy测试中，Elephant拿到了 指令遵循满分 ，一致性得分9.6——意味着它"很听话"，结果波动最小。

三、实测表现如何？

📝 编程场景：

前端开发：1分钟完成一个带明暗模式切换、响应式设计的网站。
项目级应用：打造支付软件原型，能跑通但不够完善。

📚 长文本处理：

面对几百页的招股书，用12万token完成解读，耗时几十秒，数据准确、结论清晰。

🤖 Agent任务：

规划泰国7日游+生成攻略网站：能自主调用搜索工具，规划合理，覆盖重要景点。

四、和同类模型对比

模型	平均响应时间	Token效率	指令遵循
Elephant	1.27秒	⭐⭐⭐⭐⭐	9.6
Qwen3.5	31.38秒	⭐⭐	8.1
Nemotron-3	5.2秒	⭐⭐⭐	6.7

Elephant走的是 极致轻量路线 ——把"快"和"低成本"做成了核心卖点。

五、谁造的？没人知道

社区猜测纷纷：智谱GLM-5.1-Air、MiniMax M2.8、Kimi 或 DeepSeek Lite V4... 甚至可能是海外新实验室的产物。官方始终保持沉默。

六、适合与不适合场景

✅ 推荐使用

🔹 快速代码补全与调试
🔹 大规模文档处理
🔹 轻量级Agent交互
🔹 原型开发与快速迭代

❌ 不推荐

🔹 处理敏感/私有数据
🔹 复杂多步推理任务
🔹 项目级完整应用开发
🔹 需要深度思考的决策

七、怎么用？

通过OpenRouter API调用，完全兼容OpenAI SDK：

curl https://openrouter.ai/api/v1/chat/completions   -H "Content-Type: application/json"   -H "Authorization: Bearer $OPENROUTER_API_KEY"   -d '{      "model": "openrouter/elephant-alpha",      "messages": [{"role": "user", "content": "Hello!"}]   }'

写在最后： Elephant的出现代表了实用主义的回归。不卷参数，只做“快、省、好用”。
有时候，够用就好。