Qwen3は、いったんここではqwen3-235b-a22b-thinking-2507を指します。
すごいポイント その壱 「とにかく安い」
すごいポイント その弐 「地味に早い」
表
| モデル | input/1m | Throughput |
|---|---|---|
| Qwen3 (Chutes) | 0.118 | 76.49 |
| Qwen3 (Cerebras) | 0.600 | 784.12 |
| Gemini2.5 Flash | 0.300 | 128.78 |
| Claude4 Sonnet | 3.000 | 56.92 |
| Qwen3-Coder | 0.308 | 35.27 |
※アウトプットは、KiloとかClineにおいて
ベンチマークは…?
大幅な差がない限りそんなにLLMのベンチマークって当てにならないと思っている。