Qwen3は、いったんここではqwen3-235b-a22b-thinking-2507
を指します。
すごいポイント その壱 「とにかく安い」
すごいポイント その弐 「地味に早い」
表
モデル | input/1m | Throughput |
---|---|---|
Qwen3 (Chutes) | 0.118 | 76.49 |
Qwen3 (Cerebras) | 0.600 | 784.12 |
Gemini2.5 Flash | 0.300 | 128.78 |
Claude4 Sonnet | 3.000 | 56.92 |
Qwen3-Coder | 0.308 | 35.27 |
※アウトプットは、KiloとかClineにおいて
ベンチマークは…?
大幅な差がない限りそんなにLLMのベンチマークって当てにならないと思っている。