Qwen3は、いったんここではqwen3-235b-a22b-thinking-2507を指します。

すごいポイント その壱 「とにかく安い」

すごいポイント その弐 「地味に早い」

モデルinput/1mThroughput
Qwen3 (Chutes)0.11876.49
Qwen3 (Cerebras)0.600784.12
Gemini2.5 Flash0.300128.78
Claude4 Sonnet3.00056.92
Qwen3-Coder0.30835.27

※アウトプットは、KiloとかClineにおいて

ベンチマークは…?

大幅な差がない限りそんなにLLMのベンチマークって当てにならないと思っている。