Qwen3-Coderはクラウドで使うべきか|料金・コーディング精度・データ取扱いをClaude・GLM・DeepSeekと比較

Qwen3-Coder cloud coding AI model, abstract circuit data-flow nodes, teal cyan gradient, minimal flat geometric, technical, neutral, no character, no textに関する記事のアイキャッチ画像 - Qwen3-Coderはクラウドで使うべきか AIエージェント

Alibaba(Qwen チーム)のQwen3-Coderは、コーディングに特化したオープンウェイトのモデル群です。2025年7月に旗艦のQwen3-Coder-480B-A35B(総4,800億・有効350億パラメータのMoE)が公開され、2026年2月にはエージェント用途と手元実行を狙ったQwen3-Coder-Nextが加わりました。いずれもApache 2.0で配布され、商用利用の自由度が高い。クラウドでは Alibaba Cloud Model Studio(DashScope)から qwen3-coder-nextqwen3-coder-plusqwen3-coder-flash をOpenAI互換APIで呼べるため、手元のハードウェアに関係なく使えます。GLM-5.2・DeepSeek V4・Kimi K2.7-Codeと並ぶ、オープンなコーディングモデルの一角です。

本記事では料金・コーディング精度・速度・使い勝手の4点に、判断を分けやすい「データの扱い」を加えて、Qwen3-CoderをClaude(Anthropic)・OpenAI Codexで使えるGPT-5.5、そして同じオープン勢のGLM-5.2・DeepSeek V4・Kimi K2.7-Codeと並べて整理します。数値は2026年時点で各提供元・第三者が公表している値で、筆者環境での再計測ではありません。精度の出どころには癖があります。旗艦の480Bは公開時に定性的な訴求が中心でしたが、新顔のQwen3-Coder-Nextは技術報告で数値と比較表を公開しています。ただしその比較相手は当時のモデル版で、現行のフロンティアと同条件ではない点を含め、あとで精度の節で扱います。

Qwen3-Coderとは:モデル群とNext

Qwen3-Coderは単一のモデルではなく、規模違いの系列です。手元実行からクラウドまで、用途に応じて選べるのが特徴になっています。主な顔ぶれは次のとおりです。

  • Qwen3-Coder-480B-A35B:2025年7月公開の旗艦オープンウェイト。総4,800億・有効350億のMoEで、文脈は256Kネイティブ、YaRNで最大100万トークンまで拡張できます。DashScopeの最大品質向けAPIモデル qwen3-coder-plus は、この480B-A35Bそのものとは別枠・別価格で提供されます。
  • Qwen3-Coder-Next:2026年2月公開の新顔で、総800億・有効30億(80A3)のMoE。コーディングエージェントとローカル開発に振った設計です。Qwen技術報告のSWE-bench VerifiedはSWE-Agent環境で70.6、OpenHands環境で71.3と、オープン勢でも上位に入ります。
  • Qwen3-Coder-30B-A3B:総300億・有効30億の小型MoE。単体GPUでも動かしやすく、ローカル実行の入口になります。SWE-bench Verifiedは公開リーダーボード(OpenHands環境)で約51(50〜52、評価条件で変動)と、大型系列より下がるぶん手元で動く現実性を取った位置づけです。姉妹サイトの実測記事が対象にしているのもこの30B系です。

ライセンスはApache 2.0で、Qwen3ファミリ全体が同じく開放的です。クラウドで使う場合は、DashScopeから qwen3-coder-nextqwen3-coder-plusqwen3-coder-flash をOpenAI互換APIで呼べます。Alibaba公式は通常用途に qwen3-coder-next(品質・速度・コストのバランス型)を推奨し、最大品質が要るときは qwen3-coder-plus、とにかく安く量をこなすなら qwen3-coder-flash、という整理です。

クラウドでQwen3-Coderを使う経路

Qwen3-Coderをクラウドから使う経路は、大きく4つに分かれます。

  • 従量課金のDashScope API:Alibaba Cloud Model Studioで発行したキーで、トークン量に応じて支払う方式です。OpenAI互換のエンドポイントを備えており、接続先(base URL)を https://dashscope-intl.aliyuncs.com/compatible-mode/v1、モデル名を qwen3-coder-next(公式推奨)・qwen3-coder-plusqwen3-coder-flash のいずれかにするだけで呼べます。
  • Claude Codeなどからの接続:Qwen3-CoderはClaude Code連携が公式に案内されており、ClineやQwen Code(Gemini CLIを土台にした公式CLI)からも利用できます。Claude Code向けの正確な接続先や設定は版で変わり得るため、Alibaba Cloud公式のドキュメントで現行の値を確認してください。
  • 他社配信:OpenRouterなどの仲介経由でも呼べます。オープンウェイトのQwen3-Coder-Nextは、上記のDashScope公式APIに加えて、こうした配信からも呼べます。
  • オープンウェイトの自己ホスト:480B・Next・30Bの重みがHugging Faceで公開されており、自前のハードウェアでも動かせます。必要メモリは規模で大きく変わり、30B系なら単体GPUでも現実的です。

OpenAI互換なので、既存のクライアントは数行の変更で済みます。たとえばPythonのOpenAI SDKなら、接続先とモデル名を差し替えるだけです。

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_DASHSCOPE_API_KEY",
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)
resp = client.chat.completions.create(
    model="qwen3-coder-next",
    messages=[{"role": "user", "content": "二分探索をPythonで実装して"}],
)
print(resp.choices[0].message.content)

上は Alibaba Cloud 公式ドキュメントが示すOpenAI互換の呼び出し方です(実行にはDashScopeのAPIキーが要ります)。キーと接続先を環境変数にしておけば、Claude CodeやClineといったツールからも同じモデルを指せます。

料金:文脈長で段階が変わる

Qwen3-Coderの料金は、Alibaba Cloud Model Studio(DashScope)の従量API価格です。ここで押さえておきたいのは、各モデルとも「文脈長で段階課金」になっている点と、公式が通常用途に推奨する qwen3-coder-next が低価格帯に置かれている点です。短い文脈なら安く、長い文脈ほど単価が上がる設計で、フラットな料金のモデルとは読み方が変わります。以下は国際版(シンガポール)エンドポイントの公表値です。料金は改定され得るため、導入前に公式の最新価格を確認してください。

モデル / プラン 入力(/100万トークン) 出力(/100万トークン) 備考(2026年時点・国際版/シンガポールの公表値)
qwen3-coder-next(〜32K・公式推奨) 0.30ドル 1.50ドル 通常用途の推奨モデル。32K超は0.50/2.50→0.80/4.00へ
qwen3-coder-flash(〜32K) 0.30ドル 1.50ドル 軽量・低価格帯。256K超では1.60/9.60ドルへ。キャッシュ命中で入力は標準の10〜20%
qwen3-coder-plus(〜32K) 1.00ドル 5.00ドル 最大品質向け。段階課金の最下段
qwen3-coder-plus(256K超〜1M) 6.00ドル 60.00ドル 最上段。間に1.80/9.00・3.00/15.00の段がある
GLM-5.2 / Kimi K2.7-Code(参考) 1.40 / 0.95ドル 4.40 / 4.00ドル 同じオープン勢。いずれもフラット
Claude Opus 4.8 / GPT-5.5(参考) 5.00 / 5.00ドル 25.00 / 30.00ドル 商用最上位

いずれも各社公式の公表値(2026年6月20日時点・国際版/短文脈基準。GPT-5.5はStandard基準で、Batch/Flexは下がる)。qwen3-coder-next/plus/flashとも文脈長で段階的に変わります。

表で目を引くのは、推奨モデルの qwen3-coder-next が短文脈で出力1.50ドルと、plusの5.00ドルより安い点です。plusは最大品質が要るときの選択肢で、その出力5.00ドルはClaude Opus 4.8の25ドルの5分の1、GLM-5.2(4.40ドル)やKimi(4.00ドル)と同じ帯に収まります。なお、nextやflashの出力1.50ドルも最安というわけではなく、たとえばDeepSeek V4 Flash(出力0.28ドル)のほうが安い水準です。注意したいのは段階課金で、リポジトリ全体を読ませるような長い文脈(256K超)まで伸ばすと、qwen3-coder-plusの出力は60ドルへ跳ね上がります。長文脈を多用するなら、flashに寄せるか、フラット料金のGLM-5.2・Kimiと総額を比べたほうが読みやすい。

もう一点、エンドポイント(デプロイモード)で価格が変わります。上表は国際版(シンガポール)の値で、モデルによっては、Global版(米国・ドイツ)や中国本土(北京)版に国際版より安い段があります。ただし差はモデルと文脈長で変わり、何より使うモードでデータの保存地域が変わるため、安さだけでは選べません(後述のデータの扱いと合わせて判断します)。なお、qwen3-coder-plusとqwen3-coder-flashはコンテキストキャッシュに対応し、キャッシュ命中時の入力は標準の10〜20%程度に下がります(同じ文脈を繰り返す用途では実コストを圧縮できます)。qwen3-coder-nextのキャッシュ条件は導入時点の公式仕様で確認してください。

出力トークン単価の比較(100万トークンあたり・2026年6月20日時点・短文脈基準) 出力100万トークンあたりの公表料金(2026年6月20日時点・国際版/シンガポール・短文脈基準)。qwen3-coder-next(公式推奨)1.50ドル、qwen3-coder-flash 1.50ドル、GLM-5.2 4.40ドル、qwen3-coder-plus 5.00ドル(32K以下の最下段、256K超では60ドル)、Claude Opus 4.8 25ドル、GPT-5.5 30ドル。Qwenの推奨モデルは低価格帯で、短文脈ならClaudeやGPTの数分の1。 出力トークン単価の比較(/100万トークン・2026年6月20日時点・短文脈基準) qwen3-coder-next(推奨) $1.50 qwen3-coder-flash $1.50 GLM-5.2 $4.40 qwen3-coder-plus $5.00* Claude Opus 4.8 $25 GPT-5.5 $30
出力トークン単価の比較(100万トークンあたり・2026年6月20日時点・国際版/短文脈基準)。公式推奨のqwen3-coder-nextは最下段の低価格帯。*plusは32K以下で、256K超では60ドルまで段階的に上がります。

コーディング精度:出どころを分けて読む

精度の読み方は、系列で出どころが違います。旗艦の480Bは公開時に「オープンモデルで最先端」「Claude Sonnet 4に匹敵」といった定性的な訴求が中心で、KimiやDeepSeekのような横並びの公式比較表とは勝手が異なりました。一方、新顔のQwen3-Coder-Nextは技術報告でSWE-Bench Verifiedなどの数値と比較表を公開しています。ただしその比較相手はClaude-Opus-4.5・Sonnet-4.5・GLM-4.7・DeepSeek-V3.2・Kimi-K2.5など当時の版で、現行のClaude Opus 4.8やGPT-5.5と同条件の比較ではありません。小型の30Bは公開リーダーボード(OpenHands環境)の値で見ます。以下は出どころを分けた整理です。

モデル SWE-bench Verified 出所・備考
Qwen3-Coder-Next(2026年2月) 70.6(SWE-Agent)/71.3(OpenHands) Qwen技術報告。比較相手は当時の版(Opus-4.5/Sonnet-4.5/GLM-4.7等)
Qwen3-Coder-30B-A3B(小型) 約51(OpenHands) 公開リーダーボード。50〜52で評価条件により変動
Qwen3-Coder-480B-A35B(旗艦・2025年7月) 公式は定性(オープン首位級) 公開時点で「Claude Sonnet 4に匹敵」と公称

Nextの数値はQwen技術報告(2026年時点)、30Bは公開リーダーボード(OpenHands)。比較相手の版・測定環境(scaffold)で値は動きます。

SWE-bench Verifiedは、実在のリポジトリに対して複数ファイルにまたがる修正を最後までやり切れるかを測るベンチマークで、エージェント的なコーディング力の目安になります。Qwen3-Coder-NextのSWE-Agent 70.6・OpenHands 71.3は、オープン勢のなかでも上位の数字です。ただし、その技術報告の比較相手は当時の版(Opus-4.5やSonnet-4.5など)で、現行のClaude Opus 4.8やGPT-5.5との同条件比較ではないため、点差をそのまま現在の優劣と読むのは避けたほうがよい。小型の30Bは約51と大型系列から大きく下がり、精度より「手元で動く」を取る選択になります。確実な最高精度や検証済みの実績が要る用途では、Claude Opus 4.8やGPT-5.5を優先候補にするのが無難、という位置づけは他のオープン勢と変わりません。

速度:系列で差が大きい

出力速度(毎秒のトークン生成数)は、Qwen3-Coderの中でも系列で開きがあります。横断計測のArtificial Analysisの値(2026年時点・提供元で変動)で並べると、傾向がつかめます。

モデル 出力速度(トークン/秒) 備考
Qwen3-Coder-30B-A3B 約100 Alibaba Cloud計測。小型ゆえ速い側
Qwen3-Coder-Next 約60台(提供元で幅) 第三者計測で数十〜100台まで変動。応答開始まで約2秒
Qwen3-Coder-480B-A35B / qwen3-coder-plus 約60台 大型系。規模が大きいぶん控えめ

Artificial Analysisの公表計測(2026年時点、30BはAlibaba Cloud基準)。提供プロバイダ・混雑・設定で変動します。

ここが選び分けの効きどころです。クラウドの qwen3-coder-plus や最新のQwen3-Coder-Next は中位で(第三者計測では提供元により数十〜100 tok/s台と幅がある)、GLM-5.2の速い提供元(150〜220 tok/s級)には及びません。瞬間的な体感速度を最優先するなら、GLM-5.2やプロバイダ選択に分があります。一方、小型の30Bは約100 tok/s(Alibaba Cloud計測)と速い側で、単体GPUでの手元実行とあわせて軽快に回せます。クラウドの通常用途なら公式推奨のnext、最大品質が要る高難度タスクならplus、速度や手元実行を重視するなら30B系を配信や自己ホストで、という住み分けが現実的です。乗り換えの価値は、瞬間速度よりも「Apache 2.0の開放性」「系列の選択肢の広さ」「クラウドとローカルの行き来」に出るモデルだと捉えるのが妥当でしょう。

使い勝手:OpenAI互換でそのまま挿す

Qwen3-Coderの扱いやすさは、OpenAI互換のエンドポイントにあります。前掲のとおり接続先とモデル名を差し替えるだけで、既存のOpenAI SDKやClaude Code、Cline、OpenCodeといったツールから呼べます。Alibabaは公式CLIのQwen Code(Gemini CLIを土台に開発)も提供しており、ターミナルからエージェント的に使う入口も用意されています。新しいツールを覚え直さずに、いつものワークフローのモデルだけをQwen3-Coderへ切り替える、という導入の仕方が取りやすい。すでにClaude Codeを使っているなら、接続先の切り替えで移れます。Clineのようなツールは接続先を替えれば、ローカルLLM(Ollama連携)にもクラウドのQwen3-Coderにも向けられます。

クラウド経由で使うかぎり、モデルの計算はAlibaba側で行われるため、手元のマシンに推論用の大型GPUは要りません。必要なのはエディタやCLIを動かせる程度の環境で、これはClaude Codeのようなクラウド型ツールを使うときの推奨スペックと同じです。ただし手元でビルドやテスト、コンテナ実行を伴う場合は、通常の開発に必要なCPU・メモリ・ディスク性能は要ります。どの程度のPCで快適かは、姉妹サイトのClaude Code推奨スペック|GPU不要・ノートPCで快適に使える環境を解説がそのまま目安になります。コーディングツール自体の選び方は、AIコーディングツールはどれを選ぶか|用途別比較も参考になります。

クラウドで使う前に押さえたいデータの扱い

Qwen3-Coderを業務で使うとき、価格や速度以上に判断を分けるのがデータの扱いです。提供元のAlibaba Cloud Model Studioは、公開情報上、顧客がAPIで送ったデータをモデルの学習には使わないと明記し、通信は暗号化されるとしています。この「学習に使わない」という明示は、機密コードを扱ううえで安心材料になります。Model Studioはデプロイモードでエンドポイントとデータ保存地域が分かれる設計です。International版はシンガポール、Global版は米国(バージニア)またはドイツ(フランクフルト)、EU版はドイツ(フランクフルト)、Chinese Mainland版は北京が、それぞれデータの保存先です。Globalは推論リソースがグローバルに動的配置され、EUは推論もEU内に限定されます。DashScopeの国際版ドキュメントはシンガポールを前提にしています。

注意したいのは、前述のとおりGlobal版や中国本土(北京)版には国際版より安い段がある一方で、そちらを使うとデータの保存地域や適用される規約が変わる点です。とくに北京版を選ぶと、データの処理地域が中国本土になります。機密性の高いコードを扱うなら、International版(シンガポール)など要件に合うモードのエンドポイントを使い、保持期間や委託先・データ所在が自社の要件に合うかをAlibaba Cloudの規約・DPAで確認するのが安全です。「Alibabaだから一律に中国処理」と決めつけるのも、「学習に使わないから無条件に安全」と決めつけるのも、どちらも正確ではありません。使うモードと契約条件しだい、というのが実態に近い。

同じオープン勢で比べると、GLM-5.2のz.aiやKimiのMoonshot(いずれも国際版はシンガポール法人)も近い立て付けで、DeepSeekは公開ポリシー上データを中華人民共和国で処理するとしています。Qwen(国際版)は「学習に使わない」の明示がある点でむしろ扱いやすい側ですが、安いGlobal版・北京版の存在を含めて、モードの選択がデータの所在を左右します。機密性が最優先なら、クラウドAPIをそのまま使うより、オープンウェイトをローカルで動かす選択肢も現実的です。

ローカルとクラウド、どちらで動かすか

Qwen3-CoderはApache 2.0のオープンウェイトなので、自己ホストの自由度が高いのも持ち味です。旗艦の480Bや最新のNextは大規模ですが、小型のQwen3-Coder-30B-A3Bは単体GPUでも現実的に動きます。実際にどのクラスのマシンでどれだけの速度が出るかは、姉妹サイトのqwen3-coder:30bをローカルで動かす実測|最速級のコーディングLLMと用途別の選び方が、まさにこの30B系を実測しています。クラウド(借りる)とローカル(持つ)の損益分岐を考えるなら、この実測値が出発点になります。さらに大きい系列まで含めた必要メモリの早見は、巨大オープンモデルは手元で動くのか比較|必要メモリ早見表が目安です。従量料金と機材費・電気代の損益分岐は、トークン量・利用時間・GPU価格で大きく変わるため、本記事では定量の試算までは踏み込みません。

GLM・DeepSeek・Kimi、Claudeとどう使い分けるか

Qwen3-Coderは、同じオープン勢のGLM-5.2・DeepSeek V4・Kimi K2.7-Codeとしばしば並べられます。大づかみには、Qwen3-Coderは「Apache 2.0の開放性+系列の選択肢(クラウドのnext・plus・flash/ローカル向きの小型30B)+学習非利用の明示」が持ち味で、安い従量とローカル実行のしやすさを両取りしやすいモデルです。価格は、公式推奨のnextやflashが低価格帯(短文脈で出力1.50ドル)、plusは短文脈ならGLM・Kimiと同帯、最安はDeepSeek V4 Flash側、長文脈では段階課金で上がる、という性格になります。

それぞれの料金・精度・速度・使い分けは、GLM-5.2はクラウドで使うべきかDeepSeek V4はクラウドで使うべきかKimi K2.7-Codeはクラウドで使うべきかで詳しく扱っています。商用の最上位(Claude Opus 4.8やGPT-5.5)と比べると、Qwenは価格と開放性で優位ですが、確実な最高精度や検証済みの実績が要る用途では上位モデルが安全、という整理になります。

どんな人に向くか

  • 開放的なライセンスで自由に使いたい人:Apache 2.0で配布され、クラウドでも自己ホストでも縛りが少ない。商用利用や改変の自由度を重視するなら有力です。
  • クラウドとローカルを行き来したい人:小型30Bは単体GPUで動き、クラウドのnext/plus/flashと同じ系列。検証はローカル、量産はクラウド、と使い分けやすい。
  • コストを抑えて量をこなしたい人:next/flashの出力1.50ドルは低価格帯。ただし長文脈を多用するならplusの段階課金に注意し、より安いDeepSeek系やフラット料金のモデルと比べるのが無難です。
  • 確実な最高精度・検証済みの実績が要る人:Qwen3-Coder-Nextの公式比較は当時の版が相手のため、現行フロンティアとの距離は計測の取り方で揺れます。最高精度を最優先するなら、Claude Opus 4.8やGPT-5.5を優先候補にしてください。

まとめ

Qwen3-Coderは、旗艦の480Bから最新のNext、小型の30Bまでをそろえた、Apache 2.0のコーディングモデル群です。クラウドではDashScopeの qwen3-coder-next(公式推奨)・qwen3-coder-plusqwen3-coder-flash から従量で使え、OpenAI互換なのでClaude Codeなどにそのまま挿せます。精度はQwen3-Coder-NextがSWE-Agent 70.6・OpenHands 71.3(技術報告)と上位ですが、比較相手が当時の版のため、現行フロンティアとの距離は計測の取り方で揺れる点は正直に押さえておきたい。料金は公式推奨のnextやflashが低価格帯(短文脈で出力1.50ドル、ただし最安はDeepSeek V4 Flash側)、plusは短文脈ならGLM・Kimiと同帯、長文脈では段階課金で跳ねます。速度は系列差が大きく、小型30Bは約100 tok/sと速い一方、クラウドのplusやNextは中位です。データは「学習に使わない」の明示があり扱いやすい側ですが、安いGlobal版・北京版を選ぶと保存地域が変わるため、モードの選択が要点になります。開放性と系列の広さ、クラウドとローカルの行き来を取りたいならQwen3-Coderは有力な選択肢で、確実な最高精度が主ならClaude・GPT-5.5、最安重視ならDeepSeek V4 Flash、という使い分けが現実的です。

よくある質問

Qwen3-Coderはどれを選べばいいですか?

用途で分かれます。クラウドの通常用途は公式推奨の qwen3-coder-next(2026年2月公開、総800億・有効30億)、最大品質が要るなら qwen3-coder-plus、低コスト重視なら qwen3-coder-flash、単体GPUでのローカル実行なら小型のQwen3-Coder-30B-A3Bが目安です。いずれもApache 2.0で、クラウドと自己ホストを行き来できます。

Qwen3-CoderはClaude Codeから使えますか?

使えます。Qwen3-CoderはOpenAI互換のエンドポイントを備え、Claude Code連携も公式に案内されています。接続先(base URL)とモデル名を差し替えることで呼び出せます。課金はAlibaba Cloud(DashScope)の従量で、Anthropicのサブスクリプションとは別建てです。Claude Code向けの正確な設定は版で変わり得るので、公式ドキュメントで現行の値を確認してください。

料金が「段階課金」とはどういうことですか?

qwen3-coder-next・plus・flashとも、入出力の文脈長に応じて単価が段階的に変わります。国際版のplusは32K以下で入力1.00ドル/出力5.00ドルですが、文脈が長くなるほど上がり、256K超では入力6.00ドル/出力60.00ドルに達します。推奨のnextとflashは32K以下の0.30/1.50ドルから段階的に上がります(いずれも国際版・2026年時点)。リポジトリ全体を読ませるような長文脈では総額が膨らみやすいため、軽量のflashや、フラット料金のGLM-5.2・Kimiと比べるのが無難です。

Qwenに機密コードを入れても安全ですか?

提供元のAlibaba Cloud Model Studioは、APIで送ったデータを学習には使わないと明記し、通信を暗号化するとしています。この点は安心材料です。ただし、デプロイモード(International=シンガポール/Global=米国・ドイツ/EU=ドイツ・フランクフルト/Chinese Mainland=北京)でデータの保存地域が変わり、安い段のあるモード(Global・北京など)を選ぶと処理地域も変わります。機密性の高いコードは、要件に合うモードのエンドポイントを使い、保持や委託先などの条件を公式規約・DPAで確認する、あるいはオープンウェイトをローカルで動かすのが安全です。

Qwen3-Coderは無料で使えますか?

オープンウェイト(Apache 2.0)として公開されており、自前のハードウェアで動かす分にはモデル自体のライセンス費用はかかりません(ハードウェアや電気代は別途必要です)。クラウドで使う場合は従量APIの料金が発生し、国際版では推奨のnextやflashが出力1.50ドル、plusが短文脈で出力5.00ドル(100万トークンあたり)です。いずれも2026年時点の公表値で、改定され得ます。

参考資料

タイトルとURLをコピーしました