Kimi K2.7-Codeはクラウドで使うべきか｜料金・コーディング精度・データ取扱いをClaude・GLM-5.2・DeepSeekと比較

Moonshot AIが2026年6月にオープンウェイト（Modified MIT）として公開し、6月19日付の公式紹介ページで詳しく案内したKimi K2.7-Codeは、4月に出た汎用旗艦Kimi K2.6を土台に、コーディング面を伸ばした特化版です。総パラメータ1兆・推論時に有効化されるパラメータ32BのMoE（384エキスパートのうち8つを選択）という規模はK2.6と同じで、文脈は256K。違いはコーディングに振った調整で、Moonshotの社内ベンチでは前世代K2.6より明確に改善し、しかも同じ仕事をこなすのに使う推論トークンを約30%減らした、と公称しています。Claude Codeなどの既存ツールにそのまま挿せる接続性も持ち、GLM-5.2やDeepSeek V4と並ぶ、中国発のオープンなコーディングモデルの一角です。

Kimi K2.7-Codeはローカル専用ではなく、Moonshotの従量課金API、Kimi Code、Claude Codeなどからクラウド経由で使えます。一方、オープンウェイトとして公開されているため、十分な計算資源があれば自己ホストも可能です。本記事では料金・コーディング精度・速度・使い勝手の4点に加えて、判断を分けやすい「データの扱い」も含めて、Kimi K2.7-CodeをClaude（Anthropic）・OpenAI Codexで使えるGPT-5.5、そして同じオープン勢のGLM-5.2・DeepSeek V4と並べて整理します。数値はすべて2026年時点で各提供元・第三者が公表している値で、筆者環境での再計測ではありません。とくにコーディングのベンチマークは、後述のとおりMoonshotの社内ベンチが中心で、標準的な公開ベンチでの第三者の独立スコアはまだ揃っていないため、点差そのものより全体の位置関係を目安として読んでください。

Kimi K2.7-Codeとは：K2.6との関係
クラウドでKimi K2.7-Codeを使う経路
料金：出力単価とキャッシュ
コーディング精度：フロンティアとの距離
速度：生のトークン速度よりトークン効率
使い勝手：既存のコーディングツールにそのまま挿す
クラウドで使う前に押さえたいデータの扱い
ローカルとクラウド、どちらで動かすか
GLM-5.2やDeepSeek、Claudeとどう使い分けるか
どんな人に向くか
まとめ
よくある質問
参考資料

Kimi K2.7-Codeとは：K2.6との関係

Kimi K2.7-Codeを理解するには、基盤となったK2.6から見るのが早道です。K2.6は2026年4月にMoonshotが公開した汎用の旗艦モデルで、コーディングやエージェント作業でも上位の成績を出していました。K2.7-Codeは、そのK2.6をコーディング用途に振り直した派生版です。アーキテクチャ（総1兆・有効32BのMoE、256K文脈）は据え置きで、変わったのは中身の調整と効率です。

Moonshotが公称する前世代比の改善は、いずれも同社の社内ベンチによるものです。コーディング総合のKimi Code Bench v2で62.0（K2.6は50.9、約21.8%増）、Program Benchで53.6（同48.3、約11.0%増）、MLS Bench Liteで35.1（同26.7、約31.5%増）。あわせて、同じタスクを解くのに使う推論（思考）トークンを約30%削減したとしています。効率が上がるほど、後述の「単価×生成量」で効いてくるため、コスト面の意味は小さくありません。

ひとつ運用上の注意があります。K2.7-Codeは思考（Thinking）モードが必須で、非思考モードには対応しません。常に推論を有効にして動く設計で、APIで呼ぶ際も思考を有効にしていないと、リクエストが自動的にK2.6側にルーティングされる仕様です。長時間の自走については、K2.6譲りのエージェント能力（公称で最大300のサブエージェント、4,000の協調ステップ、12時間超の連続実行）を引き継いでいます。一方で、K2.7-Codeのコーディング向上は社内ベンチが中心で、SWE-bench Verifiedのような標準公開ベンチでの第三者独立スコアは現時点でまだ整備されていません。この点はあとで精度の節で改めて触れます。

クラウドでKimi K2.7-Codeを使う経路

Kimi K2.7-Codeを試す、あるいは業務に組み込む経路は、大きく4つに分かれます。

従量課金のKimi API：トークン量に応じて支払う方式で、Moonshotの公式プラットフォーム（platform.kimi.ai）から使います。OpenAI互換のエンドポイント（接続先 https://api.moonshot.ai/v1、モデル名 kimi-k2.7-code）で、自動のコンテキストキャッシュにも対応する設計です。
Claude Codeなどからの接続：Kimi APIはAnthropic互換のエンドポイントも備えており、Claude Code・Cline・Aider・RooCode・OpenCodeといった既存のコーディングツールの接続先を差し替えるだけで呼べます。Claude Codeなら接続先（ANTHROPIC_BASE_URL=https://api.moonshot.ai/anthropic）とモデル名（kimi-k2.7-code）を指すだけで、ツール側はそのまま使えます。
Kimi Code：Moonshot自社のCLI／IDEプラグインから使う形で、API従量とは別に月額のサブスクリプションプランが用意されています。
オープンウェイトの自己ホスト：Hugging Faceで重みが公開されており、自前のハードウェアで動かせるのも利点です。ただし規模が大きいぶん、必要メモリは後述します。

料金体系は経路によって異なります。Moonshot/Kimi APIや、Claude CodeなどへのAnthropic互換接続は後述の従量API課金、Kimi Codeは月額のサブスクリプションプラン（複数ティア。年払い時の月額でおよそ15〜159ドル、月払いではおよそ19〜199ドル）、自己ホストはモデル利用料ではなく自前のインフラ費用が主なコストです。同じK2.7-Codeを使う場合でも、どの経路で呼ぶかによって請求元と料金体系が変わります。いずれもAnthropicのサブスクリプションや既存のClaude課金とは別建てです。前述のとおり、K2.7-Codeの呼び出しは思考モードを有効にしているのが条件で、無効だとK2.6側に回る点に注意してください。

料金：出力単価とキャッシュ

Kimi K2.7-Codeの料金は、Moonshot公式（platform.kimi.ai）の従量API価格で、入力が100万トークンあたり0.95ドル、出力が4.00ドル、キャッシュ命中時の入力が0.19ドルです（いずれもUSD、文脈262,144トークン、単一ティア）。主要なコーディング向けモデルと並べると、立ち位置がはっきりします。料金は改定され得るため、導入前には各社公式の最新価格を確認してください。

モデル / プラン	入力（/100万トークン）	出力（/100万トークン）	備考（2026年時点の公表値）
Kimi K2.7-Code	0.95ドル	4.00ドル	キャッシュ命中時は入力0.19ドル。総1兆／有効32BのMoE・256K文脈。思考モード必須
DeepSeek V4 Pro	0.435ドル	0.87ドル	同じオープン勢のなかでも最安級。キャッシュ入力0.003625ドル
GLM-5.2（z.ai API）	1.40ドル	4.40ドル	同じオープン勢。キャッシュ入力0.26ドル
Claude Opus 4.8	5.00ドル	25.00ドル	Anthropicの最上位
GPT-5.5（OpenAI Codexで使える主要モデル）	5.00ドル（短文脈）	30.00ドル（短文脈）	長文脈では入力10ドル/出力45ドル

価格はいずれも各社公式の公表値（2026年時点）です。

出力トークンで見ると、Kimi K2.7-Codeの4.00ドルはClaude Opus 4.8の25ドルのおよそ6分の1、GPT-5.5の30ドル（短文脈）と比べれば約7.5分の1です。同じオープン勢のGLM-5.2（出力4.40ドル）とはほぼ同水準で、DeepSeek V4 Pro（出力0.87ドル）よりは高い、という位置づけになります。つまり「オープン勢のなかで飛び抜けて安いのはDeepSeek、Kimi K2.7-CodeはGLM-5.2と同じくらいで、商用最上位の数分の1」という相場です。

Kimiのコスト面の特徴は、単価そのものよりキャッシュ命中時の入力が0.19ドル（通常の0.95ドルの約5分の1）に下がる点と、前述の推論トークン約30%削減にあります。コーディングでは同じファイルや指示を何度も読ませるため、キャッシュが効く場面が多く、実コストは表の単価よりも下がりやすい。さらに、思考モードが必須で出力（思考を含む生成量）は出やすいモデルなので、効くのは単価だけでなく「単価×生成量」です。K2.7-Codeが前世代より少ない推論トークンで同じ仕事を終える設計は、ここで効いてきます。なお、この料金表はAPI従量の単価で、前述のKimi Codeの月額プランとは別の体系です。

出力トークン単価の比較（100万トークンあたり・2026年時点の公表値）。Kimi K2.7-Codeは安いオープンモデル群に位置し、Claude Opus 4.8やGPT-5.5のおよそ6〜7分の1、GLM-5.2とほぼ同水準。

コーディング精度：フロンティアとの距離

安さだけでは選べません。コーディング精度をどう読むかですが、ここで前述の制約が効いてきます。K2.7-Codeの向上はMoonshotの社内ベンチ（Kimi Code Bench v2など）が中心で、SWE-bench VerifiedやLiveCodeBenchといった標準公開ベンチでの第三者独立スコアは、現時点でまだ揃っていません。そこで全体の位置を見る目安としては、基盤となったK2.6の公式比較表が参考になります。K2.7-CodeはこのK2.6をコーディングに振った版で、効率と社内ベンチで前進している、という関係です。

ベンチマーク	Kimi K2.6	Moonshot公式表の主な比較対象
SWE-bench Verified（実issue解決）	80.2	Claude Opus 4.6 Max 80.8 / Gemini 3.1 Pro 80.6
SWE-bench Pro（難度高め）	58.6	GPT-5.4 xHigh 57.7 / Claude Opus 4.6 Max 53.4
LiveCodeBench v6（競技・アルゴリズム）	89.6	同社公開の比較値
Terminal-Bench 2.0（CLIエージェント）	66.7	同社公開の比較値

Moonshot公式のK2.6比較表。比較相手は当時のモデルのバージョン・モード（Claude Opus 4.6 Max／GPT-5.4 xHigh／Gemini 3.1 Pro High）で、現行のClaude Opus 4.8やGPT-5.5とは同条件の比較ではありません。

表の読み方には注意が要ります。Moonshotがこの表で比較に使った相手は、当時のClaude Opus 4.6（最大努力）、GPT-5.4（xHigh）、Gemini 3.1 Pro（高思考）であり、現行のClaude Opus 4.8やGPT-5.5ではありません。バージョンもモードも揃っていないため、点差をそのまま「勝ち負け」と読むより、位置関係の目安として見るのが安全です。そのうえで傾向を見ると、実在のGitHub issueを複数ファイルにまたがって解くSWE-bench Verifiedでは80.2と、当時のClaude Opus 4.6 Max（80.8）やGemini 3.1 Pro（80.6）とほぼ互角。難度を上げたSWE-bench Proでは58.6で、表のなかでは首位級に位置していました。競技・アルゴリズム寄りのLiveCodeBench v6も89.6と高い。

まとめると、基盤のK2.6の時点で、特定のコーディングベンチではフロンティアと互角〜一部首位という水準にありました。K2.7-Codeはそこからコーディング面を社内ベンチで二桁パーセント伸ばし、効率も改善した版です。ただし、その向上を裏づける標準公開ベンチの第三者独立スコアはこれからなので、現時点では「点差で勝つモデル」というより「フロンティア同等水準にあるオープンなコーディングモデルで、外部検証はこれから追いつく段階」と捉えるのが実態に近い。確実な最高精度や検証済みの実績が必要な用途では、Claude Opus 4.8やGPT-5.5のほうが依然として安全です。

速度：生のトークン速度よりトークン効率

出力速度（毎秒のトークン生成数）を横断計測のArtificial Analysisで見ると、Kimi系の生の速度は中位です。K2.6の計測では、Moonshot自社API経由で出力がおおむね毎秒43トークン前後、最初の応答までの待ち（TTFT）が約2.3秒とされています（K2.7-Code単体の個別計測はまだ掲載が揃っていません）。GLM-5.2やDeepSeek V4 Flashのような「速い側」と比べると、瞬間的な吐き出し速度では一段譲ります。いずれも2026年時点の公表計測で、提供プロバイダや設定で大きく変わるため、目安として見てください。

ただし、Kimiの速度の効きどころは生のトークン速度ではなくトークン効率にあります。K2.7-Codeは前世代K2.6と比べて、同じタスクを解くのに使う推論トークンを約30%削減した、とMoonshotは公称しています。つまり「1秒あたり何トークン出すか」より「同じ仕事を何トークンで終えるか」で効くモデルで、これは実時間とコストの両方を押し下げます。一方で思考モードが必須のため、最初の応答までの待ちは小さくはありません。

位置づけを整理すると、こうなります。対話の体感速度（送信してから返り始めるまでの速さ）を最優先するなら、より速い側のGLM-5.2や、プロバイダの選択で稼ぐほうが向きます。逆に、長時間の自律的なエージェント作業や、同じ文脈を何度も参照する反復の多いコーディングでは、安い出力単価と少ない生成量（トークン効率）、キャッシュの効きが合わさって、実コストと総所要時間で効いてきます。Kimi K2.7-Codeの乗り換え価値は、瞬間的な速さではなく、この「安さ×効率×長時間の安定」に出る、というのが妥当な読み方です。

使い勝手：既存のコーディングツールにそのまま挿す

Kimi K2.7-Codeは、OpenAI互換とAnthropic互換の両方のエンドポイントを備えています。これにより、Claude Code、Cline、Aider、RooCode、OpenCodeといった既存のコーディングツールの接続先（ベースURL）とモデル名を差し替えるだけで呼べます。すでにClaude Codeを使っているなら、使い勝手をほぼ変えずにモデルだけKimiに替える、という移り方ができるのが大きな利点です。Cline のようなツールも接続先の切り替えだけで、ローカルLLM（Ollama連携）にもクラウドのKimiにも向けられます。文脈は256Kあり、長いリポジトリの読み込みや複数ステップの実装にも耐えます。

運用上の要点は、やはり思考モードです。K2.7-Codeは思考モードが必須で、これを有効にしていないと呼び出しがK2.6側に回ります。ツール側の設定で思考を有効にしておく必要がある、という一点だけは押さえておくと迷いません。長時間の自走を伴うエージェント作業では、K2.6譲りのスウォーム（多数のサブエージェントを並行させる仕組み）が効きます。自律実行をどう安全に回すか（Hookや隔離でリスクを下げる考え方）は、Claude Code を安全に自律実行する方法が参考になります。

クラウド経由で使うかぎり、モデルの計算はMoonshot側で行われるため、手元のマシンに推論用の大型GPUは要りません。必要なのはエディタやCLIを動かせる程度の環境で、これはClaude Codeのようなクラウド型ツールを使うときの推奨スペックと同じです。ただし手元でビルドやテスト、コンテナ実行を伴う場合は、通常の開発に必要なCPU・メモリ・ディスク性能は要ります。どの程度のPCで快適かは、姉妹サイトのClaude Code推奨スペック｜GPU不要・ノートPCで快適に使える環境を解説がそのまま目安になります。

クラウドで使う前に押さえたいデータの扱い

Kimi K2.7-Codeを業務で使うとき、価格や速度以上に判断を分けるのがデータの扱いです。ここは経路によって書きぶりが分かれます。国際版のKimi一般サービス（チャットなど）はシンガポール法人（MOONSHOT AI PTE. LTD.）が提供し、一般サービスの規約では入力内容をサービスの運用・改善・研究などに使う可能性がある一方、モデル改善・研究目的の利用についてはオプトアウト手段（membership@moonshot.aiへの連絡）が示されています。一方、Kimi APIのヘルプセンターでは、API経由で提出した入力・出力はモデルの訓練・改善には使われず、訓練目的で永続保存されないと明記されています。ただし、OpenPlatformの利用規約にはCustomer Contentの利用に関するより広い規定も残るため、機密コードや業務データを扱う場合は、ヘルプセンターの記載だけでなく利用規約・DPA・個別契約条件まで確認するのが安全です。国外のサーバーへ移転・保存される可能性がある点も、他の主要サービスと同様です。

注意したいのは、Moonshot AI自体は中国（北京）発の企業で、国内向けのエンドポイント（api.moonshot.cn）も存在することです。前述のClaude Code連携の例でも、接続先としてapi.moonshot.ai（国際版）とapi.moonshot.cn（中国版）の両方が出回っています。どちらのエンドポイント・どの契約主体を使うかでデータの所在や条件が変わるため、機密性の高いコードを扱うなら、国際版（シンガポール法人）のエンドポイントを使い、API利用なら前述のとおり入出力が訓練に使われない扱いを前提にしたうえで、自社のデータ要件を利用規約・DPA・個別契約条件まで確認する、といった手当てが要ります。「データはすべて中国のサーバーに行く」と一括りにするのも、「シンガポール法人だから無条件に安全」と決めつけるのも、どちらも正確ではありません。

同じオープン勢で比べると、GLM-5.2を提供するz.aiも運営主体をシンガポール法人とし、公開DPA上は原則シンガポール処理・API入出力は非保存を掲げています。DeepSeekは公開ポリシー上データを中華人民共和国で処理・保存するとしています。Kimi（国際版）はこの中間で、シンガポール法人で、Kimi APIの入出力は訓練に使わない（一般サービスはモデル改善・研究利用のオプトアウト手段あり）という点ではGLM寄りですが、OpenPlatform規約のより広い文言や中国版エンドポイントの存在を含めて、使う経路次第という性格です。機密性が最優先なら、いずれにせよクラウドAPIをそのまま使うより、ローカル実行や、データ処理条件を確認できる配信事業者経由を検討するのが安全です。

ローカルとクラウド、どちらで動かすか

Kimi K2.7-Codeはオープンウェイトなので自己ホストもできますが、総1兆パラメータ級のMoE（有効32B）は、量子化しても相応のGPUメモリを要する大型モデルです。手元で常用するにはハードルが高く、まずクラウドから使うのが現実的な入口になります。自己ホストを検討する場合の必要メモリの目安は、姉妹サイトの巨大オープンモデルは手元で動くのか比較｜必要メモリ早見表が参考になります。クラウドの従量料金と、自己ホストのための機材費・電気代の損益分岐は、入出力のトークン量・利用時間・同時人数・GPU価格で大きく変わるため、本記事では定量の試算は行いません。なお、クラウドAPIが使えない状況でローカルへ切り替える具体的な手順は、クラウドAI APIが使えない時の代替策にまとめています。

GLM-5.2やDeepSeek、Claudeとどう使い分けるか

Kimi K2.7-Codeは、同じオープン勢のGLM-5.2やDeepSeek V4としばしば並べられます。大づかみには、Kimi K2.7-Codeは「Claude Code互換＋長時間自走＋トークン効率、データはシンガポール法人＋学習オプトアウトで相対的に扱いやすい」、DeepSeek V4は「最安・競技/算法コーディング最強だがデータは中国処理の可能性」、GLM-5.2は「長期タスクやエージェント寄りのバランス、原則シンガポール処理」という違いになります。価格はKimiとGLMがほぼ同水準、DeepSeekが一段安い、という相場です。

それぞれの料金・精度・速度・使い分けは、GLM-5.2はローカルではなくクラウドで使うべきか｜Claude・Codex比較と料金の目安と、DeepSeek V4はクラウドで使うべきか｜料金・コーディング精度・データ取扱いをClaude・GLM-5.2と比較で詳しく扱っています。商用の最上位（Claude Opus 4.8やGPT-5.5）と比べると、Kimiは価格で大きく優位ですが、確実な最高精度や検証済みの実績が要る用途では上位モデルが安全です。コーディングツール自体の選び方は、AIコーディングツールはどれを選ぶか｜用途別比較も参考になります。

どんな人に向くか

Claude Codeの使い勝手のまま、安く回したい人：Anthropic互換でツールはそのまま、出力単価はClaudeの数分の1。移行の手間が小さく、コスト削減が見込めます。
長時間のエージェント作業・自走が多い人：スウォーム（多数のサブエージェントを並行させる仕組み）による長尺の自走と、推論トークン効率（約30%削減・公称）が効きます。
DeepSeekより安心が欲しいが、安さも欲しい人：国際版はシンガポール法人で、Kimi APIの入出力は訓練に使わない（一般サービスはオプトアウト手段あり）。価格はGLM-5.2並み。データ面と価格のバランスを取りたい場合の選択肢です。
確実な最高精度・検証済みの実績が要る人：K2.7-Codeの標準公開ベンチでの第三者独立スコアはこれからの段階です。検証済みの実績や最高精度を最優先するなら、Claude Opus 4.8やGPT-5.5が安全です。

まとめ

Kimi K2.7-Codeは、汎用旗艦K2.6をコーディングに振った特化版で、Moonshotの社内ベンチでは前世代より二桁パーセント改善し、推論トークンを約30%削減したと公称しています。基盤のK2.6は、SWE-bench Verifiedで当時のClaude Opus 4.6とほぼ互角、SWE-bench Proでは表のなかで首位級という、フロンティア同等水準にあったモデルです。出力単価はClaude Opus 4.8の約6分の1でGLM-5.2並み、キャッシュ命中時の入力はさらに安く、Anthropic互換でClaude Codeなどにそのまま挿せる。一方で、生のトークン速度は中位で、瞬間的な体感速度ではGLM-5.2に譲り、K2.7-Codeの向上を裏づける標準公開ベンチの第三者独立スコアはまだこれからです。データの扱いは、国際版がシンガポール法人で、Kimi APIの入出力は訓練に使わない（一般サービスはオプトアウト手段あり）とGLM寄りに扱いやすい一方、OpenPlatform規約のより広い文言や中国版エンドポイントの存在を含めて使う経路次第。安さとClaude Code互換、長時間自走とトークン効率を取り、データ面でDeepSeekより安心を求めるならKimi K2.7-Codeは有力な選択肢で、確実な最高精度や検証済み実績が主ならClaude・GPT-5.5、最安を取るならDeepSeek、という整理になります。

よくある質問

Kimi K2.7-CodeとK2.6は何が違いますか？

K2.7-Codeは、汎用旗艦のK2.6をコーディング用途に振り直した特化版です。アーキテクチャ（総1兆・有効32BのMoE、256K文脈）は同じで、Moonshotの社内ベンチでは前世代より改善（Kimi Code Bench v2で約21.8%増）し、同じタスクに使う推論トークンを約30%削減したと公称しています。また、K2.7-Codeは思考モードが必須で、無効だと呼び出しがK2.6側に回ります。いずれも2026年時点の公表値です。

Kimi K2.7-CodeはClaude Codeから使えますか？サブスク内ですか？

使えます。Kimi APIはAnthropic互換のエンドポイントを備えているため、Claude Codeの接続先（ベースURL）とモデル名を差し替えるだけで呼び出せます。ただし課金はMoonshotの従量API（トークン従量）で、Anthropicのサブスクリプションや既存のClaude課金とは別建てです。機密性を気にする場合は、国際版（シンガポール法人）のエンドポイントを選ぶのが無難です。

ClaudeやGPTより遅いですか？

生の出力速度（毎秒のトークン数）は、横断計測のArtificial Analysis上では中位で、GLM-5.2やDeepSeek V4 Flashのような速い側には一段譲ります。ただしK2.7-Codeは推論トークンを約30%削減（公称）し、キャッシュも効くため、「同じ仕事を何トークンで終えるか」で見ると実コストと総所要時間は抑えやすいモデルです。瞬間的な体感速度を最優先するなら、より速い側やプロバイダの選択が向きます。

Kimiに機密コードを入れても安全ですか？

使う経路次第です。国際版（platform.moonshot.ai、シンガポール法人）では、Kimi APIのヘルプセンター上、API経由の入力・出力はモデルの訓練・改善に使われず、訓練目的で永続保存されないとされています。一般サービス（チャット）側もモデル改善・研究利用のオプトアウト手段が示されています。一方で、OpenPlatformの利用規約にはより広い規定も残り、中国版エンドポイントも存在するため、機密性の高いコードでは、利用規約・DPA・個別契約条件まで確認する、あるいはローカル実行やデータ条件を確認できる配信事業者経由を検討するのが安全です。

Kimi K2.7-Codeは無料で使えますか？

オープンウェイト（Modified MIT）として公開されており、自前のハードウェアで動かす分にはモデル自体のライセンス費用はかかりません（ハードウェアや電気代は別途必要で、総1兆パラメータ級のため相応の計算資源が要ります）。クラウドで使う場合は従量APIの料金が発生し、出力は100万トークンあたり4.00ドル、キャッシュ命中時の入力は0.19ドルです。いずれも2026年時点の公表値で、改定され得ます。