国産AI「PLaMo 3.0 Prime」とは?料金・日本語性能とChatGPT・Claude・Geminiの使い分け【2026年6月】

PLaMo 3.0 Primeに関する記事のアイキャッチ画像 - 国産AI「PLaMo 3.0 Prime」とは?料金・日本語性能とChatGPT・Claude・Ge LLM開発・技術

Preferred Networks(PFN)が2026年6月22日、自社開発の大規模言語モデル「PLaMo 3.0 Prime」を正式にリリースしました。海外製の生成AIが大半を占めるなかで、事前学習から自社で組み上げたフルスクラッチの国産モデルという立ち位置で、しかも入力60円・出力250円(いずれも100万トークンあたり)という低めの価格を打ち出しています。

このページでは、PLaMo 3.0 Primeがどんなモデルで、料金はいくらで、何が得意で何が苦手なのか、そしてChatGPT・Claude・Geminiといった海外勢とどう使い分ければよいのかを、公式の情報をもとに整理します。日本語での業務利用やコスト、データの扱いを気にされている方が、自分の用途に合うかどうかを判断できることを目指します。

PLaMo 3.0 Primeとは

PLaMo 3.0 Primeは、PFNが提供する生成AI基盤モデルの最新版です。情報通信研究機構(NICT)との共同研究で得られた事前学習モデルをベースに開発されており、2026年3月に公開されたβ版を、モニター利用や社内評価の知見を反映して正式版に仕上げた、という経緯が公式に説明されています。

今回の世代では、扱える文脈の長さ(コンテキスト長)が従来の64Kトークンから256Kトークン(APIの表記では262,144トークン)へと拡張されました。長い資料やソースコード、複数のやり取りをまとめて読み込ませやすくなっています。PFNは、フルスクラッチのモデルとして日本で初めてReasoning(推論)機能を採用した、と説明しています。

Reasoningあり/なしを用途に応じて切り替えられる

PLaMo 3.0 Primeは、用途に応じて2つの動き方を選べます。

  • Reasoning(推論)モデル:時間をかけて段階的に考えるタイプです。複数の条件を整理しながら答えを組み立てるのが得意で、複雑な指示への対応、数理的な問題、専門的な質問応答、意思決定の支援といった、じっくり考えたい場面に向きます。
  • 非Reasoning(Non-reasoning)モデル:速さを優先するタイプです。性能はそこそこに抑えつつ高速に応答するため、社内文書の要約、定型的な問い合わせ対応、情報抽出、チャットボットなど、数をこなしたい場面に向きます。

同じモデルでありながら「深く考えさせる」か「速く返す」かを切り替えられるため、コストと品質、応答速度のバランスを用途ごとに調整しやすくなっています。API上では同じ「plamo-3.0-prime」を呼び出し、推論の度合い(reasoning_effort)の指定でReasoningのあり・なしを切り替えます。

どこで使えるか・どこで動くか

提供形態は複数あります。ブラウザから試せる「PLaMo Chat」と、アプリケーションに組み込むための「PLaMo API」が中心で、APIはOpenAI互換の形式(Chat Completions API)に対応しています。すでにOpenAI向けに書いたコードがある場合、接続先を切り替えるだけで使い回せる場面が多いということです。加えて、オンプレミスでの利用、Amazon Bedrock Marketplace、Snowflakeを通じた利用も用意されています。

同じ国産・日本語特化でも、手元のGPUに重みをダウンロードして動かすオープンウェイトのローカルモデルとは性格が異なります。PLaMo 3.0 PrimeはあくまでクラウドAPIやマネージド/オンプレミスのサービスとして提供されるもので、消費者が自分のPCで気軽に動かすたぐいの配布形態ではありません。

すでにどこで使われているか

公式によると、国産AI構築プラットフォームの「miibo」、法人向けサービスの「Tachyon 生成AI」、約800自治体が導入する「QommonsAI」などのサービスに標準搭載されています。行政分野では、PLaMoシリーズがデジタル庁のガバメントAI「源内」の評価検証対象の一つに選ばれた実績があります(PLaMo 3.0 Primeそのものの採用確定ではなく、シリーズが試用・評価の対象に入ったという位置づけです)。

料金プラン:入力60円・出力250円から

PLaMo APIは、入力したトークンと出力されたトークンの量に応じて課金される従量制です。ひと月のトークン使用量に単価を掛けた額が請求される仕組みで、プランは3つ用意されています。価格はいずれも公式の料金ページ(2026年6月時点)に基づきます。

プラン 入力(/100万トークン) 出力(/100万トークン) 主な対象・特徴
Free 0円 0円 気軽に試すための無料枠。ただし現在は準備中で、利用量とレート制限あり
Standard 60円 250円 個人・小規模組織向け。登録後すぐ従量課金で利用開始。APIキー単位のレート制限とテナント単位の月額上限があり、必要に応じてクオータ引き上げを申請
Provider 個別見積もり 個別見積もり 生成AIサービス提供者向け。用途審査のうえ柔軟な条件を設定

Standardプランの60円・250円は、コンテキスト長128Kトークンまでの入出力単価です。128Kを超える分についても、リリース記念期間中は同額で扱われる、と案内されています。なお利用料金の算出では、1円未満の値は切り上げで計算されます。

Freeプランは「準備中」で、提供開始を待つ状態です(2026年6月時点)。すぐに無料で使い倒せるわけではない点は押さえておくとよいでしょう。一方、リリースを記念したキャンペーンとして、2026年7月31日までに新規登録すると1000万トークン相当のクレジットが付与されます(有効期間は1か月)。これは金額として付与されるもので、実際に使えるトークン数は入力と出力の比率によって変わります(公式は入力対出力をおよそ4対1と想定して換算)。Freeプランの提供前でも、このクレジットで実際の使い心地を確かめられます。

データの扱い:Standard以上は「保存せず・学習に使わない」

料金以外で実務上の判断に効いてくるのが、入力したデータの扱いです。PLaMo APIのStandardプランとProviderプランでは、入力データを保存せず、モデルの学習にも使わない(ZDR:ゼロデータ保持)方針が示されています。社内情報や顧客情報を含むやり取りを外部の学習に回したくない、という要件に対して一つの答えになります。

ここで注意したいのは、この「保存しない・学習に使わない」がプラン依存である点です。公式のプラン比較表では、ZDRやデータを学習に利用しない扱いはStandardプランとProviderプランに付くもので、Freeプランは対象外とされています。「国産だから」「ローカル寄りだから」データが必ず外に出ない、と一括りにはできません。機微なデータを扱う場合は、無料枠ではなくStandard以上を選ぶ、という前提で考えておくのが安全です。

何が得意で、何が苦手か

PLaMo 3.0 Primeの売りは、日本語の扱いと、業務での使い勝手です。PFNは、日本語の業務文書で学習・評価を行ったこと、独自のトークナイザによってトークン効率(同じ文章をより少ないトークンで表現できること)を高めたこと、安全性の評価(HELM Safety)で海外モデルと同等以上の結果を得たことを挙げています。トークン課金のサービスでは、日本語を効率よくトークン化できることは、そのまま実効コストの低さにつながりやすい要素です。

性能面では、日本語・英語・コード・数学・長文・安全性など幅広い領域のベンチマークでの結果が公表されています(具体的なスコアは公式の技術ブログの図で示されています)。ここで一つ区別しておきたいのは、こうした公表ベンチマークの数字と、実際に自分の業務で使ったときの体感は別物だということです。本稿では独自に測定した数値は扱っていません。最終的な相性は、後述のキャンペーンクレジットなどで手元のタスクを試して確かめるのが確実です。

苦手な領域については、PFN自身が改善の余地を明記しています。具体的には、Web探索を伴うタスク、非常に長いコンテキストの扱い、数学的な推論、STEM領域、日本の法令分野などです。また、非Reasoningモデルには過剰に拒否してしまう傾向(本来答えてよい質問まで断る)があること、コンテキスト長は最先端の海外モデルとはまだ差があることも示されています。万能のモデルとして売り込むのではなく、得手不得手を開示している点は、用途を見極めるうえでむしろ役立ちます。

日本語の性能と「評価コスト」のバランス(PFN公表ベンチ)

料金の安さだけでなく、肝心の性能(精度)はどうなのか。PFNは、独自の評価指標「日本語知能指数」(数値が高いほど日本語タスクの性能が高い)と、その評価一式を実際に流したときにかかった「評価コスト」を散布図で公開しています。主要モデルを散布図にしたのが下図です(PFN公表のデータ点をもとに作成。図の左上にあるモデルほど「高性能かつ低コスト」を意味します)。

PLaMoと各社モデルの日本語知能指数と評価コストの散布図。PLaMo 3.0 Prime(Reasoning)はGPT-5.4 miniと同等の日本語知能指数を約半分の評価コストで達成。PFN公表データをもとに作成。
日本語知能指数(縦・高いほど高性能)と評価コスト(横)の位置関係。PLaMo 3.0 Prime(Reasoning)は、GPT-5.4 miniと同等の日本語知能指数を約半分の評価コストで達成している。PFN公表のベンチマークデータをもとに作成。

PFNの評価では、Reasoning版の日本語知能指数は69.6で、GPT-5.4 miniと同じ水準に並び、しかも評価にかかったコストはGPT-5.4 miniの半分以下でした。応答速度を優先したNon-reasoning版も64.7と高く、これを約323円という低コストで達成しています。海外勢では、Claude Haiku 4.5(59.8)やQwen3.6-27B(約65)が、PLaMoと同等以下の日本語知能指数に対して評価コストは大きい結果でした(一方で海外のオープンモデルgpt-oss-120bは、64.1をさらに低い評価コストで出しています)。旧版のPLaMo 2.2 Prime(54.2)からの伸びも大きく、世代交代で日本語性能が底上げされたことがうかがえます。

読み違えやすい点を2つ補足します。1つは、この「日本語知能指数」がPFNの自社評価指標であり、第三者による中立のスコアではないことです。比較対象のモデルもPFNが選んでいます。もう1つは、表の「評価コスト」が、PFNがこの評価一式を流したときの実費であって、先に紹介した料金プランの「100万トークンあたりの単価」とは別物だということです。評価コストは各モデルが回答に使ったトークン量にも左右され、長く考えるモデルほど高くなりやすい性質があります。「同じ評価をしたら、いくらかかったか」の目安として見てください。

このほかPFNは、15種類のベンチマーク(指示追従・対話・ツール使用・数学・STEM・日本の法令・医療・コード生成・安全性など)でも各モデルと比較した結果を公開しています。そこでも、日本語の指示追従や対話、安全性は高い一方、Web探索や長いコンテキスト、数学的推論、STEM、日本の法令といった領域は他の上位モデルに譲る、という前節の傾向が数値で確認できます。

ChatGPT・Claude・Geminiとの料金比較

「高コスパ」がどの程度なのかを、ChatGPT(OpenAI)・Claude(Anthropic)・Gemini(Google)の各APIモデルと並べて見てみます。比較は、PLaMoが位置する低価格帯のモデルを中心に、参考として各社のフラッグシップも添えました。いずれも各社公式の料金(2026年6月時点)で、100万トークンあたりの入力/出力単価です。

モデル 入力 出力 提供元
PLaMo 3.0 Prime(Standard) 60円 250円 Preferred Networks
GPT-5.4 mini $0.75 $4.50 OpenAI
Gemini 2.5 Flash $0.30 $2.50 Google
Gemini 2.5 Flash-Lite $0.10 $0.40 Google
Claude Haiku 4.5 $1.00 $5.00 Anthropic
参考:各社の上位(フラッグシップ)モデル
GPT-5.5 $5.00 $30.00 OpenAI
Claude Sonnet 4.6 $3.00 $15.00 Anthropic
Claude Opus 4.8 $5.00 $25.00 Anthropic
Gemini 2.5 Pro $1.25〜 $10.00〜 Google

※ 各単価は100万トークンあたり。PLaMoは円建て、海外勢はドル建てのため、円換算額は利用時点の為替レートで変動します。Gemini 2.5 Proは入力長(200Kトークン)を境に単価が変わります。

表の通り、PLaMoの単価は海外の安価帯(miniやFlashと呼ばれる軽量モデル)と同じ水準か、それ以下に収まります。とくに出力単価は、GPT-5.4 miniやClaude Haiku 4.5、Gemini 2.5 Flashより安く、出力量が多い使い方ほど差が出ます。一方で、GPT-5.5やClaude Sonnet・Opus、Gemini Proといった上位モデルは汎用的な性能を追ったもので、価格帯そのものが別レンジです。

比較で気をつけたい点が2つあります。1つは通貨です。PLaMoは円建て、海外勢はドル建てで課金されるため、円換算した金額は為替によって動きます。本稿では各社の公式表示通貨のまま併記しており、ドル建てサービスの円換算は、利用時点のレートでご確認ください。もう1つはトークナイザの違いです。PLaMoは日本語のトークン効率を高めた独自トークナイザを採用しており、同じ日本語の文章なら海外モデルより少ないトークン数で処理できる可能性があります。その場合、単価表の見た目以上に実効コストの差が開くことも考えられます(具体的な差は、実際のテキストで測ってみないと確定はできません)。

どんな人・用途に向いているか

ここまでを踏まえると、PLaMo 3.0 Primeが力を発揮しやすいのは、次のような場面です。

  • 日本語の業務処理が中心:社内文書の要約、情報抽出、定型問い合わせ、チャットボットなど。日本語特化と低価格、応答速度(非Reasoning)の組み合わせが効きます。
  • コストを抑えたい:出力単価が安く、日本語のトークン効率も期待できるため、量をこなす日本語タスクで費用が読みやすくなります。
  • 入力データを外部の学習に回したくない:Standard以上ならデータを保存せず学習にも使わない方針です。社内・顧客情報を扱う業務と相性が良いといえます(無料枠は対象外な点に注意)。
  • 国産・オンプレミスという選択肢が要件:データの所在やベンダーの所在を国内で揃えたい法人・自治体にとって、API/オンプレミスの両対応は判断材料になります。
  • AIエージェントのバックエンド:外部ツールの呼び出しや構造化出力に対応し、エージェント用途も想定されています。

逆に、汎用的な最先端性能が要る場面では、海外の上位モデルも有力な選択肢になります。難度の高い数学やSTEM、長大なコンテキスト、Web探索を伴う調査、英語での高度なやり取り、込み入ったコード生成などは、PFN自身が改善余地を挙げている領域でもあり、現時点ではGPT・Claude・Geminiの上位モデルを選んだほうが無難なことが多いでしょう。「日本語の業務はPLaMo、汎用最先端は海外勢」と役割を分ける使い方が、現実的な落としどころになります。

使い始めるには

まず触ってみるだけなら、ブラウザのPLaMo Chatが手軽です。アプリケーションに組み込む場合は、PLaMo APIを使います。OpenAI互換のため、既存のOpenAI向けSDKやコードを流用しやすいのが利点です。本格運用ではStandardプランが基本で、登録後すぐに従量課金で使い始められます。無料のFreeプランは準備中のため、当面はリリース記念のクレジット(2026年7月31日までの新規登録で1000万トークン相当)を使って試すのが現実的です。大規模に提供したい事業者や、Reasoningの詳細な内容の確認・ガードレールの個社調整・優先処理などが必要な場合は、Providerプランの個別見積もりが対象になります。オンプレミスやAmazon Bedrock Marketplace、Snowflake経由での利用も選べます。

まとめ

PLaMo 3.0 Primeは、「日本語の扱い」「低い価格」「入力データを保存せず学習に使わない方針(Standard以上)」「国産・オンプレミスという選択肢」がかみ合う場面で、有力な候補になるモデルです。256Kへ広がったコンテキスト長や、深く考えるReasoningと速く返す非Reasoningの使い分けも、業務での実用性を高めています。

一方で、汎用的な最先端性能では海外の上位モデルが先行している場面が多く、その点はPFN自身も改善余地として開示しています。日本語の業務はPLaMoに任せ、難度の高い汎用タスクは海外モデルに振る、という使い分けが、現時点では費用対効果の高い選び方といえます。Freeプランの開始や、公表ベンチマークだけでは見えない実際の使い心地は、手元のタスクで試しながら見極めていくのがよいでしょう。

参考資料

タイトルとURLをコピーしました