rtrvr.aiとTaprunは、どちらもブラウザ操作をAIに任せるエージェントツールである。名前だけ見ると似た立ち位置に見えるが、提供形態も設計の重心も違う。
比較記事でよく見かけるのが「rtrvr.aiは実行のたびにLLMを呼ぶ、Taprunは最初の一度だけ呼ぶ」という二分法。ただ、これは正確ではありません。rtrvr.aiにも操作を一度記録してゼロトークンで再実行する経路(AI Subroutines、Code-as-Plan)があり、「毎回必ず推論する」わけではない。一方のTaprunは、その再実行(リプレイ)型に特化したローカル完結のOSS。つまり両者の差は「実行時型のツールか記述時型のツールか」という製品カテゴリの差ではなく、同じ二つのモードに対して重心をどこに置くか、そしてどう提供するかの差にあります。
- rtrvr.aiは通常実行でLLMを呼ぶ実行時(runtime)型を中心に、記録・AI Subroutinesによるゼロトークン再実行も備えた、幅広いマネージド型プラットフォーム。提供形態はChrome拡張・Cloud・API・MCP・CLIなど多彩
- Taprunは「一度コンパイルすれば以後はゼロトークンで再実行」に特化したローカルファーストの無料OSS(MITライセンス)。認証情報は端末から出ず、生成物を.plan.jsonとして資産化・バージョン管理できる
- 選ぶ基準は「毎回違う操作か、同じ操作の繰り返しか」。探索や不定形タスクはrtrvr.aiのruntimeが手軽で、同一フローの反復はリプレイ型が予測しやすい。反復はrtrvr.aiのAI Subroutinesでも、Taprunの.plan.jsonでも省ける
rtrvr.aiとTaprunの違い:一目でわかる比較表
まずは両者を横並びで確認しましょう。細部は後ろのセクションで解説するので、ここでは提供形態と重心の違いを把握してください。
| 項目 | rtrvr.ai | Taprun |
|---|---|---|
| 提供形態 | マネージドSaaS(Chrome拡張・Cloud・API・MCP・CLI・WhatsApp Bot) | ローカルファーストのOSS(CLI+MCPサーバー) |
| ライセンス・料金 | 月額$9.99〜$499.99の課金(無料枠・BYOKあり/2026-06-29時点) | 無料(MITライセンス) |
| LLMを呼ぶタイミング | 通常実行は実行時。記録・AI Subroutines化したフローは再実行時の推論を省ける | 記述時(tap capture)に一度だけ。以後の実行はゼロトークン |
| 再実行(リプレイ)の持ち方 | AI Subroutines/Code-as-Plan(マネージド側で保持) | .plan.json(手元のファイルとして保持・バージョン管理可) |
| 認証情報の扱い | クラウド・拡張経由で処理 | 端末内のChromeセッションを再利用し、外部に出さない |
| 得意なワークロード | 未知サイトの探索・不定形タスク・多接点からの利用 | 同一サイトの同一フローを反復・長期運用 |
| 公称精度 | Halluminate Web Bench v1.0で81.4%(自社公表) | 実行時にLLMを介さないため同種ベンチの性質が異なる |
表を眺めると、両者は「同じ機能を別の値段で売る競合」ではないことが見えてきます。rtrvr.aiは実行時の柔軟さを軸に多くの接点と機能をまとめたマネージド型、Taprunはリプレイ型を無料・ローカルで突き詰めたOSS。料金の出方も、コストが発生するタイミングも違うので、利用量が増えたときの総額の伸び方はまったく別の形になります。
rtrvr.aiとは何か、Taprunとは何か
まず両者の中身を具体的に押さえます。名前と料金だけでは選べないので、提供している機能と前提から見ていきましょう。
rtrvr.aiの概要と提供形態
rtrvr.aiは、ウェブ上のデータ収集やワークフロー自動化を担うAIウェブエージェントのプラットフォーム。中核はDOM-native処理とSmart DOM Compressionで、ページをスクリーンショットとして丸ごとLLMへ渡すのではなく、DOMツリーを構造化データとして直接扱う。これにより、スクリーンショットをVisionモデル(GPT-4V等)へ渡すCUA型と比べて25倍のコスト効率になると自社で公表しています(Gemini Flash+DOM-native処理時の自社試算)。精度面では、自己申告のベンチマーク(Halluminate Web Bench v1.0)で81.4%の成功率を掲げています。
提供形態の幅広さも特徴です。Chrome拡張、Cloudダッシュボード、REST API、MCPサーバー、CLI、さらにWhatsApp Botまで揃える。料金は月額$9.99から$499.99までの4段階で、カード登録不要の無料枠(ウェルカムクレジット)や、自前のAPIキーを使うBYOKも用意されています(2026-06-29時点。詳細は公式の料金ページで確認)。BYOKでは、既契約のChatGPT/ClaudeにOAuthで接続して手持ちのプランで動かすこともできます。
そして見落とされがちなのが、再実行を省く経路を持っている点。AI Subroutinesは、ブラウザ操作を一度記録すると、以後はゼロトークン・決定論的に呼び出せるツールに変える機能。Code-as-Planは、ページ操作とMCPツール・クラウドブラウザ呼び出しを組み合わせたコードをエージェント自身に書かせる経路です。つまりrtrvr.aiは「実行時にLLMを呼ぶruntime型」を基本にしつつ、繰り返すフローについては推論を省ける手段も備えている、というのが正確な姿になります。
Taprunの概要と提供形態
Taprunは、Claude CodeやCursorといったMCPホストから使うローカルファーストのブラウザ自動化ツール。MITライセンスで公開されている無料のOSSで、npxで導入できる軽量なCLI(ネイティブバイナリ配布もあり)。著者は依存ゼロ・約1,800行規模と公表しています。動作は3つのコマンドで構成されます。tap captureがLLMを一度だけ走らせて対象サイトを解析し.plan.json(決定的な実行計画ファイル)を生成、tap <site>/<name>(例:tap github/trending)がそのファイルをゼロトークンで実行、tap verifyがスナップショットの同等性を検査し、equivalent/drifted/first_snapshot/unreachableの4値でサイト側の変化(ドリフト)を検知します。
設計の軸は「一度コンパイルすれば、以後は永遠にゼロトークンで再実行できる」こと。生成された.plan.jsonは決定的なプログラムとして動くので、何回実行してもLLMコストは増えません。認証まわりも特徴的で、Chrome拡張が手元のログインセッションを再利用するため、Cookieや認証トークンが端末の外に出ない構成になっています。あらかじめ用意されたtapも70以上あり、任意のURLから自作することもできます。生成(capture)時に使うAIモデルやAPIキー(Claude/OpenAI/DeepSeek/Ollama互換エンドポイント等)はtap configで設定でき、自前のキーをそのまま使えます。
rtrvr.aiと同じく、Taprunもリプレイ型の再実行を持ちます。違いはその持ち方。rtrvr.aiのAI Subroutinesがマネージド側で保持されるのに対し、Taprunの.plan.jsonは手元のファイル。Gitで差分管理し、レビューし、CI/CDに組み込める成果物として扱えます。
両者を分ける軸「LLMはいつ呼ばれるのか」
rtrvr.aiとTaprunを比べるとき、機能表の行数より上流にある軸が効いてきます。それが「LLMを実行時に呼ぶか、記述時に呼ぶか」という分岐点。この軸そのものは有効で、ワークロードに合うモードを選ぶ判断材料になります。注意したいのは、ツールがこの軸のどちらか片側に固定されているわけではない、という点です。
実行時LLM(runtime)モードの仕組み
実行時LLMは、オートメーションが動くたびにモデルを呼び出すやり方。毎回の実行が推論パスを含みます。最適化の方向は、その推論パスを軽くすること。DOM圧縮で送信トークンを減らす、アクセシビリティツリーをスクリーンショット代わりに使う、小型モデルを選ぶ、といった工夫です。
rtrvr.aiの通常の自然言語エージェント実行は、このモードに寄っています(Browser Use、Stagehand、Playwright MCPなども通常実行はこの側)。強みは柔軟性。実行のたびにLLMが現在のDOMを読んで判断するので、レイアウトが変わっても、要素が増えても、ある程度は適応できる。毎回違う指示にも対応できます。反面、通常のruntime実行では実行のたびに推論コストと推論の不確定性が発生します。
記述時LLM(authoring/リプレイ)モードの仕組み
記述時LLMは、モデルをセットアップ時の一度だけ呼び出すやり方。LLMがサイトを読んで構造を把握し、決定的なプログラムを出力する。以後はそのプログラムが動くだけで、実行時にLLMは関与しません。推論コストはゼロ、実行速度は通常のスクリプトと同等、同じ入力には同じ出力が返ります。
Taprunはこのモードを中核に据えたツールで、tap captureが.plan.jsonを生成し、以降はtap <site>/<name>がそれを実行します。rtrvr.aiも、記録機能やAI Subroutines、Code-as-Planを使えばこのモードに入れる。制約は両者共通で、対象サイトの構造が変わると再生成(re-authoring)が必要になります。Pythonとコンパイル済みCの違いに例えるなら、runtimeが「実行のたびに式を評価するインタプリタ」、authoringが「事前にバイナリへ落とすコンパイラ」に近い関係です。
リプレイ型同士で比べる:AI Subroutinesと.plan.json
「同じフローを繰り返す」用途では、rtrvr.aiもTaprunもリプレイ型で推論を省けます。ここが従来の二分法では見落とされがちな点。違いは速度ではなく、保持の仕方と運用の前提に出ます。
- 保持場所: rtrvr.aiのAI Subroutinesはマネージド側で管理される。Taprunの.plan.jsonは手元のファイルで、Gitでのバージョン管理やレビューに乗せられる
- 認証情報: Taprunは端末内のChromeセッションを再利用し、資格情報を外に出さない。社内ポリシーで持ち出しが厳しい環境では、この差が効く場面がある
- コスト: rtrvr.aiは月額プランの枠内で動く(AI Subroutines化した分は再実行コストを抑えられる)。Taprunはソフト無料で、かかるのはtap capture時のLLM API代(自前キー)のみ
- 組み込み先: rtrvr.aiはAPIや各接点からマネージドに呼べる。TaprunはMCPサーバーとしてClaude CodeやCursorと連携し、CI/CDにも載せやすい
同じ「ゼロトークン再実行」でも、マネージドの手軽さを取るか、ローカル・無料・バージョン管理可能を取るかで選択が分かれます。
料金とコスト構造|課金SaaSと無料OSSの違い
料金の前提が、そもそも揃っていません。rtrvr.aiは月額$9.99〜$499.99の課金SaaS、TaprunはMITライセンスの無料OSS。さらに「LLMをいつ呼ぶか」という設計差が、実際にかかるコストの形を決めます。
| 項目 | rtrvr.ai | Taprun |
|---|---|---|
| 提供モデル | 月額課金のSaaS | 無料OSS(MITライセンス) |
| ソフトウェア利用料 | 月額$9.99 / $29.99 / $99.99 / $499.99(無料枠・BYOKあり/2026-06-29時点) | 無料 |
| LLM推論コスト | 通常のruntime実行は都度発生(DOM圧縮で軽減)。AI Subroutines化したフローは再実行時を抑制 | tap capture時の1回のみ(自前APIキー)。以後の実行はゼロ |
| 上限の決まり方 | プランごとの月間クレジット数(Basic=1,000/Pro=3,000/Enterprise=10,000/Scale=50,000) | ソフト側の制限なし(LLM API利用は自前の従量課金) |
rtrvr.aiの課金は、実行回数に応じてコストが増える構造が基本。各プランに月間クレジット数(Basic=1,000/Pro=3,000/Enterprise=10,000/Scale=50,000クレジット/月)の上限があり、通常のruntime実行を増やせば上位プランへの移行が必要になりやすい。ただし繰り返すフローをAI Subroutines化すれば、その分の再実行コストは抑えられます。
Taprunはソフト自体が無料で、実行時コストも原理的にゼロ。.plan.jsonの生成時にLLMを呼ぶので、そこに推論コスト(自前APIキーで概ね数セント程度)が発生しますが、生成後の実行は推論を伴わないため、何回動かしてもLLM関連のコストは増えません。サブスクリプション料金そのものが存在しないので、コストはほぼ最初の生成分に集約されます。
どんなワークロードでどちらが向くか
優劣ではなく、向いている使い方が違います。判断の軸を具体的に整理します。
探索・不定形タスク
初めて訪れるサイトで「ここから商品一覧を取ってきて」「このフォームに入力して送信して」といった、事前に構造が読めない作業はruntime実行の得意分野。毎回LLMが現在のDOMを読んで判断するので、レイアウト変更にも柔軟に追従します。rtrvr.aiのようなマネージド型は、以下のような場面で噛み合います。
- 競合調査で毎回違うサイトを巡回する
- 構造が不定形で、セレクタを決め打ちできないサイト
- 1回限りのad hocな指示(「このページの価格だけ教えて」など)
- Chrome拡張やWhatsAppなど、多様な接点からすぐ使いたい
「毎回違うことをする」業務で、推論コストを払ってでも柔軟性が欲しい場面では、runtime実行が向きます。
同一フローの反復・長期運用
反対に、同じサイトの同じフローを毎日回す業務では、リプレイ型の強さが際立ちます。一度動作確認の取れた手順は、以降は推論の不確定性も都度のLLMコストも伴わずに実行できる。ここはTaprunの.plan.jsonが正面から狙う領域ですが、rtrvr.aiでもAI Subroutines化すれば同様に推論を省けます。
選択の分かれ目は、運用の前提にあります。成果物を手元でバージョン管理したい、認証情報を端末から出したくない、ソフト費を無料に抑えたい――こうした条件が重なるほどTaprunが噛み合う。逆に、APIや多接点からマネージドに呼びたい、探索と反復を一つのプラットフォームで完結させたいなら、rtrvr.aiの一体感が活きます。
どちらを選ぶか
判断はシンプルです。以下の軸で切り分けてください。
rtrvr.aiが向く人 – 毎回違うサイト・違う指示を扱う探索型の業務が中心 – Chrome拡張やWhatsAppなど多様な接点から使いたい – 探索も反復も一つのマネージド環境で完結させたい – APIやMCP経由で他のエージェントと連携したい
Taprunが向く人 – 同じサイトの同じフローを大量・長期に回す – 実行時のLLMコストを原理的にゼロにしたい – 認証情報を端末から出さず、ローカルで完結させたい – 成果物を.plan.jsonとして資産化・バージョン管理したい
両方を併用するのも現実的です。探索フェーズはrtrvr.aiで動かし、固まったフローをTaprunの.plan.jsonに落として反復に回す、という分担なら、それぞれの強みを活かせます。
よくある質問
Q. rtrvr.aiは実行のたびに必ずLLMを呼ぶのですか?
通常の自然言語エージェント実行はそうですが、必ずではありません。操作を記録したフローやAI Subroutines、Code-as-Planでは、再実行時の推論を省けます。繰り返すタスクはこの経路に寄せると、推論コストを抑えられます。
Q. rtrvr.aiとTaprunは併用できますか?
技術的に両立します。探索段階をrtrvr.aiでこなし、定型化したフローをTaprunの.plan.jsonに落とす運用は理にかなった組み合わせ。役割が重ならないので干渉もしません。
Q. 料金はどのくらい違いますか?
rtrvr.aiは月額$9.99〜$499.99の課金SaaS(無料枠・BYOKあり)。TaprunはMITライセンスの無料OSSで、ソフトウェア利用料はかかりません。Taprun側で発生するのはtap capture時のLLM API代(自前キー)くらいで、以後の実行を繰り返してもその分は増えません。最新の料金は各公式サイトで確認してください(2026-06-29時点)。
Q. Chrome拡張以外の提供形態は?
rtrvr.aiはCloudダッシュボード、REST API、MCPサーバー、CLI、WhatsAppボットと幅広く展開しています。Taprunはtap capture(生成)・tap <site>/<name>(実行)・tap verify(ドリフト検知)のCLIに加え、MCPサーバーとしてClaude CodeやCursorと連携でき、CI/CDにも組み込めます。
まとめ
rtrvr.aiとTaprunは、名前だけ見るとよく似たブラウザエージェントに見えます。けれど一方は多接点のマネージドSaaS、もう一方はローカルファーストの無料OSS。そして「実行時にLLMを呼ぶか、記述時に呼ぶか」というモードは、どちらか片方に固定された属性ではなく、両者が重心を変えて持っているものです。
rtrvr.aiは実行時の柔軟さを軸にしつつ、AI Subroutinesでリプレイも省ける幅広いプラットフォーム。Taprunはリプレイ型を無料・ローカル・バージョン管理可能の形で突き詰めたOSS。迷ったときに戻るべきなのは、自分のワークロードが「毎回違うのか、毎回同じなのか」、そして「マネージドの手軽さ」と「ローカル・無料・資産化」のどちらを優先するか、という二点です。ここを先に決めれば、選択はおのずと定まります。
参考資料
- rtrvr.ai 公式サイト(料金・ドキュメント・AI Subroutines / Code-as-Plan の説明)
- Taprun 公式サイト・GitHubリポジトリ(MITライセンス、tap capture / run / verify、.plan.json の仕様)
- Halluminate Web Bench v1.0(rtrvr.ai が自社公表に用いるベンチマーク)

