TextGenとは？旧text-generation-webuiの使い方・LM Studio/Ollamaとの違いを徹底解説

記事の根拠: 公式一次資料にもとづく解説・整理
本文の最終更新: 2026年5月
検証: AIツール図鑑編集部(AI自動化・ツール実運用 / 料金・規約は公式資料で確認)

TextGenは、インストール不要で動くオープンソースのローカルLLM実行アプリです。旧名はtext-generation-webui。開発者のoobabooga氏が、長く親しまれてきたこのプロジェクトを「TextGen」へと改称し、ダウンロードして展開するだけで起動するポータブル形式に作り替えました。

きっかけは海外のRedditコミュニティ（r/LocalLLaMA）での告知でした。投稿者は開発者本人で、新名称への移行と「LM Studioとの違い」を具体的に説明しています。これをきっかけに、r/LocalLLaMAの当該スレッドを中心に「LM Studioとどう違うのか」「ik_llama.cppで何が変わるのか」「商用利用してよいのか」といった点が話題になりました。ここではコミュニティの議論と公式GitHubリポジトリの情報をもとに、検索ニーズの高い論点へ順番に答えていきます。

この記事の要点

TextGenは旧text-generation-webuiの後継。インストール不要のポータブルアーカイブ（Windowsはzip、Linux/macOSはtar.gz）を展開して起動する
UIの中核はGradio。ポータブル版はそれをデスクトップ窓で包む形で、ブラウザ表示にも切り替えられる
llama.cpp / ik_llama.cpp / Transformers / ExLlamaV3 / TensorRT-LLM に対応。ただしポータブル版はGGUF（llama.cpp系）が主対象で、一部バックエンドはフルインストールが必要になる場合がある
画像入力・tool-calling・OpenAI/Anthropic互換APIに対応し、ローカルの推論先として既存アプリに差し込める
本体ライセンスはAGPL-3.0。公式は「テレメトリなし・完全オフライン」を掲げるが、Web検索や外部連携を使えば当然通信は発生する

TextGenとは？旧text-generation-webuiからの変化
TextGenの使い方｜ダウンロードから起動・モデル読み込みまで
LM Studio・Ollamaとの違い
バックエンドの選択肢とik_llama.cppの量子化
画像入力・tool-calling・OpenAI/Anthropic互換API
外部通信とプライバシーの実際
ビルドの選び方｜対応環境
料金とライセンス｜本体とモデルの両方を確認
TextGenの基本仕様
よくある質問
まとめ
参考資料

TextGenとは？旧text-generation-webuiからの変化

TextGenは、2022年末ごろにtext-generation-webuiとして公開されたローカルLLM実行ソフトが前身です。開発者はGitHubユーザー名oobabooga氏で、LLaMAや初期のllama.cppが広まる前から続く息の長いプロジェクトでした。当初はブラウザで開くWeb UIとして使われていましたが、2026年に入ってから「TextGen」へ改称し、ダウンロードして展開すればすぐ動くポータブルなデスクトップアプリへと姿を変えています。

UIの中核は引き続きGradioです。LM Studioのような独自のデスクトップアプリ型UIではなく、Gradio製の画面をベースにしている点は旧来から変わりません。ポータブル版ではそのGradio画面をデスクトップ用の窓で包んでアプリらしく見せていますが、起動オプションでブラウザ表示に切り替えることもできます。「中身はWeb UI、見た目はデスクトップアプリ」という二層構造だと理解すると分かりやすいはずです。

ローカルLLMを手元で動かす入口としては、OllamaやGemmaを使ったローカルLLMの始め方と並ぶ選択肢になります。CLIや公式アプリで使うOllamaに対し、TextGenはGradio画面で各種設定まで作り込みたい人に向いている、という住み分けです。

TextGenの使い方｜ダウンロードから起動・モデル読み込みまで

TextGenはインストーラを使いません。GitHubのリリースページから自分の環境に合うアーカイブ（Windowsはzip、Linux/macOSはtar.gz）を選び、展開してフォルダ内のtextgenを実行すると、ほどなく画面が立ち上がります（初回はファイル展開やモデル読み込みで時間がかかることがあります）。

起動までの流れはおおむね次の4ステップです。

1. zipを入手：リリースページから、GPUとOSに合ったビルド（後述）をダウンロードする
2. 展開して起動：十分な空き容量のあるドライブに展開し、textgenを実行する。WindowsとLinuxはそのまま起動できるが、macOSでは公式リリースの注記に従い、起動前に展開後のフォルダへ xattr -cr /path/to/textgen-folder を実行する
3. モデルを置く：Hugging Faceなどで入手したGGUF形式のモデルをuser_data/modelsに配置する
4. 読み込んで会話：画面のモデルタブから読み込み、チャット画面で対話を始める

設定・チャット履歴・モデルパスは、既定では同梱のuser_dataフォルダに集約されます（--user-data-dirや--model-dirで保存先を変えることもできます）。zipごと別ドライブへ移しても設定がそのまま引き継がれるため、ポータブルSSDに入れて持ち運ぶ運用にも向いています。読み込むモデルは数GB〜数十GBになるので、展開先は空き容量と転送速度に余裕のあるSSDを選ぶのが安全です。

ポータブルとはいえ動かすのはローカルのGPU・CPUです。モデルのサイズに対してVRAMやメインメモリが不足すると、読み込みに失敗したり極端に遅くなったりします。手元のGPUのVRAM容量に収まる量子化モデルから試すのが失敗の少ない入り方です。

LM Studio・Ollamaとの違い

ローカルLLM実行環境としてよく比較されるのがLM StudioとOllamaです。3者はいずれもローカル推論に使えますが、対応するモデル形式、モデル管理の方法、API互換性、外部通信の方針が異なります。違いを表で整理します。

観点	TextGen	LM Studio	Ollama
提供形態	ポータブル（zip/tar.gz・インストール不要）	デスクトップアプリ（LinuxはAppImage）	CLI＋常駐サーバ
UIの土台	Gradio（窓で包んだ表示）	独自のデスクトップアプリ型UI	CLI＋常駐サーバ。公式アプリ（mac/Win）でも操作可
バックエンド	llama.cpp / ik_llama.cpp ほか（ポータブルはGGUFが主対象）	llama.cpp（GGUF）系。Apple SiliconはMLXも対応	llama.cpp系。Apple SiliconではMLXエンジンも利用可（対応は公式で確認）
外部通信の方針	公式は「テレメトリなし」を明示	更新確認・モデル検索/取得時に通信。チャット・文書は送信しない（外部MCP/連携の追加時は別途確認）	ローカル実行は送信なし（Cloudモデル/Web検索/取得時は通信）
API互換	OpenAI / Anthropic互換	OpenAI / Anthropic互換＋独自REST	独自＋OpenAI互換＋Anthropic互換
向いている人	画面で完結＋量子化を試したい	手軽さ重視の初心者	CLIで自動化したい開発者

なお、各ツールは更新が速いため、上表は2026年6月時点の整理です（最新仕様は各公式ドキュメントで確認してください）。違いがはっきり出るのは「外部通信の方針」と「内側でどのバックエンドを選べるか」の2点です。oobabooga氏はRedditで、TextGenはテレメトリを持たないと説明し、LM Studioとの差分を強調しました。LM Studioについては、公式プライバシーポリシーで確認できる範囲を見るのが正確です。同ポリシーによれば、LM Studioは更新確認時にアプリのバージョン/ビルド・OS・IPアドレスを処理し、モデル検索時には匿名化された検索クエリを扱う一方、チャット・履歴・文書を端末外へ送信することはなく、個人を特定する追跡も行わないとされています。つまり「送信される情報の種類と量」に差がある、という整理です。CLIから手早く回したいだけならOllamaのほうが扱いやすい場面も多く、3者は競合というより用途で住み分ける関係です。

バックエンドの選択肢とik_llama.cppの量子化

TextGenの実務上の強みは、推論バックエンドを複数から選べる点にあります。公式によれば、llama.cpp・ik_llama.cpp・Transformers・ExLlamaV3・TensorRT-LLMに対応し、モデルを再起動せずに切り替えられます。ただしポータブルビルドが主対象とするのはGGUF（llama.cpp / ik_llama.cpp）で、TransformersやExLlamaV3などを使う場合はフルインストールが必要になることがあります。本家のllama.cppの仕組みに慣れている人なら、同じ画面のまま別バックエンドを試せるのは扱いやすいはずです。

なかでも話題になっているのがik_llama.cppです。これは標準のllama.cppから派生したフォークで、imatrix量子化の作者が開発しています。標準ビルドの既定はllama.cppで、ik_llama.cppは専用の-ik付きポータブルビルドを使うか、フル版で--ikフラグを付けて有効化する位置づけです。

ik_llama.cppの公式READMEは、本家にない新しい量子化形式（IQ系など）や、MoE（混合エキスパート）型モデル・CPU推論向けの最適化を掲げています。KVキャッシュ（文脈を保持するメモリ）は既定ではf16ですが、低ビットのKVキャッシュ量子化をオプションで選べ、その精度維持にHadamard回転などの工夫が用意されています。長い文脈でメモリを抑えたい場合に調整できる余地がある、という位置づけです。ただし、これらの効果が実際にどの程度かは、モデル・量子化形式・GPU/CPU構成や設定によって変わります。本記事では速度や品質を実測していないため断定は避け、低ビット圧縮でも品質を保ちたい開発者・研究者にとって「選べると選択肢が広がるバックエンド」と整理しておきます。

なお、IQ系のGGUFはコミュニティ製の配布が中心です。Hugging Face上で見つかりますが、利用時は配布者・モデルのライセンス・量子化形式・TextGen/ik_llama.cpp側の対応状況を個別に確認してください。vanilla llama.cppに慣れている人は、まず同じモデルのIQ系の版を読み込み、自分の用途で品質と速度を確かめてみるのが現実的な入り方でしょう。

画像入力・tool-calling・OpenAI/Anthropic互換API

TextGenはテキスト生成だけのツールではありません。公式の説明では、次の3つの機能が前面に出ています。

画像入力（vision）：メッセージに画像を添付し、内容を読み取らせる。対応モデルと組み合わせれば、ローカルで画像つきの問い合わせができる
tool-calling：モデルがチャット中に外部の関数を呼び出せる。標準でWeb検索・ページ取得・計算といった処理に対応する
OpenAI/Anthropic互換API：Chat・Completions・Messages のエンドポイントを備え、ローカル起動したTextGenへ既存クライアントを接続するための機能

とくにOpenAI/Anthropic互換APIは、既存アプリの推論先をクラウドからローカルへ切り替えたいときに効いてきます。OpenAIクライアントやAnthropicクライアントを使っている社内ツールなら、接続先のURLをローカル起動したTextGenに向けることで、コードの書き換えを抑えて動かせる場面があります（APIサーバは起動時に--apiで有効化し、必要に応じて--api-port・--api-keyを設定します）。ただし「互換」は既存クライアントを流用しやすいという意味で、完全な互換を保証するものではありません。対応エンドポイントやリクエスト項目、tool・visionへの対応は、モデルとTextGen側の実装に依存します。

APIを社内LANや別の端末から使う場合は、ネットワーク公開の設定に注意が必要です。既定はローカル利用に絞られています。LAN内の別端末から到達させるのが--listen、インターネットから到達できる公開URLを作るのが--public-apiや--share（外部トンネル経由）で、後者は公開範囲が大きく変わります。公開する場合は認証キー（--api-keyなど）、開放するポート、CORS設定、公開先を必ず確認し、ローカル利用とネットワーク公開ではリスクがまったく異なる点を意識してください。

外部通信とプライバシーの実際

TextGenの公式説明は「完全オフライン・プライベートで、テレメトリも外部リソースもリモート更新リクエストもゼロ」と明示しています。これは標準状態の自動通信についての方針で、利用者が手動で更新確認を実行した場合などはこの限りではありません。社内データやクライアントから預かった機密文書を扱う検証では、この「自動では送信しない」という方針が判断材料になり得ます。クラウドへのアウトバウンドを禁止しているネットワーク下でも、ポータブル方式と組み合わせて使いやすい選択肢です。

ただし、これはあくまで標準状態の話です。外部通信が発生する主なケースは、前述のtool-calling（Web検索やページ取得）を有効にしたとき、MCPや拡張機能が外部サービスへ接続するとき、モデルファイルを外部サイトから取得するとき、そして--public-apiや--shareで公開URLを作ったときです。「ローカルだから何も出ない」と一律に考えるのではなく、使う機能ごとに通信の有無が変わる、と捉えるのが正確です。

第三者が外部通信を完全にゼロと断言するのは難しい一方、TextGenはソースコードが公開されているため、不安があれば送信処理を直接確認できます。クローズドソースの製品では基本的に取れない検証ルートで、これはOSSならではの強みです。

ビルドの選び方｜対応環境

リリースページで配布されるビルドは、GPUの種類とOSの組み合わせで選びます。以下は2026年6月時点の最新リリース v4.9（2026年5月公開）に基づく主な系統で、最新の対応状況はGitHub Releasesで確認してください。

ビルド	主な対象	補足
CUDA	NVIDIA GPU	RTX系の本命。CUDA 13.1以上か12.4かでビルドが分かれる
Vulkan	AMD / Intel GPU	公式リリースではAMD/Intel向け
CPU	GPUなし	低速だが動く
ROCm	Radeon系	対応GPUが限定される

NVIDIA GPUのWindows / Linux環境なら、第一候補はCUDAビルドです。公式リリースの注記では、nvidia-smiで表示されるCUDA Versionが13.1以上ならcuda13.1ビルド、それ未満ならcuda12.4ビルドを選ぶ、と案内されています。GPUを持たないマシンや、まず触ってみたいだけならCPU専用ビルドが無難。VulkanビルドはAMD・Intel向けとして配布されているため、NVIDIA環境ではまずCUDA版を選び、CUDAが使えない特殊な事情があるときの代替として検討します。AMD GPU（Radeon系）のWindows / LinuxではROCmビルドが対応しますが、対応GPUが限られるため、事前にサポート対象かを確認しておく必要があります。macOSはApple Silicon用とIntel用が別に用意されており、M1以降ならApple Silicon版を選びます。

ik_llama.cppを試したい場合は、これらに加えて-ik付きのビルドが用意されています。迷ったらまず標準のCUDA版（NVIDIA環境）かApple Silicon版（Mac環境）で動作を確認し、必要に応じてVulkanや-ik版へ広げていく手順がトラブル少なめです。

料金とライセンス｜本体とモデルの両方を確認

TextGen本体はオープンソースとして公開されており、ダウンロードと利用に料金はかかりません。本体のライセンスはAGPL-3.0です。AGPLは、単に社内の端末で未改変のまま使う分には大きな制約になりにくい一方、改変版を配布したりネットワーク越しのサービスとして提供したりする場合には、ソースコード開示などの義務が関わってきます。業務で使うなら、本体のライセンスと、後述するモデル側のライセンスの両方を確認しておくのが安全です。

もう一つ注意したいのは、商用利用の可否を「TextGen本体だけで」判断できない点です。実際に動かすモデル（Llama系、Qwen系、Gemma系など）には、それぞれ別のライセンスが設定されています。研究目的のみ可、商用には別途許諾が必要、特定の業種では使用不可、といった条件が付くモデルも少なくありません。「ローカルで動かしているから自由」とは限らず、モデルごとのライセンス確認が欠かせません。

業務で使う場合は、生成物の扱いも論点になります。出力をそのまま製品に組み込むのか、社内ドキュメントの下書きに使うだけなのかで、求められる遵守の範囲が変わるためです。社内利用ガイドラインがある組織では、TextGen導入の前にライセンス確認のフローを用意しておくのが現実的です。

TextGenの基本仕様

料金	無料（本体はAGPL-3.0のオープンソース）
旧名称	text-generation-webui（oobabooga）
対応OS	Windows / Linux / macOS（Apple Silicon・Intel）
配布形式	ポータブルアーカイブ（Windows:zip / Linux・mac:tar.gz、インストーラ不要）
UIの土台	Gradio（ポータブル版はデスクトップ窓で表示、ブラウザ表示も可）
バックエンド	llama.cpp / ik_llama.cpp / Transformers / ExLlamaV3 / TensorRT-LLM（ポータブルはGGUFが主対象、一部はフルインストール要）
主な機能	テキスト生成・画像入力・tool-calling（Web検索/ページ取得/計算）
API	OpenAI/Anthropic互換（Chat / Completions / Messages）
外部通信	標準の自動通信はなし（Web検索・ページ取得・外部連携・モデル取得・手動の更新確認・公開URL作成時を除く）
データ保存先	既定は同梱の`user_data`フォルダ（`--user-data-dir`等で変更可）
入手先	GitHubリリースページ

よくある質問

Q. TextGenは日本語モデルでも動きますか？

対応する形式・アーキテクチャの日本語対応モデルであれば動きます。GGUF形式であればuser_data/modelsに置いて読み込めますが、視覚対応モデルのmmprojのような付属ファイルが要る場合や、Transformers・EXL3など複数ファイル形式を使う場合はフルインストールが必要になることがあります。量子化済みのGGUFはHugging Face上に多数公開されているので、まずは日本語に強いモデルのGGUFから試すのが手軽です。

Q. APIサーバとしても使えますか？

使えます。起動時に--apiを付けてAPIサーバを有効化すると、OpenAI/Anthropic互換のエンドポイントが立ち、既存のOpenAI・Anthropicクライアントから接続できます。社内ツールや既存のLLMアプリの推論先を、クラウドからTextGenへ切り替える用途と相性が良い構成です。ネットワーク公開する場合は認証（--api-keyなど）やCORSの設定を忘れずに確認してください。

Q. ChatGPTやClaudeと比べて品質はどうですか？

品質は読み込むローカルモデル・量子化・プロンプト・用途で大きく変わるため、一概には言えません。本記事ではChatGPTやClaudeとの品質比較ベンチは行っていないため、用途ごとに別途評価する必要があります。一般論として、クラウドのフラッグシップ級と数十GBクラスのローカルモデルでは規模差が大きい一方、プライバシー・コスト・カスタマイズ性ではローカル側に利点があり、使い分けるのが現実的です。

Q. Ollamaから乗り換えるメリットはありますか？

画面で操作を完結させたい場合、ik_llama.cppなど複数のバックエンドを試したい場合、公式がゼロテレメトリを明示する環境を重視する場合は、乗り換える価値があります。ただしOllamaもローカル実行時のプロンプトや応答を送信するわけではないため、テレメトリの差は「自動で送信される情報の有無」という限定的な観点で捉えてください。逆に、CLIで自動化したいだけならOllamaのほうが扱いやすい場面も多く、用途次第です。

Q. インストール不要なら会社のPCで気軽に使えますか？

インストーラを使わず依存関係を同梱したポータブル方式のため、技術的には動かしやすい構成です。ただし、OS側の実行履歴やセキュリティ製品のログ、社内の資産管理ログにまで一切痕跡が残らないとは限りません。会社のPCで使う前に、利用規程と管理部門の許可、そして動かすモデルのライセンスや生成物の扱いを確認しておくのが安全です。

まとめ

TextGenは、旧text-generation-webuiを受け継いだローカルLLM実行アプリです。インストール不要のポータブル方式、Gradioを土台にしたUI、複数バックエンドを切り替えられる柔軟さ、画像入力やtool-callingといった機能、そしてOpenAI/Anthropic互換APIによる差し込みやすさが、現行版の輪郭になります。本体はAGPL-3.0で、外部通信は標準状態ではゼロを掲げつつ、Web検索や外部連携を使えば発生する、という条件付きの理解が要点です。

「LM Studioとの送信情報の差が気になる」「ik_llama.cppの量子化を試したい」「画面で完結するローカル環境がほしい」のいずれかに当てはまるなら、業務PCでの利用規程やモデルのライセンスを確認したうえで、GitHubのリリースページから自環境に合うビルドを落として試す価値があります。さらに踏み込んだ情報は、公式リポジトリのREADMEとr/LocalLLaMAでの議論を直接当たるのが、現時点で最も精度の高い情報源です。