流行りのClaude Code / Codex CLIを無料枠で体験!Gemini API×LiteLLMで作るローカル環境

技術

1. はじめに

現在、ターミナル上で直接動作するAIエージェントとして「Claude Code」「Codex CLI」が大流行しています。Googleからも強力な「Antigravity CLI」が提供されていますが、現状の開発者コミュニティの熱量としては前者のCLIツールが非常に大きな盛り上がりを見せています。

これらのツールは非常に便利で、一度使うと手放せなくなるほどの開発体験(UX)を提供してくれます。しかし、1つ大きな壁があります。それは「サブスクリプション費用」と「API利用料」です。

Claude Codeなどを使用するには、サブスクリプションプランへの加入かAPIキーによる従量課金が必要であり、いずれも継続的なコストが発生します。特にAPIを利用する場合、裏側でAIが自律的に大量のプロンプトを消費し推論を繰り返すため、気がつくとAPI代が数千円〜数万円にかさんでしまうことも珍しくありません。

そこで今回は、流行りのツールの使い勝手(UI/ハーネス)はそのままに、バックエンドのLLMだけを「Gemini API」に差し替えて、コストを劇的に抑えて体験する構成をご紹介します。

2. なぜGemini APIなのか?(他社APIとの比較)

なぜバックエンドにGemini APIを選ぶのでしょうか?その最大の理由は「圧倒的に太っ腹な無料枠」です。

現在のAI界隈では、以下のような壁があります。

  • Claude / Codex のサブスクリプションと他社API: Claude Codeをネイティブに使うためのClaude Proプランや、Codexを利用するためのサブスクリプションなど、毎月固定費が発生します。また、APIを直接利用する場合でも、OpenAI APIやAnthropic APIには基本的に恒常的な無料枠がなく、最初から従量課金となります。
  • Gemini API (Google AI Studio): 一方でGemini APIには、プロトタイピングや個人開発用に非常に寛大な「無料枠」が用意されており、固定費ゼロから最新のモデルを使い始めることができます。

これは推測になりますが、最先端LLMを開発している企業群の中でも、ビッグテックであるGoogleは特にインフラや資金的な余裕があるため、このような大盤振る舞いな無料枠を提供し続けられるのではないかと考えられます。この強力な無料枠を活用しない手はありません。

3. 注意点と免責事項(必ず最初にお読みください)

実際に設定へ進む前に、2つほど前提事項を共有しておきます。

  1. モデルの違いについて
    本記事の構成は、あくまで「裏で動くモデルがGemini」になる仕組みです。そのため、「本物のClaude Sonnet」等の回答精度や独特の挙動とは異なります。このハックは、あくまで「最新CLIツールの優れた操作感や体験を、ローカルで少し試してみる」ためのものとしてご理解ください。
  2. 利用規約やサポートについて
    CLIツールの接続先(Base URL)をローカルのAIゲートウェイ(プロキシ)に向けるというアプローチは、公式が想定・サポートしている使い方ではありません。企業が内部のAIゲートウェイを通すのと同じ仕組みなのでおそらく問題ないと思われますが、各ツールの仕様や利用規約は随時変更される可能性があります。あくまで「自己責任のハック」としてお楽しみください。

4. Gemini APIキーの取得と無料枠について

まずはバックエンドとなるGemini APIの準備です。

  1. Google AI Studio にアクセスし、Googleアカウントでログインします。
  2. 左側のメニューから 「Get API key」 をクリックし、新しいプロジェクトを作成してAPIキーを発行します。
  3. 発行された文字列(APIキー)をコピーしておきます。

【公式で提供されている無料枠について】
Gemini APIには無料枠が設定されており、どのモデルが無料枠の対象になるかは公式のPricingページで確認できます。

個人で少し試す程度であれば無料枠の範囲内で十分に体験できます。しかし、CLIツールが裏側で高速に自律ループを回してガンガン実行させると、無料枠の制限(Rate Limit)にすぐに引っかかる可能性があります。その場合は後述する「有料化」を検討することになります。

5. LiteLLMプロキシのセットアップ手順

次に、Claude CodeなどからのリクエストをGeminiが理解できる形に変換するためのプロキシサーバーを立てます。今回は設定済みのボイラープレートリポジトリを用意しました。

mitarasy/litellm-gemini-proxy

このリポジトリの仕組みはシンプルで、内部に LiteLLM というプロキシサーバーを抱えています。例えばClaude Codeが内部的に claude-sonnet-4-6* モデルへのリクエストを送ると、プロキシがそれを gemini-3.5-flash へのリクエストに変換してGoogleへ中継します。CLIツール側からは、まるでAnthropicのAPIを使っているように見えますが、実際にはGeminiが処理しています。

(※以降の記載は、2026年6月時点のリポジトリの内容を元にしています。新しいモデルが登場した場合は、将来的にマッピング設定などが更新される場合があります)

構築ステップ

必要なもの:Docker および Docker Compose

# 1. リポジトリのクローン
git clone https://github.com/mitarasy/litellm-gemini-proxy.git
cd litellm-gemini-proxy

# 2. 環境変数の設定
cp .env.example .env

作成した .env ファイルを開き、先ほど取得したAPIキーを設定します。

GEMINI_API_KEY=your_gemini_api_key_here
# 3. プロキシサーバーの起動
docker compose up -d

これでローカルの http://localhost:4000 でプロキシが稼働し始めます。
このリポジトリの初期設定では、主に以下のGeminiモデルが利用できるように設定されています。

  • gemini-3.1-pro-preview (※現状 gemini-3.1-pro-preview は無料枠の対象外です)
  • gemini-3.5-flash
  • gemini-3.1-flash-lite

6. 各CLIツール側の設定

あとは、各種CLIツールの通信先をこのローカルプロキシに向けるだけです。リポジトリ内にあらかじめ設定ファイルのサンプルを同梱しています。

Claude Code の場合

リポジトリ内の .claude/settings.json の内容を、ご自身の ~/.claude/settings.json に反映(マージ)してください。

この設定により、ANTHROPIC_BASE_URL がローカルを向き、ダミーのAPIキーが設定されます。これにより、Claude Codeを起動した際のリクエストがすべてGemini APIへ流れるようになります。

なお、リポジトリの設定では、Claude Codeが要求するAnthropicモデルを以下のようにGeminiモデルへマッピングしています。

  • claude-opus-4-8* 系 → Gemini 3.1 Pro Preview (※有料アカウント必須)
  • claude-sonnet-4-6* 系 → Gemini 3.5 Flash
  • claude-haiku-4-5* 系 → Gemini 3.1 Flash-Lite

Codex CLI の場合

リポジトリ内の .codex/config.toml.codex/model-catalog.local.json を、ご自身の ~/.codex/ ディレクトリに配置・反映してください。

プロバイダーとして litellm を定義し、ローカルのカタログファイルを参照することで、Geminiモデルを正常に認識させることができます。Codex CLI側では gemini-3.1-pro-previewgemini-3.5-flashgemini-3.1-flash-lite の3モデルを利用できます(なお gemini-3.1-pro-preview は無料枠対象外です)。カタログファイルに記載されているGeminiモデルの各種パラメータ(コンテキストウィンドウやトークン制限など)は、公式ドキュメント( https://ai.google.dev/gemini-api/docs/models )を参考に設定しています。

7. さらに一歩先へ:有料化とGCPクレジットの活用

先述の通り、ガンガンAIを回すと無料枠の制限にすぐ到達します。また、無料枠の場合は規約上プロンプトがモデルの学習に利用される可能性があるため、業務のコードを扱うのには適していません。

ステップ1:APIを有料化(Pay-as-you-go)する

まず、Google AI StudioのプロジェクトにGCPの請求先アカウントを紐付けることで、有料化(Pay-as-you-go)に切り替えます。「結局お金がかかるのでは?」と心配になるかもしれませんが、以下の2点から安心して利用できます。

  1. 前払い(Prepaid)方式の安心感
    ヘビーユーザー(高額利用の実績があるアカウント)にならない限り、基本的には前払い方式でクレジットを購入して利用することになります。そのため、「裏でループが暴走して、後でとんでもない数十万円の請求が来る」といった事故は起きません。
  2. 学習データとしての利用が免除される(プライバシー保護)
    有料アカウントに切り替えることで、入力したプロンプトが学習データとして利用されなくなります。

【有料化の手順】

  1. Google Cloudコンソールで「請求先アカウント」を作成します。
  2. Google AI Studioに戻り、使用しているプロジェクトに対して、先ほどの請求先アカウントを紐付けます(これでAPIキーが有料版にアップグレードされます)。

【⚠️ 注意点(未検証事項)】
有料化設定後、実際に無料枠を超えたAPIコールを行う際、「最低限は自分で前払いクレジット(数ドル)を購入して残高がないと、APIが利用できない」可能性があります。後述するGCPクレジットの残高がある場合でも、前払いクレジットの残高が「0」の状態でそちらを優先して消費してくれるかどうかは現時点で未検証です。必要に応じて少額の前払いチャージを行ってから利用してください。

ステップ2(任意):Google AI プランのGCPクレジットでコストをさらに圧縮

すでに「Google AI Pro」や「Google AI Ultra 5x/20x」といったGoogle AIプランのサブスクリプションに加入している場合は、特典としてGoogle Cloud(GCP)クレジットが毎月付与されます。これを有料化した請求先アカウントに適用することで、Gemini APIの実質的なコストをさらに下げることができます。

  • Google AI Pro: 毎月 $10 分のクレジット
  • Google AI Ultra 5x: 毎月 $40 分のクレジット
  • Google AI Ultra 20x: 毎月 $100 分のクレジット

Developer Programの特典ページ(またはGoogle AIプランの特典ページ)から、GCPクレジットをご自身の請求先アカウントに紐付けて適用してください。月々のサブスク費用分を実質的にAPI代に充当できるため、すでにGoogle AIプランを利用している方には特にお得な組み合わせです。

8. おわりに

Claude CodeやCodex CLIは優れたUIと操作感を持ちながら、バックエンドをGemini APIに差し替えることで、コストを大幅に抑えて体験できます。完全無料というわけではありませんが、個人で少し使う程度であれば無料枠で十分賄えますし、ヘビーに使いたくなってきたら有料化やGCPクレジットの活用も選択肢として用意されています。

CLIツールの使用感や自律ループの体験を気軽に試せる環境として、ぜひ活用してみてください!

コメント

タイトルとURLをコピーしました