Article Brief
Claude Sonnet 5登場、8月末までに決めるAPI移行設計
目次
Anthropicは2026年6月30日、Claude Sonnet 5を公開した。ClaudeのFreeとProでは既定モデルとなり、Max、Team、Enterprise、Claude Code、Claude APIでも利用できる。APIのモデルIDは claude-sonnet-5。導入価格は2026年8月31日まで入力100万トークン当たり2ドル、出力100万トークン当たり10ドルで、その後は入力3ドル、出力15ドルへ移る。
今回の焦点は「新モデルの性能が上がった」だけではない。Sonnet 5は1Mトークンのコンテキスト、最大128kトークンの同期出力、low から max までのeffort制御を備える。一方、新しいトークナイザーにより、同じ入力でもSonnet 4.6比でおよそ1.0〜1.35倍のトークンになる可能性がある。日本企業が移行を判断するなら、表示単価ではなく、1ジョブの総トークン、ツール呼び出し、完了率、レビュー工数を測り直す必要がある。
これはClaude Opus 4.8と動的ワークフローで扱った高性能モデルの長時間運用を、より低い価格帯へ広げる更新と読める。ただし、Sonnet 5があればOpusが不要になる、という発表ではない。Anthropicは複雑さ、精度、価格のバランスをeffortとモデルの組み合わせで選ぶ構成を示している。
事実: Sonnet 5はClaude CodeとAPIを含む全主要経路で提供
Anthropicの発表によると、Sonnet 5はClaudeの全プランで提供される。FreeとProでは既定モデル、Max、Team、Enterpriseでは選択可能なモデルとなり、Claude CodeとClaude Platformにも同日から入った。APIでは claude-sonnet-5 を使う。
Claude Platformのモデル概要では、Sonnet 5は「速度と知能の最良の組み合わせ」という位置づけだ。コンテキストウィンドウは1Mトークン、同期Messages APIの最大出力は128kトークン。Claude APIだけでなく、Claude Platform on AWS、Amazon Bedrock、Google Cloud、Microsoft Foundryを含む提供経路が案内されている。ただし、モデルID、利用可能時期、エンドポイント、データ経路は提供元ごとに確認が必要だ。
企業運用では、この「どこでも同じ名前で使えるように見える」点に注意したい。Anthropic直結では claude-sonnet-5、BedrockではBedrock用のIDを使う。既存の社内LLM gatewayがモデル名を抽象化している場合も、aliasの実体、請求先、ログ、データ処理地域を確認しなければならない。
Claude Code 2.1.196の組織既定モデルとMCP安全化で見たように、企業のモデル移行は開発者が手元でモデルを選ぶだけでは終わらない。組織既定、ロール既定、クラウド経路、gateway、fallbackを含めて、どの作業がSonnet 5へ向くのかを管理側で説明できる状態が必要になる。
事実: 導入価格は8月31日まで、その後は3ドル・15ドル
Sonnet 5のAPI導入価格は、2026年8月31日まで入力2ドル、出力10ドルである。9月以降の標準価格は入力3ドル、出力15ドル。どちらも100万トークン当たりの価格だ。Anthropicは、導入期間の価格をSonnet 4.6からの移行が概ねコスト中立になるよう設定したと説明している。
ただし、ここでいうコスト中立は、すべてのアプリケーションで請求額が同じになる保証ではない。Sonnet 5は新しいトークナイザーを使い、入力内容によって同じテキストがSonnet 4.6比で約1.0〜1.35倍のトークンになる可能性がある。入力単価が下がっても、トークン数、出力長、ツール呼び出し回数、再試行回数が増えれば、1ジョブの費用は変わる。
価格比較では、単純な「入力単価×従来トークン数」を使わないほうがよい。少なくとも次の4つを実ログで測る必要がある。
- 同じ入力データの入力トークン数
- 最終回答とツール引数を含む出力トークン数
- 1ジョブ当たりのAPI呼び出し回数と完了率
- 人間の修正・再実行・レビューに要した時間
直前にはClaude Opus 4.6 fast mode削除があり、指定した速度と実際の処理条件をレスポンス側で確認する重要性が増した。Sonnet 5でも、設定ファイルにモデル名やeffortを書いた事実ではなく、実際のレスポンス、利用量、請求ログを移行証跡にするべきだ。
事実: effortは品質だけでなくツール回数と総費用に効く
Claude Platformのドキュメントでは、effortはClaudeが応答でどれだけトークンを使おうとするかを調整する信号と説明されている。Sonnet 5では high が既定で、low、medium、high、xhigh、max を選べる。単に「考える文章の長さ」だけではなく、テキスト出力、ツール呼び出し、関数引数を含む応答全体へ影響する。
公式の目安では、low は高頻度・低遅延の非コーディング用途、medium は速度・費用・性能のバランス、high は複雑な推論やコーディング、xhigh は30分を超える長時間のエージェント・コーディング作業、max はトークン制約より最大能力を優先する作業向けである。medium はSonnet 4.6の high に近い比較対象として案内されている。
このため、移行テストでSonnet 4.6とSonnet 5を比較するときは、モデル名だけでなくeffortも固定しなければ結果を読めない。Sonnet 5の既定 high をそのまま使い、従来の低コスト設定と比較すると、モデル差とeffort差が混ざる。反対に、費用だけを合わせて low に落とすと、難しいコーディングやツール利用で品質差が大きくなる可能性がある。
effortは厳密な予算上限ではない点も重要だ。low にしても難しい処理では一定の推論が行われる。厳密な費用統制には、API利用上限、ジョブのタイムアウト、最大ツール回数、キュー単位の予算、異常時の停止を別に実装する必要がある。
事実: 安全性評価は改善を示すが、自社用途の保証ではない
Anthropicは、Sonnet 5がSonnet 4.6よりエージェント文脈での望ましくない挙動を減らし、悪意ある要求の拒否、プロンプトインジェクションへの抵抗、ハルシネーション、迎合の評価で改善したと報告している。一方、Opus 4.8やMythos Previewより望ましくない挙動が多い評価もある。サイバー用途ではSonnet 5に既定の防御機構が入り、高度なサイバー作業にはOpus 4.8が推奨されている。
この記述から、「Sonnet 5ならプロンプトインジェクション対策が不要」とは言えない。公式評価は、特定の条件、データセット、実行環境で測った結果である。自社のRAG、MCP、ブラウザ、社内SaaS、コード実行権限を組み合わせたときの安全性は、自社の脅威モデルで確認する必要がある。
特に日本企業の業務エージェントでは、メール、文書、チケット、Webページの中に外部入力が混ざる。モデルがツールを使えるなら、命令として扱う情報と参照データを分離し、操作対象のallowlist、書き込み前の承認、秘密情報のマスキング、実行ログを用意したい。モデルの安全性改善は防御の一層であり、権限設計の代替ではない。
分析: 日本企業は「8月末」を評価の締切として使える
ここからは分析である。
導入価格の終了日は、値上げに備えるだけの期限ではない。7月と8月を評価期間にし、9月の標準価格でも継続価値があるかを決める締切として使える。評価を後回しにすると、安い期間の利用量だけが増え、標準価格へ移った時点で初めてジョブ単価の上昇に気づく。
まず、用途を3群に分けるとよい。
- 定型・大量処理: 分類、要約、抽出、一次回答など。
lowとmediumを中心に、レイテンシと単価を見る - 開発・エージェント処理: コード調査、修正、テスト、ブラウザ・端末操作など。
medium、high、xhighの完了率とツール回数を見る - 高リスク処理: 認証、課金、個人情報、セキュリティ、外部送信、本番変更など。モデル性能とは別に人間承認と権限制限を必須にする
次に、Sonnet 4.6、Sonnet 5、必要ならOpus 4.8を同じ実タスクで比較する。ベンチマークを読むだけでなく、日本語の仕様、社内用語、既存コード、実際のツールを使う。結果は正答率だけでなく、作業完了率、不要変更数、再試行回数、レビュー指摘数、経過時間、総トークン、標準価格換算額で残す。
Claude Sonnet 4・Opus 4退役後の移行点検で扱った通り、モデル移行ではコード中のIDだけでなく、環境変数、Secrets、CI、Notebook、gateway alias、fallback、評価基盤を棚卸しする必要がある。Sonnet 5への移行でも同じ一覧を使い、旧モデルをどこで残すか、いつ切り替えるか、戻す場合の有効期限を決めるべきだ。
実務: 8月31日までの4段階移行チェックリスト
第一段階は、7月前半の棚卸しである。Sonnet系モデルを使うアプリ、Claude Code設定、BedrockやGoogle Cloud経由、社内gateway、評価ジョブを一覧にする。用途ごとに所有者、処理データ、現在のモデル、月間件数、現在費用、失敗時の影響を付ける。
第二段階は、7月後半の並行評価である。本番トラフィックの一部を複製するか、個人情報を除いた代表タスクを用意し、Sonnet 4.6とSonnet 5を比較する。effortは明示し、同じ入力でもトークン数がどう変わるかを記録する。Claude Codeでは、完了した差分だけでなく、テスト実行、不要変更、許可要求、レビュー時間も見る。
第三段階は、8月前半の限定展開である。低リスク用途からSonnet 5へ切り替え、標準価格で月額を再計算する。導入価格で予算を作らない。1ジョブ当たり費用、成功1件当たり費用、人間のレビュー時間をダッシュボード化し、異常増加時の停止条件を決める。
第四段階は、8月後半の承認である。9月以降もSonnet 5を使う用途、別モデルに残す用途、Opus 4.8へ上げる用途を確定する。モデルID、effort、fallback、リージョン、データ保持、監査ログ、責任者を変更記録に残す。価格変更日をカレンダーへ置き、9月最初の請求確認も担当者へ割り当てる。
まとめ
Claude Sonnet 5は、Sonnet価格帯で長時間のコーディングやツール利用を広げる重要な更新だ。全主要プラン、Claude Code、APIで提供され、1Mコンテキスト、128k出力、複数のeffort段階を持つ。導入価格は2026年8月31日までで、その後は入力3ドル、出力15ドルへ移る。
日本企業の判断軸は、公式ベンチマークの順位だけではない。新トークナイザーで実トークン数が変わり、effortが出力とツール利用全体へ効く以上、実際のジョブ単位で費用と完了率を測る必要がある。7月に棚卸しと並行評価、8月に限定展開と承認を行えば、期間限定価格を単なる割引ではなく、標準価格へ移る前の検証期間として使える。
出典
- Introducing Claude Sonnet 5 - Anthropic, 2026-06-30
- Claude Sonnet 5 System Card - Anthropic, 2026-06-30
- Models overview - Claude Platform Docs
- Effort - Claude Platform Docs
Article Info
記事情報
- 著者
- Akira
- 公開日
- 更新日