タグ「推論コスト」の記事一覧
GoogleがGemini APIにFlexとPriorityの2つのservice tierを追加。Flexは最大50%安い代わりに遅延と信頼性を譲り、Priorityは高信頼を優先する。エージェント時代の推論コスト設計がどう変わるかを整理する。
2026年4月2日