Codex Record & Replay、定型業務をskill化する実務

OpenAIは、CodexにRecord & Replayを追加した。利用者がMac上で既知の手順を一度実演すると、Codexがその流れを調べ、別の仕事でも呼び出せるskillの下書きへ変える機能だ。経費申請、駐車場予約、issue作成、動画公開、定期レポート取得など、画面操作を含む反復作業が例として挙げられている。

今回の更新は、単なる画面録画ではない。重要なのは、操作列を再生するマクロではなく、いつ使うか、毎回変わる入力は何か、どの手順を踏むか、何をもって成功とするかをskillとして残す点である。Codex長時間運用で扱った継続的な仕事の設計に、現場の暗黙手順を取り込む入口が加わった。

一方で、録画中にはCodexが操作とウィンドウ内容を観察する。便利さだけを見て、実データ、認証情報、顧客情報を含む操作をそのまま記録するのは危険だ。本稿では公式資料で確認できる事実と、そこから導く日本企業向けの運用判断を分けて整理する。

事実: 一度の実演から再利用可能なskillを作る

OpenAIの公式ドキュメントによると、Record & ReplayはmacOSで利用でき、Computer Useが利用可能かつ有効であることが前提になる。初期提供地域から欧州経済領域、英国、スイスは除外されている。日本は除外地域として挙げられていないが、実際の利用可否はアカウントや組織設定で確認すべきである。

開始手順はCodex appのPluginsを開き、+メニューからRecord a skillを選ぶ。目的や補足情報を渡した後、録画許可を承認し、Mac上で対象ワークフローを実演する。完了したらメニューバー、オーバーレイ、またはCodexへの指示で録画を止める。

録画停止後、Codexは取得した流れを調べてskillを下書きする。公式資料では、生成されるskillに次の要素が含まれると説明されている。

どの状況で使うワークフローか
実行時に必要な入力は何か
どの手順に従うか
結果をどう検証するか

再実行時は新しいthreadで生成skillの利用を依頼し、アップロードするファイル、作成するissue、レポートの期間など、その回だけ変わる値を渡す。Codexは現在の環境で利用できるComputer Use、ブラウザ操作、導入済みpluginを組み合わせて仕事を進める。

これはCodex役割別プラグインで扱った既製の業務パッケージとは作成方向が逆だ。既製pluginを業務へ持ち込むのではなく、利用者がすでに知っている社内手順から再利用単位を作る。

事実: 安定した手順と明確な成功条件が前提になる

公式ドキュメントは、利用者がすでに完了方法を知っているワークフローを選ぶよう求めている。手順が安定し、成功条件が明確な作業ほどRecord & Replayに向く。逆に、正解がまだ分からない調査や、毎回判断軸が変わる承認作業を録画しても、再利用できるskillにはなりにくい。

良い録画の条件として、短く完全な実演にすること、開始前に目的と変動入力を伝えること、現実的な入力を使いながら秘密情報や機微情報を避けること、命名規則や既定値など画面だけでは見えない好みを後からskillへ補うこと、対象作業が終わった時点で録画を止めることが示されている。

skill自体は、指示、参考資料、必要に応じたスクリプトをまとめた再利用可能なワークフローである。Codexはskillの説明を手掛かりに必要なときだけ詳細を読み込む。Record & Replayは、このskillを文章だけで設計する代わりに、実演から初稿を作る経路だ。

ただし、生成されたskillは完成品とは限らない。公式資料も、録画後に隠れた好み、命名規則、既定値、判断点を明記するよう勧めている。実演には「なぜその選択肢を選んだか」が映らないため、人間が判断条件を文章で補う必要がある。

分析: 日本企業では「暗黙知の自動化」より「手順の棚卸し」と見る

ここからは分析である。

日本企業では、定型業務がマニュアルより熟練者の操作に依存している場面が多い。Record & Replayは、その暗黙知を短時間で取り出す入口になり得る。ただし、「ベテランの操作を録れば自動化できる」と考えると失敗する。録画で取れるのは画面上の動きであり、例外時の判断、承認の根拠、入力データの品質条件、業務上の責任分界までは自動では確定しない。

最初の対象には、毎回の構造が同じで、失敗しても戻せて、結果を人間が確認できる仕事が向く。たとえば、承認前の経費申請下書き、決められた項目を持つissueの作成、公開前の動画メタデータ入力、読み取り専用レポートの取得、テスト環境での確認作業である。

一方、送金確定、契約承認、本番削除、人事評価、顧客への最終送信などは初期対象に向かない。操作自体が安定していても、誤実行の影響が大きく、都度の判断と本人確認が必要だからだ。自動化の可否は反復回数だけでなく、誤りの影響、取り消し可能性、検証可能性で決めるべきである。

この観点は、Codex Developer modeと利用枠で扱ったブラウザ権限の考え方と同じだ。画面を深く観察・操作できるほど、便利さと同時に権限境界を明示する必要がある。

分析: 録画用データと本番データを分ける

Record & Replayの最大の実務リスクは、録画時に不要な情報まで見せることだ。通知、別タブ、パスワード管理画面、顧客名、メール本文、社内URL、個人情報がウィンドウに映る可能性がある。公式資料も秘密情報と機微情報を避けるよう明記している。

企業で試すなら、録画専用の環境を用意したい。ダミーの顧客、テスト用アカウント、架空の金額、サンプルファイルを使い、通知を止め、対象外アプリを閉じる。入力値は本番値ではなく、対象期間、issue title、upload fileのような変数としてskillへ残す。

さらに、録画後はskill本文をレビューする。対象システム、必要入力、許可操作、禁止操作、停止条件、確認項目、エラー時の戻り先が書かれているかを見る。画面座標や一時的なUI文言だけに依存しているなら、変更に弱い。可能な箇所はpluginや構造化された連携を使い、Computer UseはGUIでしか進められない部分へ限定するほうが安定する。

最低限、次の管理項目を持つとよい。

skill ownerと対象業務
利用するアプリ、ブラウザ、plugin
毎回変わる入力と固定ルール
書き込み、送信、公開、削除の有無
成功条件と人間の確認箇所
利用禁止データ
最終確認日とUI変更時の再検証条件

分析: 個人skillと組織配布pluginを分ける

Record & Replayは素早くskillを作る仕組みだが、組織全体へ安定配布する仕組みとは分けて考える必要がある。OpenAIは、チームへ独立した安定パッケージとして配りたい場合、複数skillを束ねたい場合、app連携やMCP server、インストール用メタデータを含めたい場合はplugin化するよう案内している。

したがって、導入は二段階がよい。第一段階では、少人数が自分の安定した作業をRecord & Replayでskill化し、数回再実行して入力・例外・検証を直す。第二段階で、複数人に同じ手順を配る価値が確認できたものだけ、owner、バージョン、依存関係、配布範囲を持つpluginへ昇格する。

組織配布では、直近のChatGPT Businessプラグイン管理で扱ったinstallation policyや役割別配布も関係する。利用者が作ったskillを無条件で全社標準にせず、個人作成、チーム検証、管理者配布の境界を持たせるべきだ。

日本企業が最初の2週間で試す手順

実証は大きな自動化プロジェクトにしなくてよい。最初の2週間は次の順序で十分である。

まず、候補業務を3件出し、手順の安定性、月間回数、誤操作の影響、取り消し可能性、結果の検証しやすさで採点する。最も低リスクで、毎回10〜20分かかる作業を1件だけ選ぶ。

次に、テストデータで短く完全な実演を録る。開始前に目的、変動入力、禁止操作をCodexへ伝える。生成後はskillを読み、見えない判断条件と停止条件を追記する。

その後、元の作成者が異なる入力で2回、別の利用者が1回再実行する。成功率だけでなく、途中で人間が直した箇所、UI変更に弱い箇所、余計な権限を求めた箇所を記録する。送信や公開の直前で止まり、人間が確認できる設計になっているかも確認する。

最後に、個人skillのまま残すか、手順書として共有するか、plugin化するかを判断する。再利用頻度が低いもの、担当者固有の好みが強いものは個人skillでよい。複数部署が使い、外部連携や配布統制が必要なものだけplugin候補にする。

まとめ

Codex Record & Replayは、Mac上の定型操作を一度実演し、再利用可能なskillの初稿へ変える。価値は単純な操作再生ではなく、現場の手順を入力、工程、検証条件のある再利用単位へ変えられることにある。

日本企業が見るべきなのは、何本のマクロを作れるかではない。録画対象を低リスク業務に絞り、テストデータを使い、生成skillを人間がレビューし、個人利用と組織配布を分けられるかである。Record & Replayを暗黙知の自動化装置ではなく、手順を棚卸し、検証可能にする入口として使うと、Computer Useとskillの価値を安全に試しやすい。

出典

Record & Replay - OpenAI Developers
Agent Skills - OpenAI Developers
Computer Use - OpenAI Developers
Using Codex with your ChatGPT plan - OpenAI Help Center

Codex Record & Replay、定型業務をskill化する実務

事実: 一度の実演から再利用可能なskillを作る

事実: 安定した手順と明確な成功条件が前提になる

分析: 日本企業では「暗黙知の自動化」より「手順の棚卸し」と見る

分析: 録画用データと本番データを分ける

分析: 個人skillと組織配布pluginを分ける

日本企業が最初の2週間で試す手順

まとめ

出典

記事情報

出典リンク

Codex Record & Replay、定型業務をskill化する実務

事実: 一度の実演から再利用可能なskillを作る

事実: 安定した手順と明確な成功条件が前提になる

分析: 日本企業では「暗黙知の自動化」より「手順の棚卸し」と見る

分析: 録画用データと本番データを分ける

分析: 個人skillと組織配布pluginを分ける

日本企業が最初の2週間で試す手順

まとめ

出典

記事情報

出典リンク

あわせて読みたい

OpenAI Codex長時間運用、実務ループ設計の要点

OpenAI Codex 26.609、利用枠とブラウザ検証

OpenAI Codex役割別プラグイン、業務AI化の焦点

OpenAI Codex Windows対応、端末運用の再設計

OpenAI Codex Gartner評価、企業調達の新基準

OpenAIとSamsung全社展開、Codex統制の実務