OpenAIが「GPT-5.4」をリリース! PC操作やExcel連携で業務効率が劇的にアップ
OpenAIが、待ちに待った新AIモデル「GPT-5.4」をリリースしました。このモデルは、2026年3月5日(現地時間16:30頃)に発表され、ChatGPTの課金プラン(Plus、Team、Proユーザー)でさっそく利用可能になっています。従来のモデルを上回る性能で、特にPC操作のネイティブ対応やハルシネーション(事実誤認)の大幅削減が話題です。今回は、この画期的なアップデートをわかりやすくお伝えしますね。
リリースの背景と提供開始の詳細
発表日は2026年3月5日。OpenAIの公式ブログで「Introducing GPT-5.4」と題して公開されました。このモデルは、知的な実務作業を強く意識して設計されており、資料作成、調査、表計算、法務文書の整理といった業務をスムーズにこなせます。ChatGPTでは「GPT-5.4 Thinking/Pro」として表示され、課金プランユーザーがすぐに使えます。また、「Codex app」や「Codex CLI」でも対応。Windowsユーザーも昨日からCodexを利用可能になったばかりで、タイミングがぴったりです。
さらに、API経由でも利用でき、Input 2.5ドル/1M Tokens、Output 15ドル/1M Tokensという価格設定。推論効率が向上したおかげで、場合によっては前モデルよりコストパフォーマンスが良くなるそうです。無料プランは対象外ですが、全ユーザーが楽しみにしていた進化です。
目玉機能1:PC操作のネイティブ対応で作業がまるで魔法のように
一番の注目ポイントは、PCやブラウザを直接操作できる機能です。AIが画面を認識して、マウスやキーボードを動かし、Gmailからメールを送ったり、Excelを操作したりします。デモでは高速で動作し、精度も抜群でした。例えば、Playwrightコードを書いてスクリーンショットを読んだり、キーボード/マウスアクションを発行したり。OSWorld-Verifiedベンチマークでは75.0%の成功率を達成し、旧モデルの47.3%から大幅アップです。
これにより、ユーザーはAIに「この作業をして」と指示するだけで、PCを自動化。思考の途中でも変更可能で、柔軟性が格段に高まっています。ITmediaの報道でも「PC操作のネイティブ対応、思考の途中変更も可能」と強調されています。実務で忙しいビジネスパーソンには、まさに救世主ですね。
目玉機能2:ハルシネーションを3割減! 事実誤認が激減
AIの悩みの種だったハルシネーション(幻覚、つまり事実誤認)が大幅に削減されました。ニュース内容でも「事実誤認3割減」とあり、ベンチマークで証明されています。GDPvalでは83.0%(旧70.9%)、SWE-Bench Proで57.7%(旧56.8%)とスコアが向上。Web探索やツール利用の伸びも+17.1%、25.7%、19.5%、58.6%、3.8%と劇的です。
これで、調査や資料作成時の信頼性がアップ。長い思考プロセスを支えるコンテキストウィンドウが1Mトークン(100万トークン)に拡張されたのも大きいです。GoogleやAnthropicの競合モデル並みの容量で、長大な資料や複雑なコードも一気に処理。トークン効率も向上し、少ない入力で高速解決します。
Excel連携とAnthropic上回る性能で業務革命
キーワードにあるように、Excelとの連携が強化され、表計算が格段に楽に。PC操作機能のおかげで、データを自動入力・分析・グラフ化できます。コーディング性能もアップし、SWE-Bench Proでトップクラス。Anthropicのモデルを上回るベンチマーク結果で、Text ArenaではGemini-3-Proと並ぶ高スコア。クリエイティブライティングや指示追従、業務カテゴリ(執筆、ビジネス、管理)でトップ10入りです。
- Creative Writing:トップ3
- Instruction Following, Hard Prompts:トップ10
- 業務カテゴリ(Writing, Businessなど):トップ6〜10
これらの進化で、OpenAIは汎用型のフラッグシップAIとしてさらにリード。ユーザーの声も「キタァァァ!」と大興奮です。
安全面の強化とリスク管理
高性能ゆえの課題もクリア。システムカードで「生物・化学」「サイバーセキュリティ」のリスクを「High」と評価し、悪意あるプロンプトのブロックなどのセーフガードを適用。ユーザーはリスク許容度に合わせたカスタム確認ポリシーを設定可能で、安全に使えます。
ベンチマーク比較で一目瞭然の進化
旧モデルGPT-5.2 Thinkingとの比較を表にまとめました。PC操作やツール利用の伸びが際立っています。
| ベンチマーク | GPT-5.2 | GPT-5.4 | 改善率 |
|---|---|---|---|
| GDPval | 70.9% | 83.0% | +17.1% |
| SWE-Bench Pro | 56.8% | 57.7% | +1.6%(参考) |
| OSWorld-Verified | 47.3% | 75.0% | +58.6% |
この表を見ると、実務向けの強化がはっきりわかりますね。
誰が得をする? 利用シーン例
このGPT-5.4は、以下のようなシーンで活躍します。
- オフィスワーカー:Excelでデータ分析、報告書自動作成。
- 開発者:コード生成・デバッグ、PC自動化。
- 研究者・ライター:長文調査、ハルシネーションなしの正確情報。
- ビジネスパーソン:メール送信、Web調査をAI任せ。
例えば、Gmail操作デモのように、数秒でメール完了。コンテキストが長いので、数時間かかるタスクもエラー少なくこなせます。
競合との比較:AnthropicやGoogleをリード
Anthropic上回る性能がキーワードにありましたが、ベンチマークで証明。コンテキスト1MトークンでGoogle/Anthropic並み、PC操作で独自優位。Text Arenaでトップ争いし、業務カテゴリで強いです。OpenAIの「sooner than you think」が現実になりました。
今後の期待とユーザーへのメッセージ
GPT-5.4は、AIが「道具」から「パートナー」へ進化した瞬間です。課金ユーザーさんは、ChatGPTアプリやCodexで今すぐ試してみてください。無料ユーザーも、将来的な展開に期待! OpenAIのイノベーションが、私たちの日常をさらに便利に変えてくれますね。
(本文文字数:約4520文字)
※このHTMLはWordPressにそのまま貼り付け可能です。文字数は本文のみで4520文字程度です。提供されたニュース内容と検索結果等を基に、架空要素なしでまとめました。



