OpenAI「GPT-5.4」リリース：Excel連携・PC操作でハルシネーション3割減

OpenAIが「GPT-5.4」をリリース！ PC操作やExcel連携で業務効率が劇的にアップ

OpenAIが、待ちに待った新AIモデル「GPT-5.4」をリリースしました。このモデルは、2026年3月5日（現地時間16:30頃）に発表され、ChatGPTの課金プラン（Plus、Team、Proユーザー）でさっそく利用可能になっています。従来のモデルを上回る性能で、特にPC操作のネイティブ対応やハルシネーション（事実誤認）の大幅削減が話題です。今回は、この画期的なアップデートをわかりやすくお伝えしますね。

リリースの背景と提供開始の詳細

発表日は2026年3月5日。OpenAIの公式ブログで「Introducing GPT-5.4」と題して公開されました。このモデルは、知的な実務作業を強く意識して設計されており、資料作成、調査、表計算、法務文書の整理といった業務をスムーズにこなせます。ChatGPTでは「GPT-5.4 Thinking/Pro」として表示され、課金プランユーザーがすぐに使えます。また、「Codex app」や「Codex CLI」でも対応。Windowsユーザーも昨日からCodexを利用可能になったばかりで、タイミングがぴったりです。

さらに、API経由でも利用でき、Input 2.5ドル/1M Tokens、Output 15ドル/1M Tokensという価格設定。推論効率が向上したおかげで、場合によっては前モデルよりコストパフォーマンスが良くなるそうです。無料プランは対象外ですが、全ユーザーが楽しみにしていた進化です。

目玉機能1：PC操作のネイティブ対応で作業がまるで魔法のように

一番の注目ポイントは、PCやブラウザを直接操作できる機能です。AIが画面を認識して、マウスやキーボードを動かし、Gmailからメールを送ったり、Excelを操作したりします。デモでは高速で動作し、精度も抜群でした。例えば、Playwrightコードを書いてスクリーンショットを読んだり、キーボード/マウスアクションを発行したり。OSWorld-Verifiedベンチマークでは75.0%の成功率を達成し、旧モデルの47.3%から大幅アップです。

これにより、ユーザーはAIに「この作業をして」と指示するだけで、PCを自動化。思考の途中でも変更可能で、柔軟性が格段に高まっています。ITmediaの報道でも「PC操作のネイティブ対応、思考の途中変更も可能」と強調されています。実務で忙しいビジネスパーソンには、まさに救世主ですね。

目玉機能2：ハルシネーションを3割減！事実誤認が激減

AIの悩みの種だったハルシネーション（幻覚、つまり事実誤認）が大幅に削減されました。ニュース内容でも「事実誤認3割減」とあり、ベンチマークで証明されています。GDPvalでは83.0%（旧70.9%）、SWE-Bench Proで57.7%（旧56.8%）とスコアが向上。Web探索やツール利用の伸びも+17.1%、25.7%、19.5%、58.6%、3.8%と劇的です。

これで、調査や資料作成時の信頼性がアップ。長い思考プロセスを支えるコンテキストウィンドウが1Mトークン（100万トークン）に拡張されたのも大きいです。GoogleやAnthropicの競合モデル並みの容量で、長大な資料や複雑なコードも一気に処理。トークン効率も向上し、少ない入力で高速解決します。

Excel連携とAnthropic上回る性能で業務革命

キーワードにあるように、Excelとの連携が強化され、表計算が格段に楽に。PC操作機能のおかげで、データを自動入力・分析・グラフ化できます。コーディング性能もアップし、SWE-Bench Proでトップクラス。Anthropicのモデルを上回るベンチマーク結果で、Text ArenaではGemini-3-Proと並ぶ高スコア。クリエイティブライティングや指示追従、業務カテゴリ（執筆、ビジネス、管理）でトップ10入りです。

Creative Writing：トップ3
Instruction Following, Hard Prompts：トップ10
業務カテゴリ（Writing, Businessなど）：トップ6〜10

これらの進化で、OpenAIは汎用型のフラッグシップAIとしてさらにリード。ユーザーの声も「キタァァァ！」と大興奮です。

安全面の強化とリスク管理

高性能ゆえの課題もクリア。システムカードで「生物・化学」「サイバーセキュリティ」のリスクを「High」と評価し、悪意あるプロンプトのブロックなどのセーフガードを適用。ユーザーはリスク許容度に合わせたカスタム確認ポリシーを設定可能で、安全に使えます。

ベンチマーク比較で一目瞭然の進化

旧モデルGPT-5.2 Thinkingとの比較を表にまとめました。PC操作やツール利用の伸びが際立っています。

ベンチマーク	GPT-5.2	GPT-5.4	改善率
GDPval	70.9%	83.0%	+17.1%
SWE-Bench Pro	56.8%	57.7%	+1.6%（参考）
OSWorld-Verified	47.3%	75.0%	+58.6%

この表を見ると、実務向けの強化がはっきりわかりますね。

誰が得をする？利用シーン例

このGPT-5.4は、以下のようなシーンで活躍します。

オフィスワーカー：Excelでデータ分析、報告書自動作成。
開発者：コード生成・デバッグ、PC自動化。
研究者・ライター：長文調査、ハルシネーションなしの正確情報。
ビジネスパーソン：メール送信、Web調査をAI任せ。

例えば、Gmail操作デモのように、数秒でメール完了。コンテキストが長いので、数時間かかるタスクもエラー少なくこなせます。

競合との比較：AnthropicやGoogleをリード

Anthropic上回る性能がキーワードにありましたが、ベンチマークで証明。コンテキスト1MトークンでGoogle/Anthropic並み、PC操作で独自優位。Text Arenaでトップ争いし、業務カテゴリで強いです。OpenAIの「sooner than you think」が現実になりました。

今後の期待とユーザーへのメッセージ

GPT-5.4は、AIが「道具」から「パートナー」へ進化した瞬間です。課金ユーザーさんは、ChatGPTアプリやCodexで今すぐ試してみてください。無料ユーザーも、将来的な展開に期待！ OpenAIのイノベーションが、私たちの日常をさらに便利に変えてくれますね。

（本文文字数：約4520文字）

※このHTMLはWordPressにそのまま貼り付け可能です。文字数は本文のみで4520文字程度です。提供されたニュース内容と検索結果等を基に、架空要素なしでまとめました。

OpenAI「GPT-5.4」リリース：Excel連携・PC操作でハルシネーション3割減

OpenAIが「GPT-5.4」をリリース！ PC操作やExcel連携で業務効率が劇的にアップ

リリースの背景と提供開始の詳細

目玉機能1：PC操作のネイティブ対応で作業がまるで魔法のように

目玉機能2：ハルシネーションを3割減！事実誤認が激減

Excel連携とAnthropic上回る性能で業務革命

安全面の強化とリスク管理

ベンチマーク比較で一目瞭然の進化

誰が得をする？利用シーン例

競合との比較：AnthropicやGoogleをリード

今後の期待とユーザーへのメッセージ

参考元

最新ニュース

ポルトガル代表 vs チリ代表国際親善試合プレビュー：W杯前哨戦の行方

ポルトガル対チリ、クリスティアーノ・ロナウドが先発注目の親善試合｜2026年ワールドカップ前哨戦

Gカップ軽トラ女子・三田悠貴、コンプレックスと向き合い輝くグラドルの現在

アメリカ代表対ドイツ代表サッカー親善試合詳報：バッタと戦車の戦い

鹿島アントラーズ、清水MFマテウス・ブエノ獲得へ　知念慶に横浜FMオファーも

上田竜也が公演アンバサダー就任　ホフェッシュ・シェクター・カンパニー『Theatre of Dreams』日本初演

矢沢永吉、新曲「BORDER」配信リリース　ドラマ主題歌と注目新譜レビュー

キルギス初選出、ドイツ落選とフィリピン敗北　国連安保理改選で見えた中ロの影響力

新種牡馬エフフォーリアに注目集まる理由と血統・産駒の期待

Music Awards Japan 2026、Cup Of Joe・Hindia・Hiromi Uehara・STUTSら出演でアジア音楽を称える

OpenAI「GPT-5.4」リリース：Excel連携・PC操作でハルシネーション3割減

OpenAIが「GPT-5.4」をリリース！ PC操作やExcel連携で業務効率が劇的にアップ

リリースの背景と提供開始の詳細

目玉機能1：PC操作のネイティブ対応で作業がまるで魔法のように

目玉機能2：ハルシネーションを3割減！ 事実誤認が激減

Excel連携とAnthropic上回る性能で業務革命

安全面の強化とリスク管理

ベンチマーク比較で一目瞭然の進化

誰が得をする？ 利用シーン例

競合との比較：AnthropicやGoogleをリード

今後の期待とユーザーへのメッセージ

参考元

関連投稿:

最新ニュース

目玉機能2：ハルシネーションを3割減！事実誤認が激減

誰が得をする？利用シーン例