「推論モデルがユーザーにバレないように不正する現象」の検出手法をOpenAIが開発

投稿日：2025年3月11日

強化学習をしていると、「報酬ハッキング」と呼ばれる、意図しない抜け穴を利用する動作がみられます。複雑なAIほど複雑な報酬ハッキングを行うため、「複雑な報酬ハッキングで引き起こされた誤動作」を見つけるのは非常に難しいのですが、OpenAIは、報酬ハッキングを監視するための新たな手段を開発したとのことです。

続きを読む...

Source: GIGAZINE（ギガジン）最新情報

-その他趣味
-Affiead

おすすめ記事一覧

: 2025年1月23日のヘッドラインニュース

ミスタードーナツが2025年1月29日(水)からベルギー王室御用達のショコラティエ「PIERRE MARCOLINI」と共同開発した「misdo meets PIERRE MARCOLINI 第2弾」 ...

: Amazonで売上トップ10のGIGAZINE記事ランキング2025年1月版はコレ、Pixel Buds Pro 2やiPhone 16 Proなどガジェット系レビューが上位に

トップ画像は、メキシコの首都・メキシコシティの中心地にあるバスコンセロス図書館です。続きを読む... Source: GIGAZINE（ギガジン）最新情報

: 2025年3月31日のヘッドラインニュース

「日清カレーメシ」とTVアニメ「ゆるキャン△ SEASON 3」のコラボ企画が2025年4月7日(月)からスタートします。今回のコラボは、対象商品を2食以上購入した人の中から抽選で、キャンプの荷物運び ...

: テスラのオートパイロットとFSDが数百件の衝突事故と数十件の死亡事故に関連していることが明らかに

現地時間の2024年4月25日にアメリカ運輸省道路交通安全局(NHTSA)が公開した調査報告書により、電気自動車メーカー・テスラのオートパイロットやフルセルフドライビング(FSD)は、これまで数百件の ...

: 電気自動車はガソリン車より大幅にエネルギー効率がいい、その理由とは？

電気自動車とガソリン車の違いは、単にモーターを動かすために使用されるのが電力かガソリンかという点だけでなく、「エネルギー効率」の点でも両者には大きな違いがあります。実は、電気自動車のエネルギー効率はガ ...

: 言語学者ノーム・チョムスキーが脳卒中のため入院中、コメントを求めずそっとしておいて欲しいと元助手が意見表明

ロシアによるウクライナ侵攻や、イスラエルとハマスの武力衝突などへの意見表明でも知られる言語学者のノーム・チョムスキー氏が2023年に脳卒中を起こし、入院していることがわかりました。元助手のベヴ・ストー ...

PREV: 【Hothotレビュー】デスクトップCPU最強の座に君臨する「Ryzen 9 9950X3D」をベンチマーク
NEXT: 【山口真弘の電子書籍タッチアンドトライ】レアな縦横比7:5は電子書籍利用に最適。11.4型タブレット「OPPO Pad Neo」を試す

Copyright© スマホトレンド（Trend）情報サイト , 2025 AllRights Reserved.