HOME > 趣味・娯楽 > その他趣味 > 「推論モデルがユーザーにバレないように不正する現象」の検出手法をOpenAIが開発 投稿日:2025年3月11日 強化学習をしていると、「報酬ハッキング」と呼ばれる、意図しない抜け穴を利用する動作がみられます。複雑なAIほど複雑な報酬ハッキングを行うため、「複雑な報酬ハッキングで引き起こされた誤動作」を見つけるのは非常に難しいのですが、OpenAIは、報酬ハッキングを監視するための新たな手段を開発したとのことです。 続きを読む... Source: GIGAZINE(ギガジン) 最新情報 Twitter Facebook Google+ Pocket B!はてブ LINE -その他趣味 -Affiead