プロンプトに大量の対話を仕込んでAIのセーフガードを回避する手法。Anthropicが公開

投稿日：2024年4月5日

　Anthropicは3日(米国時間)、大規模言語モデル(LLM)の出力結果を制御するために設けられたガードレールを回避する手法「Many-shot jailbreaking」について、研究結果を公開した。今回の研究結果公表に先立って、AI開発に関わる研究機関や競合企業などと情報を共有し、自社AIモデルにおいてはすでにいくつかの緩和策を適用したという。
Source: PC Watch・テクノロジーの総合情報サイト

-トッピクス・話題
-Affiead

おすすめ記事一覧

: エンジニア向け日本酒「ソースコード」発売　ラベルには“ソースコード”で隠しメッセージ

オンライン酒屋「クランド」を運営するKURANDは、システムエンジニア向け日本酒「ソースコード」を発売した。 Source: Trend情報

: Shokz、泳ぎながら使えるBluetooth骨伝導イヤフォン。OpenFitの廉価版も

　Shokz Japan株式会社は、オープンイヤー型イヤフォンブランド「Shokz」の新製品として、「OpenSwim Pro」および「OpenFit Air」の2製品を10日に発売する。価格は順に2 ...

: 「MacBook Air」新モデル発表　M4チップに刷新　16万4800円から　新色スカイブルーも

米Appleは3月5日、新型ノートPC「MacBook Air」を発表した。13.6インチと15.3インチモデルの2モデル展開で、チップをM3からM4に刷新している。価格は16万4800円から、3月1 ...

: 「五稜郭」や「福岡PayPayドーム」もくっきり　小型SAR衛星「ツクヨミ-I」による高精細画像公開

QPS研究所は1日、小型SAR（合成開口レーダー）衛星「ツクヨミ-I」の高精細モード（分解能46cm）で取得した地表の画像を公開した。 Source: Trend情報

: 【最新版】Thunderbolt 4/USB Type-Cドックおすすめ10選

　近年のノートPCの薄型化やUSBの多機能化にともない、PCに搭載されるインターフェイスは減少の傾向にある。特にキーボード着脱式のデタッチャブル2in1やUMPCなどでは顕著で、たとえばChromeb ...

: Threads、Xの「リスト」やBlueskyの「フィード」のような機能のテスト開始

MetaはX競合のThreadsで、Xの「リスト」やBlueskyの「フィード」に似た機能を追加するテストを開始した。Blueskyのフィードよりも簡単に設定できる。 Source: Trend情報

PREV: 【やじうまPC Watch】世界最大の天文学用デジタルカメラが完成。32億画素でダークマターや超新星を捉える
NEXT: サンワサプライ、小型軽量で折りたたみ式ハンドルを備えたポータブル電源

Copyright© スマホトレンド（Trend）情報サイト , 2025 AllRights Reserved.