人間による評価をシミュレートすることで高速＆安価にチャットAIの学習を進められるツール「AlpacaFarm」がスタンフォード大学のチームによって作成される

投稿日：2023年5月25日

大規模言語モデルの学習においては、実際の人間による評価をモデルの出力に反映させる「Reinforcement Learning from Human Feedback(RLHF)」が行われます。しかし、RLHFは実在の人間を使うため報酬の支払いでコストがかさんだり、フィードバックを回収するまでに時間がかかるなどの欠点が存在していました。「AlpacaFarm」は「人間がどんな評価を返すのか」をシミュレートすることで安価＆高速にRLHFを進めることができるツールです。

続きを読む...

Source: GIGAZINE（ギガジン）最新情報

-その他趣味
-Affiead

おすすめ記事一覧

: AdobeのPhotoshopやIllustratorでもテキストベースで画像やエフェクトを生成できるようになるAI「Firefly」では一体どんなことができるのか中の人に見せてもらってきた

2023年3月21日、Adobeが独自のジェネレーティブAI「Firefly」を発表しました。Fireflyは、入力したテキストをベースに自動で画像を生成したり、入力したコンテンツと類似のテクスチャや ...

: ロシア政府の関与するハッカー集団「スター・ブリザード」が用いる100以上のドメインをアメリカ司法省が押収

ロシア連邦安全保障局(FSB)の関与が確実視されているハッカー集団「スター・ブリザード」が、コンピューター詐欺や不正行為に用いていたドメイン100件以上を、アメリカ司法省が押収したことがわかりました。 ...

: 2023年8月9日のヘッドラインニュース

2023年9月から放送が始まる「仮面ライダー」シリーズ最新作「仮面ライダーガッチャード」の制作発表会見が開催されました。続きを読む... Source: GIGAZINE（ギガジン）最新情報

: 57歳のおばあちゃんシャチ「ロリータ」が水族館から放流され半世紀越しに海へと帰ることが決定

マイアミ・シークアリウムで50年以上にわたり飼育され、2022年3月に引退するまで長年にわたり優雅なショーで観客を楽しませたシャチのロリータが、家族のいる生まれ故郷の海に帰されることが決まりました。 ...

: BenQのフルHDモバイルプロジェクター「GV50」のバッテリー時間や充電時間などを調べてみた

BenQのフルHDモバイルプロジェクター「GV50」は、コンパクトな設計と本体とスタンドが回転する仕組みによりどこでも設置してどこにでも投影しやすいモバイルプロジェクターです。GV50はコンセントにつ ...

: 地球から199億km離れたボイジャー2号との通信がNASAのミスで遮断される

木星よりも遠くの外惑星および衛星の探査を目的として、1977年8月20日に打ち上げられた無人宇宙探査機がボイジャー2号です。ボイジャー2号は2018年11月に太陽圏を離脱し、2026年まで探査を継続で ...

PREV: AMD、269ドルでフルHDゲーミングに最適な「Radeon RX 7600」
NEXT: 【西川和久の不定期コラム】ベアボーンだと約3万円の激安Ryzen 5 5600H搭載ミニPC！「MINISFORUM UM560XT」

Copyright© スマホトレンド（Trend）情報サイト , 2025 AllRights Reserved.