大規模言語モデルの出力スピードを最大24倍に高めるライブラリ「vLLM」が登場、メモリ効率を高める新たな仕組み「PagedAttention」とは？

投稿日：2023年6月22日

大規模言語モデルを利用する際には、モデルそのものだけでなく、モデルを扱うためのライブラリが必要になってきます。多くの場合Transformersというライブラリが使用されていますが、「PagedAttention」という仕組みを導入した新たなライブラリ「vLLM」を利用することでスループットを最大24倍に向上できることが大規模言語モデルの研究チームによって発表されました。

続きを読む...

Source: GIGAZINE（ギガジン）最新情報

-その他趣味
-Affiead

おすすめ記事一覧

: 2024年4月18日のヘッドラインニュース

インディーゲームのパブリッシングを手がけるPLAYISMが、個人デベロッパー・Lizardryによって開発されたアドベンチャーゲーム「Refind Self: 性格診断ゲーム」のNintendo Sw ...

: なぜ人類は今このタイミングに存在しているのか？

「ブラックホールとは何なのか？」や「もし地球が丸ごと黄金になってしまったら一体何が起こるのか？」など、さまざまな事象を科学的に解説するチャンネル登録者数2000万人超のYouTubeチャンネル・Kur ...

: 2022年10月17日のヘッドラインニュース

「HUNTER×HUNTER」が2022年10月24日発売の週刊少年ジャンプ2022年47号から連載再開となることを記念して、「王位継承編」340話から370話(単行本32巻末～35巻相当)の期間限定 ...

: 2023年4月17日のヘッドラインニュース

ワコムが液晶ペンタブレット「Wacom Cintiq」シリーズの価格改定を発表しました。価格改定の実施日は2023年5月1日(月)からで、Wacom Cintiq 16は現行価格の税込7万4580円か ...

: 太陽光を利用して汚染水を迅速に飲料水に変える超高速殺菌剤が誕生、世界人口の30％が救われる革命的進歩

スタンフォード大学とSLAC国立加速器研究所の科学者が、太陽光エネルギーを用いて水媒介性感染症の原因になる細菌を殺す消毒剤を開発しました。この消毒剤は低コストかつリサイクル可能なので、安全な飲料水が利 ...

: 心理学者に学ぶ「聞き上手になるためにやるべきこと／やってはいけないこと」とは？

誰しも「相手が一方的にしゃべってきて自分の話は聞いてくれなかった」という経験をしたことがあるはず。円滑なコミュニケーションのためには、相手の話に耳を傾けるのが不可欠ですが、聞き上手になるのは簡単ではあ ...

PREV: Apple、「Vision Pro」アプリ開発向け「visionOS SDK」リリース　東京にラボ開設へ
NEXT: 「無効」「読み取れない」……「マイナ保険証」トラブル頻発、導入医療機関の65％が経験　患者から苦情も

Copyright© スマホトレンド（Trend）情報サイト , 2025 AllRights Reserved.