単体のGPUでもGPT-3などの大規模言語モデルを処理できる「FlexGen」が登場

2月 22, 2023

GPT-3などの大規模言語モデルを処理するには高い計算量とメモリが必要なため、通常は複数のハイエンドなAIアクセラレーターが求められます。この処理を、メモリ16GBのNVIDIA Tesla T4やメモリ24GBのNVIDIA GeForce RTX 3090など、メモ

from Pocket https://gigazine.net/news/20230222-flexgen/
via IFTTT

このブログを検索

もひかん

単体のGPUでもGPT-3などの大規模言語モデルを処理できる「FlexGen」が登場

このブログの人気の投稿

How to patch OS X for the bash/Shellshock vulnerability | TUAW: Apple news, reviews and how-tos since 2004

(AMD 初のSSD 「Radeon R7 SSD」は国内9月上旬発売。120GB 1万2000円前後から - Engadget...

Beatsの新型完全ワイヤレスイヤホン｢Beats Studio Buds｣は来月に発表へ