به‌گزارش سایت arXiv، محققان آزمایشگاه ملی Oak Ridge در آمریکا توانستند یک مدل زبانی بزرگ و در ابعاد GPT-4 را تنها با ۸ درصد از گرافیک AMD مدل MI250X موجود در ابرکامپیوتر Frontier آموزش دهند.

 ابرکامپیوتر Frontier مجهز به ۹,۴۷۲ پردازنده‌ی AMD مدل Epyc 7A53 و ۳۷٬۸۸۸ پردازنده‌ی گرافیکی AMD مدل Radeon Instinct است. گروه تحقیقاتی آزمایشگاه ملی Oak Ridge به‌ترتیب از ۳,۰۷۲ پردازنده‌ی گرافیکی این ابرکامپیوتر برای آموزش یک مدل زبانی بزرگ با یک‌تریلیون پارامتر و از ۱,۰۲۷ پردازنده‌ی گرافیکی برای آموزش یک مدل زبانی بزرگ دیگر با ۱۷۵ میلیارد پارامتر استفاده کردند. ابرکامپیوتر Frontier در هنگام انجام آزمایش، در بهره‌وری مقیاس‌گذاری ضعیف، امتیاز کامل ۱۰۰ درصد را به‌دست آورد. این مقیاس بدین‌معنی است که با افزایش حجم کاری، تعداد پردازنده‌های بیشتری عملکرد بهینه خواهند داشت. عملکرد سریع‌ترین ابرکامپیوتر جهان در بهره‌وری مقیاس‌گذاری قوی برای اجرای دو مدل زبانی بزرگ با ۱۷۵ میلیارد و یک‌تریلیون پارامتر به‌ترتیب برابر با ۸۹ و ۸۷ درصد بود. این مقیاس به افزایش تعداد پردازنده‌ها بدون تغییر در حجم کاری اشاره می‌کند.

 در‌حال‌حاضر، Frontier سریع‌ترین کامپیوتر جهان با پردازنده‌های AMD است که از ابررایانه Aurora که تماماً از پردازنده اینتل استفاده می‌کند و ابرکامپیوتر Eagle ساخت مایکروسافت با گرافیک انویدیا قوی‌تر است.


منبع: datacenterdynamics