Nvidia агресивно вдосконалює своє поточне апаратне забезпечення AI, Blackwell, навіть коли вона готується до наступного покоління, Vera Rubin. Хоча очікується, що графічний процесор Rubin з’явиться лише наприкінці 2026 року, існуючі системи Blackwell вже мають значний приріст продуктивності завдяки оптимізації програмного забезпечення. Ця стратегія дозволяє підприємствам максимізувати свої інвестиції в поточну інфраструктуру, готуючись до майбутнього.
Швидка еволюція Blackwell
Nvidia не чекає появи нового апаратного забезпечення, щоб забезпечити ефективність. Архітектура Blackwell, випущена в 2024 році, вже покращується за рахунок оптимізації як для висновків, так і для навчання. Всього за три місяці Nvidia збільшила продуктивність логічного висновку Blackwell до 2,8x без будь-яких оновлень обладнання. Це досягається завдяки інноваціям у механізмі логічного висновку TensorRT-LLM, зокрема:
- Програмно-залежний запуск (PDL): Зменшує затримку запуску ядра для підвищення пропускної здатності.
- Зв’язок «усі з усіма»: спрощує передачу даних шляхом усунення непотрібних буферів.
- Прогнозування кількох токенів (MTP): Генерує кілька токенів за один прохід вперед, підвищуючи ефективність.
- Формат NVFP4: 4-бітовий формат із плаваючою комою, який зменшує пропускну здатність пам’яті без шкоди для точності.
Ці оптимізації призводять до зниження вартості мільйона токенів і збільшення пропускної здатності для хмарних провайдерів і підприємств.
Blackwell покращує навчання
Удосконалення Blackwell не закінчуються висновками. Ефективність тренувань також зросла в 1,4 рази лише за п’ять місяців завдяки оптимізованим рецептам тренувань із використанням точності NVFP4. Це демонструє відданість Nvidia безперервним інноваціям, окрім початкового розгортання апаратного забезпечення.
Віра Рубін: Наступний стрибок
Незважаючи на успіх Blackwell, Nvidia вже сподівається на Vera Rubin, випуск якого заплановано на другу половину 2026 року. Згідно з внутрішніми тестами Nvidia, Rubin обіцяє трансформаційні покращення:
- Тренуйте великі моделі на чверті графічних процесорів.
- 10x вища пропускна здатність на ват для висновку.
- Висновок за ціною у десять разів нижчою за токен.
Ці показники свідчать про те, що Vera Rubin різко знизить економічну ефективність операцій штучного інтелекту в масштабі, створивши більш потужні та ефективні моделі.
Що це означає для бізнесу?
Для організацій, які сьогодні розгортають інфраструктуру ШІ, Blackwell залишається надійною інвестицією. Існуючі розгортання можуть негайно отримати вигоду від останніх оптимізацій програмного забезпечення, що призведе до економії коштів без капітальних витрат. Однак бізнесам, які планують масштабні інфраструктурні проекти, варто враховувати Віру Рубін у своїх планах.
Ключовим висновком є те, що Nvidia пропонує поетапний підхід: максимізуйте цінність поточних розгортань Blackwell, готуючись до наступного покоління. Це не рішення «або/або», а стратегія збереження конкурентоспроможності в середовищі ШІ, що швидко розвивається.
Модель безперервної оптимізації Nvidia гарантує, що підприємства можуть отримати максимальну віддачу від своїх поточних інвестицій, водночас позиціонуючи себе на майбутнє за допомогою майбутньої архітектури Vera Rubin.
