Прогресс

Проблемы с чипами Huawei заставили DeepSeek ещё отложить релиз своей модели искусственного интеллекта R2

Китайская компания DeepSeek, специализирующаяся на искусственном интеллекте, отложила релиз своей новой модели R2 из-за проблем с обучением на чипах Huawei.

В январе 2024 года, после выпуска модели R1, власти Китая поощряли DeepSeek к переходу с чипов Nvidia на процессоры Huawei Ascend. Однако, по словам трёх источников, знакомых с ситуацией, стартап столкнулся с непреодолимыми техническими трудностями при обучении R2 на чипах Ascend.

В результате, компания была вынуждена использовать чипы Nvidia для обучения модели и чипы Huawei – для вывода (инференса).

Разница между обучением и выводом важна: обучение – это процесс, в котором модель «учится» на большом наборе данных, а вывод – это использование уже обученной модели для получения прогнозов или ответов, например, на запросы чат-бота.

Задержка релиза напрямую связана с этими трудностями, что уже привело к потере DeepSeek позиций на рынке по сравнению с конкурентами.

Источник: NurPhoto / Contributor

Ситуация усугубляется недавними …

Ссылка на первоисточник

Понравилась статья? Подпишитесь на канал, чтобы быть в курсе самых интересных материалов

iXBT.com

Свежие комментарии

Прогресс

Проблемы с чипами Huawei заставили DeepSeek ещё отложить релиз своей модели искусственного интеллекта R2