Китайская компания DeepSeek, специализирующаяся на искусственном интеллекте, отложила релиз своей новой модели R2 из-за проблем с обучением на чипах Huawei.
В январе 2024 года, после выпуска модели R1, власти Китая поощряли DeepSeek к переходу с чипов Nvidia на процессоры Huawei Ascend. Однако, по словам трёх источников, знакомых с ситуацией, стартап столкнулся с непреодолимыми техническими трудностями при обучении R2 на чипах Ascend.
В результате, компания была вынуждена использовать чипы Nvidia для обучения модели и чипы Huawei – для вывода (инференса).Разница между обучением и выводом важна: обучение – это процесс, в котором модель «учится» на большом наборе данных, а вывод – это использование уже обученной модели для получения прогнозов или ответов, например, на запросы чат-бота.
Задержка релиза напрямую связана с этими трудностями, что уже привело к потере DeepSeek позиций на рынке по сравнению с конкурентами.

Ситуация усугубляется недавними …
Свежие комментарии