На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

iXBT.com

34 подписчика

Свежие комментарии

  • Иван Николаев
    Японцы одновременно выпустили три лимитированных серии. Вот кросстрек, плюс импреза, плюс леворг. Кросстрек, конечно,...Представлен новый...
  • Юрий Стенякин
    А если учесть что компания официально ушла с российского рынка то преимущества спорныПредставлена нова...
  • Mikhail Stepanov
    Ха-ха! В то время, как российская гиперзвуковой ракета летит со скоростью около 20 тыс. км. В час!США успешно испыт...

Никакого чуда китайская нейросеть DeepSeek из себя не представляет? Затраты на её обучение могли быть в 400 раз выше заявленных

Возможно, китайская языковая модель DeepSeek, запуск которой обвалил фондовый рынок США и привёл к падению капитализации Nvidia на невероятные 600 млрд долларов, на самом деле обошлась китайской компании не в разы, а на порядки дороже, чем сообщалось. 

создано DALL-E

Напомним, затраты на обучение модели якобы составили всего 5-6 млн долларов, что поражает на фоне сотен миллионов, которые тратят западные гиганты.

Однако аналитики SemiAnalysis провели анализ имеющихся данных и сообщают, что на самом деле затраты DeepSeek были примерно на два порядка выше заявленных! 

фото SemiAnalysis 
фото SemiAnalysis 

В отчете говорится, что DeepSeek имеет около 10 000 графических процессоров Nvidia H800, предназначенных для китайского рынка, и 10 000 более дорогих чипов H100. Более того, компания инвестировала в ускорители H20, и у них есть пул ресурсов, которые DeepSeek и китайский хедж-фонд High-Flyer совместно используют для торговли, вывода, обучения и исследований. Суммарно всё это уже тянет …

Ссылка на первоисточник
наверх