На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

iXBT.com

34 подписчика

Свежие комментарии

  • Сергей Заболотин
    новость супер, надеюсь Корея скоро завоюет наш рынок и Китая станет меньше! круто что и официально уже у нас продают ...Названы самые поп...
  • Сергей Заболотин
    Лично для меня машина должна быть надежной и без сюрпризов. Actyon в этом плане выглядит хорошо! проверенный мотор, н...5 лет гарантии, я...
  • Иван Николаев
    Японцы одновременно выпустили три лимитированных серии. Вот кросстрек, плюс импреза, плюс леворг. Кросстрек, конечно,...Представлен новый...

Обучение модели DeepSeek R1 обошлось в сотни раз дешевле, чем обучение базовых моделей OpenAI: названа точная сумма

Китайский разработчик DeepSeek заявил, что потратил 294 000 долларов на обучение своей модели R1, что значительно меньше показателей, озвученных американскими конкурентами. 

В начале года DeepSeek произвела фурор со своей новой моделью, с тех пор компания и ее основатель Лян Вэньфэн практически исчезли из поля зрения общественности, за исключением нескольких обновлений.

 В статье в журнале Nature, где Лян указан в качестве одного из соавторов, говорится, что обучение модели DeepSeek R1, ориентированной на рассуждения, обошлось в 294 000 долларов, для чего было использовано 512 процессоров Nvidia H800. Они были разработаны компанией Nvidia для китайского рынка после того, как в октябре 2022 года США запретили компании экспортировать в Китай более мощные ИИ-чипы H100 и A100.

Сэм Альтман, генеральный директор американского гиганта искусственного интеллекта OpenAI, заявил в 2023 году, что обучение базовых моделей обошлось «гораздо дороже» 100 миллионов долларов, хотя его компания не …

Ссылка на первоисточник
наверх