Шумиха вокруг китайской языковой модели DeepSeek сначала поднялась на фоне её сравнения с GPT при мизерных затратах времени и средств на обучение, а затем на фоне того, что при создании этой нейросети, возможно, были использованы украденные наработки OpenAI. Теперь же сообщается, что правительство США инициировало расследование.

Суть расследования будет заключаться в том, не приобрела ли DeepSeek графические процессоры Nvidia через посредников в Сингапуре, обойдя экспортные ограничения США.
DeepSeek, конечно, не раскрывает конкретное оборудование, используемое для обучения своей модели, однако ранее компания указывала, что использовала ограниченное количество графических процессоров Nvidia H800 для обучения своей модели V3 с 671 млрд параметров всего за два месяца. Вероятно, для обучения R1 использовалась намного более мощная система.
Nvidia уже отреагировала на запуск расследования, заявив, что соблюдает все экспортные ограничения, но в случае Китая мы уже не раз …
Свежие комментарии