
DeepSeek відтермінувала запуск своєї нової моделі R2 через технічні проблеми при навчанні на чипах Huawei Ascend, повідомляє Financial Times.
- За даними FT, під час тренування R2 виникали постійні проблеми на чипах Ascend, через що компанія змушена була використовувати Nvidia для навчання моделі, а Ascend — лише для inference (генерації відповідей).
- Запис підкреслює складнощі китайських розробників AI у зменшенні залежності від американських технологій, зокрема чипів Nvidia. Раніше в Китаї заохочувалось використання Ascend, особливо на тлі обмежень експорту американських чипів в країну.
- Навіть після того, як у липні США дозволили продаж чипів Nvidia H20 у Китаї, влада КНР вказувала на ризики безпеки при використанні американських чипів у критичних AI-проєктах.
Nvidia H20 залишається найпопулярнішим AI-чипом у Китаї, попри спроби Huawei і держави просувати Ascend. Лінійку Ascend США внесли до чорного списку через використання обмежених американських технологій при розробці.
Попередня модель DeepSeek, R1, розроблялася переважно на чипах Nvidia і стала проривом у китайському AI-секторі на початку року.
H20 також використовують інші великі розробники AI у Китаї, включно з ByteDance, Tencent та Alibaba.