
Nvidia внедряется в модели мира - искусственные интеллектуальные модели, которые черпают вдохновение из умственных моделей мира, которые люди естественным образом развивают.
На выставке CES 2025 в Лас-Вегасе компания объявила, что общедоступной становится семейство моделей мирового уровня, которые могут предсказывать и генерировать видеоролики, осознающие физику. Nvidia называет это семейство Моделями Фонда Мира Космоса, или Конкорантами WFM для краткости.
Модели, которые могут быть настроены для конкретных приложений, доступны из API и каталогов NGC Nvidia, GitHub и платформы разработки искусственного интеллекта Hugging Face.
“Nvidia делает доступным первую волну Конкорс-ВФМ для физического моделирования и генерации синтетических данных,” - написала компания в блоге, предоставленном TechCrunch. “Исследователи и разработчики, независимо от размера своей компании, могут свободно использовать модели Cosmos в рамках лицензии на использование Nvidia, которая разрешает коммерческое использование.”

В семействе Конкорс WFM есть несколько моделей, разделенных на три категории: Nano для низкой задержки и приложений реального времени, Super для моделей “высокой производительности” и Ultra для максимального качества и точности выводов.
Модели имеют размер от 4 миллиардов до 14 миллиардов параметров, причем Nano является самым маленьким, а Ultra - самым большим. Параметры широко соответствуют навыкам решения проблемы модели, и модели с большим числом параметров обычно выступают лучше, чем те, у которых меньше параметров.
Частью Космоса WFM, Nvidia также выпускает “модель повышения разрешения,” декодер видео, оптимизированный для дополненной реальности, и модели ограждения для обеспечения ответственного использования, а также настроенные модели для приложений, таких как генерация данных датчиков для разработки автономных транспортных средств. Эти, а также другие модели Cosmos WFM, были обучены на 9 000 триллионов токенов из 20 миллионов часов взаимодействия людей в реальном мире, окружения, промышленных, робототехнических и водительских данных, сказала Nvidia. (В искусственном интеллекте “токены” представляют собой биты изначальных данных - в данном случае видеозаписей.)
Nvidia не назвала источник этой обучающей выборки данных, но по крайней мере одно докладывает - и иск - утверждает, что компания обучалась на защищенных авторским правом видеозаписях с YouTube без разрешения.
Получив запрос на комментарий, представитель Nvidia сообщил TechCrunch, что Космос “не предназначен для копирования или нарушения каких-либо защищенных работ.”
“Космос учится так же, как учатся люди,” - сказал представитель. “Чтобы помочь Космосу учиться, мы собрали данные из различных общедоступных и частных источников и уверены, что наше использование данных соответствует как букве, так и духу закона. Факты о том, как работает мир - это то, что узнают модели Космоса - не подлежат авторским правам или контролю отдельных авторов или компаний.”
Не обращая внимания на то, что модели как Космос действительно не учатся, как учатся люди, эксперты по авторскому праву утверждают, что утверждения, подобные утверждениям Nvidia, которые поддерживаются доктриной честного использования законов, могут не выдержать правовой проверки. Вопрос о том, будут ли эти компании удерживаться, во многом будет зависеть от того, как суды решат, применимо ли честное использование, позволяющее использовать защищенные авторским правом произведения для создания чего-то нового, к обучению искусственного интеллекта.
Nvidia утверждала, что модели Космос WFM, получив текст или видеокадры, могут генерировать “контролируемые, высококачественные” синтетические данные для запуска обучения моделей для робототехники, беспилотных автомобилей и т. д.

“Парк открытых моделей Nvidia Cosmos означает, что разработчики могут настраивать WFMs с помощью наборов данных, таких как видеозаписи поездок автономных транспортных средств или роботов, перемещающихся по складу,” - сообщила Nvidia в пресс-релизе. “Модели Космос WFMs созданы для физических исследований и разработки и могут генерировать видео, основанные на физике, из сочетания входов, таких как текст, изображение и видео, а также данные датчиков робота или движения.”
Nvidia заявила, что компании, включая Waabi, Wayve, Fortellix и Uber, уже обязались протестировать Конкорс WFMs для различных случаев использования, от поиска и кураторства видео до создания моделей искусственного интеллекта для самоуправляемых транспортных средств.
“Генеративный искусственный интеллект будет двигать будущее мобильности, требуя как богатые данные, так и очень мощные вычисления,” - сказал генеральный директор Uber Дара Хосровшахи в заявлении. “Сотрудничая с Nvidia, мы уверены, что мы можем помочь ускорить сроки для безопасных и масштабируемых решений автономного вождения для индустрии.”
Важно отметить, что мировые модели Nvidia не являются “открытыми исходниками” в строгом смысле. Чтобы соответствовать одному из широко признанных определений “открытого исходного кода” ИИ, модель искусственного интеллекта должна предоставлять достаточно информации о своем дизайне, чтобы человек мог “существенно” воссоздать его, и раскрывать любую значимую информацию о своих обучающих данных, включая происхождение и способы получения или лицензирования данных.
Nvidia не опубликовала детали об обучающих данных Космоса WFM, также не предоставила все необходимые инструменты для пересоздания моделей с нуля. Возможно, поэтому техногигант ссылается на модели как “открытые”, а не открытый исходный код.
“Мы действительно надеемся, что [Космос будет] сделает для мира робототехники и промышленного искусственного интеллекта то же, что и LLama ... сделал для предприятия,” - сказал генеральный директор Nvidia Дженсен Хуанг на сцене во время пресс-конференции в понедельник.
。 。