SenseTime представляет сверхбыструю ИИ-модель в ответ на американские санкции

1

SenseTime, ведущая китайская компания в сфере искусственного интеллекта, известная своими технологиями распознавания лиц, выпустила новую открытую модель для обработки изображений, способную превзойти конкурентов по скорости и эффективности. Запуск SenseNova U1 знаменует собой стратегический поворот для компании: она стремится вернуть свои позиции на быстро меняющемся рынке ИИ после того, как отстала от более молодых внутренних стартапов и столкнулась с серьезными геополитическими трудностями.

Изменение архитектуры ИИ

Ключевая инновация SenseNova U1 заключается в способности напрямую обрабатывать визуальные данные, обходя традиционный этап перевода изображений в текст для анализа. По словам Дахуа Лина, сооснователя и главного ученого SenseTime, такой подход позволяет модели «рассуждать с помощью изображений», что значительно снижает вычислительную нагрузку, необходимую для интерпретации.

«Процесс рассуждений модели больше не ограничен текстом. Она также может рассуждать, используя изображения», — отметил Лин.

Это изменение архитектуры направлено не только на увеличение скорости; оно решает критическую проблему в робототехнике и обработке визуальных данных в реальном времени. Нативно интерпретируя визуальный шум и сложные окружения, модель может помочь роботам принимать более быстрые и точные решения в динамичных физических пространствах — ключевое требование для следующего поколения человекоподобных роботов.

Преодоление дефицита чипов

Одним из главных факторов, стимулировавших выход новой разработки от SenseTime, являются продолжающиеся ограничения на доступ к передовым западным полупроводникам. Экспортный контроль США ограничил доступ китайских компаний к высокопроизводительным ИИ-чипам, таким как продукты Nvidia, которые необходимы для обучения больших языковых моделей.

Чтобы снизить эту зависимость, SenseNova U1 была оптимизирована для работы на китайском оборудовании. В день выхода модели десять отечественных разработчиков чипов, включая Cambricon и Biren Technology, объявили о совместимости с новой разработкой. Хотя Лин признал, что для поддержания максимальной скорости компания может все еще полагаться на чипы высшего класса, возможность работы на отечественном оборудовании создает важный буфер против сбоев в цепочках поставок, вызванных геополитикой.

Стратегия открытых источников

SenseTime сделала SenseNova U1 свободно доступной на таких платформах, как Hugging Face и GitHub. Этот шаг соответствует более широкой тенденции среди китайских ИИ-компаний, которые становятся все более активными участниками глобального сообщества открытых источников.

Лин утверждает, что в текущей гонке ИИ скорость итераций важнее, чем вопрос о том, является ли модель закрытой или открытой. Публикуя модель, SenseTime стремится:
* Быстро получать обратную связь от исследователей для ускорения разработки.
* Поддерживать сотрудничество с международными учеными, несмотря на санкции США.
* Конкурировать как с внутренними соперниками, такими как DeepSeek, так и с западными лидерами, такими как OpenAI.

Решение компании перейти к открытым источникам принято после нескольких лет борьбы за прибыльность и потери позиций на рынке обработки естественного языка перед новыми игроками. SenseTime надеется, что разработка силами сообщества поможет ей догнать лидеров отрасли.

Производительность и будущие применения

По результатам технических тестов, SenseNova U1 утверждает, что генерирует изображения более высокого качества, чем другие модели с открытым исходным кодом, и сопоставима по производительности с ведущими китайскими закрытыми моделями, такими как Qwen от Alibaba. Однако она все еще уступает передовым проприетарным моделям, таким как GPT-Image-2.0 от OpenAI.

Несмотря на этот разрыв в «сыром» качестве, главное преимущество модели — ее скорость обработки и эффективность. Компактный размер позволяет запускать ее на персональных компьютерах и смартфонах, что расширяет спектр потенциальных применений. Адина Якефу, исследователь ИИ из Hugging Face, отметила, что, хотя архитекция амбициозна и сталкивается с практическими сложностями, открытый исходный код позволяет глобальному сообществу тестировать и улучшать ее возможности.

В перспективе SenseTime фокусируется на применениях в робототехнике и геоподпространственном понимании. Компания сотрудничает с ACE Robotics, стартапом, возглавляемым другим сооснователем SenseTime, чтобы интегрировать эти возможности визуального рассуждения в человекоподобных роботов. Учитывая бум в разработке робототехники в Китае, технология SenseTime может сыграть ключевую роль в помощи машинам в навигации и взаимодействии со сложными средами реального мира.

Заключение

Выпуск SenseNova U1 от SenseTime представляет собой стратегические усилия по преодолению аппаратных ограничений и технологического отставания благодаря архитектурным инновациям и сотрудничеству в сфере открытых источников. Делая ставку на скорость и совместимость с отечественными чипами, компания стремится получить конкурентное преимущество как в секторе ИИ, так и в робототехнике.