SenseTime revela modelo de IA focado na velocidade para combater sanções de chips dos EUA

9

SenseTime, uma importante empresa chinesa de inteligência artificial conhecida por sua tecnologia de reconhecimento facial, lançou um novo modelo de imagem de código aberto projetado para superar os concorrentes em velocidade e eficiência. O lançamento do SenseNova U1 marca um pivô estratégico para a empresa, com o objetivo de recuperar sua posição no cenário de IA em rápida evolução, depois de ficar para trás em startups nacionais mais recentes e enfrentar ventos contrários geopolíticos significativos.

Uma mudança na arquitetura de IA

A principal inovação por trás do SenseNova U1 reside na sua capacidade de processar dados visuais diretamente, ignorando a etapa tradicional de traduzir imagens em texto para análise. De acordo com Dahua Lin, cofundador e cientista-chefe da SenseTime, esta abordagem permite ao modelo “raciocinar com imagens”, reduzindo significativamente o poder computacional necessário para a interpretação.

“Todo o processo de raciocínio do modelo não está mais limitado ao texto. Ele também pode raciocinar com imagens”, afirmou Lin.

Essa mudança arquitetônica não envolve apenas velocidade; ele aborda um gargalo crítico na robótica e no processamento visual em tempo real. Ao interpretar nativamente a desordem visual e ambientes complexos, o modelo pode permitir que os robôs tomem decisões mais rápidas e precisas em espaços físicos dinâmicos – um requisito fundamental para a próxima geração de robôs humanóides.

Navegando na escassez de chips

Um dos principais impulsionadores do último lançamento do SenseTime é a restrição contínua ao acesso à tecnologia avançada de semicondutores ocidentais. Os controlos de exportação dos EUA limitaram o acesso das empresas chinesas a chips de IA de alto desempenho, como os produzidos pela Nvidia, que são essenciais para a formação de grandes modelos linguísticos.

Para mitigar essa dependência, o SenseNova U1 foi otimizado para rodar em hardware fabricado na China. No dia do seu lançamento, dez designers nacionais de chips, incluindo Cambricon e Biren Technology, anunciaram compatibilidade com o novo modelo. Embora Lin tenha reconhecido que a empresa ainda pode contar com chips de primeira linha para certas iterações para manter a velocidade, a flexibilidade para operar em hardware doméstico fornece uma proteção crucial contra interrupções geopolíticas na cadeia de abastecimento.

A estratégia de código aberto

SenseTime disponibilizou SenseNova U1 gratuitamente em plataformas como Hugging Face e GitHub. Esta mudança alinha-se com uma tendência mais ampla entre as empresas chinesas de IA, que estão a tornar-se contribuintes cada vez mais ativos para a comunidade global de código aberto.

Lin argumenta que na atual corrida pela IA, a velocidade de iteração é mais valiosa do que o fato de um modelo ser fechado ou de código aberto. Ao lançar o modelo publicamente, a SenseTime pretende:
* Obtenha feedback rápido de pesquisadores para acelerar o desenvolvimento.
* Manter a colaboração com cientistas internacionais apesar das sanções dos EUA.
* Competir com rivais domésticos como DeepSeek e líderes ocidentais como OpenAI.

A decisão da empresa de adotar o código aberto ocorre depois de anos de luta para obter lucro e de perder terreno para novos participantes no espaço de processamento de linguagem natural. A SenseTime espera que o desenvolvimento orientado para a comunidade a ajude a alcançar os líderes da indústria.

Desempenho e aplicações futuras

Em benchmarks técnicos, o SenseNova U1 afirma gerar imagens de maior qualidade do que outros modelos de código aberto e corresponde ao desempenho dos principais modelos chineses de código fechado, como o Qwen do Alibaba. No entanto, ele ainda está atrás de modelos proprietários de primeira linha, como o GPT-Image-2.0 da OpenAI.

Apesar dessa lacuna na qualidade bruta, a principal vantagem do modelo é sua velocidade de processamento e eficiência. Seu tamanho compacto permite sua execução em computadores pessoais e smartphones, ampliando seu potencial de aplicação. Adina Yakefu, pesquisadora de IA da Hugging Face, observou que, embora a arquitetura seja ambiciosa e enfrente desafios práticos, o código aberto permite que a comunidade global teste e refine suas capacidades.

Olhando para o futuro, o SenseTime está se concentrando em aplicações em robótica e compreensão geoespacial. A empresa está colaborando com a ACE Robotics, uma startup liderada por outro cofundador da SenseTime, para integrar essas capacidades de raciocínio visual em robôs humanóides. À medida que a China experimenta um boom no desenvolvimento da robótica, a tecnologia da SenseTime poderá desempenhar um papel fundamental para ajudar as máquinas a navegar e interagir com ambientes complexos do mundo real.

Conclusão

O lançamento do SenseNova U1 pela SenseTime representa um esforço estratégico para superar restrições de hardware e atraso tecnológico por meio de inovação arquitetônica e colaboração de código aberto. Ao priorizar a velocidade e a compatibilidade de chips domésticos, a empresa pretende garantir uma vantagem competitiva nos setores de IA e robótica.