Qwen: a IA chinesa do Alibaba que promete resultados superiores ao Deepseek

De acordo com os resultados divulgados pela empresa, o desempenho do Qween estaria próximo ao de seus concorrentes americanos

Heloísa Vasconcelos
por | 29/01/2025 às 13:14

Um novo modelo da IA chinesa Qwen foi lançada para o mercado após o frenesi causado pelo Deepseek. Criado pela Alibaba Cloud (empresa irmã da AliExpress), o Qwen promete um desempenho superior ao demonstrado pelo seu concorrente chinês.

O lançamento do Qwen2.5-Max foi anunciado junto com testes de performance em diferentes ambientes de teste, incluindo Arena Hard, LiveBench, LiveCodeBench, GPQA-Diamond. Os testes atribuem uma pontuação de desempenho, considerando modelos básicos e de instrução de modelos DeepSeek V3, GPT-4o e Claude-3.5-Sonnet.

De acordo com os resultados divulgados pela empresa, o desempenho do Qween estaria próximo ao de seus concorrentes americanos e ultrapassaria a pontuação do Deepseek.

Gráfico divulgado pelo Qwen. Foto: Reprodução/ X

“Nossos modelos básicos demonstraram vantagens significativas na maioria dos benchmarks, e estamos otimistas de que os avanços nas técnicas de pós-treinamento elevarão a próxima versão do Qwen2.5-Max a novos patamares”, destacou o anúncio.

A nova IA está disponível em forma de chatbot, aplicativo e por meio de API.

Sobre a IA do Alibaba

O novo modelo foi anunciado menos de 24 horas após a empresa lançar a atualização Qwen2.5-VL. Essa versão, que já está disponível, pode executar uma série de tarefas de análise de texto e imagem, além de analisar arquivos, entender vídeos e contar objetos em imagens.

A atual versão do Qwen pode, até mesmo controlar um PC — assim como o Operator lançado recentemente pela OpenAI.

O anúncio da empresa cita as seguintes funcionalidades:

  • Reconhecimento visual: o Qwen2.5-VL não é apenas proficiente em reconhecer objetos comuns, como flores, pássaros, peixes e insetos, mas também é altamente capaz de analisar textos, tabelas, ícones, gráficos e layouts dentro de imagens.
  • Agente: o Qwen2.5-VL atua diretamente como um agente visual que pode raciocinar e direcionar ferramentas dinamicamente, sendo capaz de usar computadores e telefones.
  • Compreensão de vídeos longos e captura de eventos : O Qwen2.5-VL pode compreender vídeos de mais de 1 hora e, desta vez, tem uma nova capacidade de capturar eventos identificando os segmentos de vídeo relevantes.
  • Capaz de localização visual em diferentes formatos : o Qwen2.5-VL pode localizar objetos com precisão em uma imagem gerando caixas delimitadoras ou pontos, e pode fornecer saídas JSON estáveis ​​para coordenadas e atributos.
  • Geração saídas estruturadas : para dados como digitalizações de faturas, formulários, tabelas, etc. O Qwen2.5-VL suporta saídas estruturadas de seus conteúdos, beneficiando usos em finanças, comércio, etc.

De acordo com apuração do Techcrunch, a versão carro-chefe da atualização, Qwen2.5-VL-72B, está sob a licença personalizada do Alibaba, que exige que empresas e desenvolvedores com mais de 100 milhões de usuários ativos mensais solicitem permissão do Qwen/Alibaba antes de implementar o modelo comercialmente.

Compartilhe:
Notícias mais populares