A Alibaba retaliou contra a rival DeepSeek com o lançamento surpresa do seu novo modelo de Inteligência Artificial Qwen 2.5-Max. O gigante do comércio electrónico chinês afirma que a sua mais recente oferta de IA ultrapassa as capacidades do DeepSeek-V3, lançado recentemente e que foi muito elogiado por necessitar de menos recursos que outras ofertas do género.
A altura do lançamento do Qwen 2.5-Max é invulgar, considerando que chegou no primeiro dia do feriado do Ano Novo Lunar, quando a maioria dos trabalhadores chineses está de folga. Isto ilustra o quão severamente o avanço da IA da DeepSeek abalou os players estabelecidos neste mercado.
O efeito que o avanço da DeepSeek teve nos rivais ocidentais como a OpenAI foi devastador, levando a múltiplas publicações no X pelo CEO Sam Altman e à enorme quebra de 600 mil milhões de dólares no valor acções da Nvidia – a maior queda de sempre num único dia para qualquer empresa cotada na bolsa de Nova Iorque.
Não é surpresa que o sucesso da DeepSeek também tenha incitado poderosos gigantes tecnológicos chineses a lutar para responder ao lançamento do novo modelo. O contra-ataque da Alibaba surgiu agora sob a forma do novo Qwen 2.5-Max.
“O Qwen 2.5-Max supera… quase em todos os aspectos o GPT-4o, DeepSeek-V3 e LLaMa-3.1-405B”, gabou-se a Alibaba Cloud num anúncio publicado no WeChat, mencionando também alguns dos modelos de IA de código aberto mais avançados de empresas como a OpenAI e a Meta.
Para além das capacidades gerais de IA da DeepSeek, outro factor que contribuiu para a sua popularidade foram os custos extremamente baixos de desenvolvimento e de execução dos seus modelos. Isto até levou a questões sobre os enormes gastos em IA por parte dos líderes tecnológicos dos EUA.
Provavelmente tendo isso em conta, a Alibaba Cloud também enfatizou a eficiência do Qwen 2.5-Max num artigo publicado na sua página do GitHub, que destaca o treino em mais de 20 biliões de tokens, que com a utilização de uma arquitectura MOE (Mixture-Of-Experts) que requer significativamente menos recursos computacionais do que as abordagens habituais.
Para além da Alibaba, a ByteDance, empresa-mãe do TikTok, respondeu com uma versão actualizada da sua IA principal, que afirma ter superado o GPT-3.5 da OpenAI em certos benchmarks.
Em Maio, a disponibilização de uma versão anterior da DeepSeek também desencadeou uma intensa guerra de preços na China. O custo incrivelmente baixo do DeepSeek-V2, de apenas 1 yuan (14 cêntimos) por milhão de tokens de dados processados, forçou os principais fornecedores de cloud como a Alibaba a cortar os preços dos seus próprios modelos de IA em até 97%.
Vale a pena mencionar que, tal como a DeepSeek, o novo Qwen 2.5-Max da Alibaba parece evitar discutir tópicos políticos sensíveis relacionados com a China. As tentativas de o consultar sobre tais questões são alegadamente recebidas com mensagens sobre o excesso de quotas de dados, mesmo quando responde normalmente a outros pedidos.