A startup chinesa Deepseek lançou seu maior modelo de IA até o momento, um modelo de 685 bilhões de parâmetros que os observadores da indústria dizem que poderia intensificar a competição com jogadores dos EUA.
O modelo, chamado Deepseek v3.1, foi disponibilizado na plataforma de código aberto abraçando o rosto esta semana com pouca publicidade. Apesar do lançamento silencioso, os primeiros resultados de referência sugerem sugerir que o modelo realiza em pé de igualdade com as ofertas proprietárias do OpenAI e antropia.
O lançamento pode ampliar o acesso a recursos avançados de IA, ao mesmo tempo em que levanta novas perguntas sobre o equilíbrio global do poder tecnológico entre a China e os EUA. Para os líderes da TI da empresa, o lançamento levanta novas questões sobre se os modelos chineses de código aberto podem remodelar estratégias de compras que há muito se concentram nos fornecedores dos EUA.
O lançamento segue a decisão da OpenAI no início deste mês de publicar seus primeiros modelos de peso aberto desde o GPT-2, posicionado como oferecendo forte desempenho a um custo menor. O executivo-chefe Sam Altman disse à CNBC que o aumento da concorrência dos modelos chineses de código aberto, incluindo os da Deepseek, influenciou a mudança.
Fonte: Computer World












