Um modelo de raciocínio para rivalizar com o GPT-4 a 0,5% do custo-computação

“Toda a fase de aprendizado de reforço usou apenas 512 H800s por três semanas, com um custo de aluguel de apenas US $ 534.700”, explicou a empresa. “Esta é uma ordem de magnitude menos do que antecipada inicialmente.”

No entanto, os analistas do setor pedem cautela. “O modelo de raciocínio de estréia do Mimax, M1, gerou emoção justificada com a reivindicação de reduzir as demandas computacionais em até 70% em comparação com colegas como Deepseek-R1”, disse Sanchit Vir Gogia, analista-chefe e CEO da Greyhound Research. “No entanto, em meio ao crescente escrutínio das práticas de benchmarking de IA, as empresas devem replicar independentemente essas reivindicações em cargas de trabalho práticas”.

Recursos de contexto estendidos

O recurso mais impressionante do M1 pode ser sua capacidade de lidar com grandes quantidades de informações simultaneamente. Com uma janela de contexto suportando um milhão de tokens de entrada e até 80.000 tokens de saída, o modelo pode ler e entender várias tarefas novas de uma só vez, mantendo a coerência em toda a conversa.

Fonte: Computer World

Compartilhe este artigo

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *