“Ao separar os tokens de entrada dos tokens de saída, a codificação única da MU reduz bastante a computação e a sobrecarga da memória”, disse Pradeep.
A abordagem do codificador-decodificador foi significativamente mais rápida que o LLMS, como o PHI-3.5 da Microsoft, que é um modelo somente decodificador. “Ao comparar o MU com um phi-3.5-mini de ajuste da mesma forma, descobrimos que o MU é quase comparável no desempenho, apesar de ser um décimo do tamanho”, disse Pradeep.
Esses ganhos são cruciais para aplicativos no dispositivo e em tempo real. “O gerenciamento da extensa variedade de configurações do Windows representava seus próprios desafios, principalmente com as funcionalidades sobrepostas”, disse Pradeep.
Fonte: Computer World