OpeniAI desafia os rivais com modelos GPT-OSS licenciados pela Apache-Computerworld

Os modelos de peso aberto fornecem acesso aos parâmetros de modelo treinados, permitindo que as organizações executem e personalizem a IA localmente, mas diferem do software tradicional de código aberto, não incluindo necessariamente o código de treinamento original ou os conjuntos de dados.

Arquitetura projetada para eficiência corporativa

Os modelos aproveitam uma arquitetura de mistura de especialistas (MOE) para otimizar a eficiência computacional. O GPT-OSS-120B ativa 5,1 bilhões de parâmetros por token de seus 117 bilhões de parâmetros totais, enquanto o GPT-20B ativa 3,6 bilhões em relação à sua base de 21 bilhões de parâmetros. Ambos suportam janelas de contexto de 128.000 toques e são lançadas sob a licença Apache 2.0, permitindo o uso e a personalização comerciais irrestritos.

Os modelos estão disponíveis para download no Face Hugging e são quantizados nativamente no formato MXFP4, de acordo com o comunicado. A empresa fez uma parceria com plataformas de implantação, incluindo Azure, AWS, Abraçando o rosto, VLLM, Ollama, fogos de artifício, juntos ai, banco de dados e vercel para garantir ampla acessibilidade.

Fonte: Computer World

Compartilhe este artigo

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *