Resumo criado por Smart Answers AI
Resumindo:
- O GPT-5.4 da OpenAI apresenta recursos inovadores de IA de agência que permitem executar ações do computador, como clicar no mouse e editar arquivos de forma autônoma.
- PCWorld relata que este desenvolvimento marca uma mudança significativa em direção aos agentes de IA que controlam as tarefas do PC de forma independente, apresentando habilidades aprimoradas de planilhas e raciocínio eficiente.
- O modelo está disponível por meio de ChatGPT, API OpenAI e Codex, representando um grande passo além da IA tradicional de fornecimento de informações em direção ao controle interativo do computador.
Lembra quando os modelos de IA só podiam lhe dizer o que fazer? Agora, os LLMs mais recentes podem realmente fazer coisas com a ajuda de software de IA agente, e o novo modelo carro-chefe da OpenAI é o mais novo do grupo.
GPT-5.4 já está disponível no ChatGPT (onde atende pelo nome de GPT-5.4 Thinking), bem como na API OpenAI e na ferramenta de codificação Codex da OpenAI (cuja versão acabou de ser lançada para Windows).
Este novo GPT chega com uma série de truques novos e renovados, começando com suas habilidades aprimoradas de planilhas, raciocínio mais eficiente (o que significa que ele pode resolver problemas usando menos tokens, custando menos) e capacidade de mostrar um plano “antecipado” antes de executar tarefas complexas, dando a você a chance de orientar o modelo em uma nova direção antes que ele comece a funcionar.
O mais interessante é que o GPT-5.4 marca o primeiro modelo de uso geral da OpenAI que pode realmente fazer coisas no seu computador, não apenas dizer como para fazer coisas. Por exemplo, o GPT-5.4 pode clicar com o mouse – ou, para ser mais preciso, pode emitir um comando “clique com o mouse” para um sistema de agente de IA em seu PC, que faz o clique real. GPT-5.4 também pode editar arquivos em seu sistema, digitar comandos de teclado e “ver” capturas de tela (permitindo usar um navegador da web ou interagir com programas de computador).
Agora, uma advertência importante aqui: o GPT-5.4 só pode assumir o controle do seu PC quando estiver operando por meio da API OpenAI ou da ferramenta Codex da OpenAI. Quando você usa GPT-5.4 Pensando por meio do ChatGPT – ou seja, o aplicativo de desktop ChatGPT ou interface da web – o LLM ainda está confinado à sua caixa de bate-papo e às suas várias integrações do ChatGPT, como Google Drive, Spotify, Adobe Photoshop e outros.
Também é importante notar que embora o GPT-5.4 seja o primeiro uso geral GPT que pode realmente usar o seu PC, não é o primeiro GPT sempre isso pode fazer isso. Existem GPTs específicos do Codex que podem executar comandos, editar arquivos e (até certo ponto) navegar em interfaces gráficas e abrir caminho através de fluxos de trabalho da web. Mas com sua capacidade de realmente navegar na web e controlar programas de PC, o GPT-5.4 leva os recursos de “uso do computador” dos modelos anteriores específicos do Codex para o próximo nível.
Isso significa que você poderia pedir a um agente de IA controlado por GPT-5.4 em seu computador para “equilibrar meus livros no Quicken” e ele seria capaz de iniciar o aplicativo Quicken de forma autônoma, clicar na interface e equilibrar suas contas.
Claro, se você querer GPT-5.4 mexendo no Quicken por conta própria é uma questão totalmente separada. Para tarefas confidenciais, você provavelmente desejaria observar como ele funciona, como você pode fazer ao codificar com GPT-5.4 no aplicativo Codex.
Ainda assim, os recursos “faça, não apenas diga” do GPT-5.4 servem como um exemplo perfeito de para onde estamos indo: PCs controlados por agentes de IA que estão fazendo coisas por conta própria, com orientação de alto nível nossa. Dito isto, fazer com que nossos agentes de IA sigam nossas instruções corretamente será o verdadeiro truque.
Fonte: PC World












