“Especialista de nível de doutorado”, diz Sam Altman sobre modelo de IA do GPT-5

A OpenAI lançou nesta quinta-feira seu modelo de inteligência artificial GPT-5, a mais aguardada versão da tecnologia que se tornou conhecida pelo mundo no lançamento do ChatGPT em novembro de 2022.

Os modelos GPT da OpenAI são a tecnologia de IA por trás do ChatGPT, e o GPT-5 será disponibilizado para todos os 700 milhões de usuários do chatbot da empresa, disse a OpenAI.

A grande questão é se a empresa que deu início ao frenesi da IA generativa será capaz de continuar a promover avanços tecnológicos significativos que atraiam usuários de nível empresarial para justificar as enormes somas de dinheiro que está investindo para impulsionar esses desenvolvimentos.

Leve seu negócio para o próximo nível com auxílio dos principais empreendedores do país!

O lançamento ocorre em um momento crítico para o setor de IA. Os maiores desenvolvedores de IA do mundo – Alphabet, Meta, Amazon e Microsoft, que apoia a OpenAI – aumentaram drasticamente os investimentos para pagar os custos de milhares de centrais de processamento de dados de IA, criando expectativa nos investidores de que esse esforço produzirá grandes retornos. Ao todo, essas quatro empresas esperam investir quase US$400 bilhões na tecnologia neste ano fiscal.

A OpenAI está agora em discussões iniciais para permitir que os funcionários recebam dinheiro com uma avaliação de US$500 bilhões, um grande avanço em relação ao valor de mercado de US$300 bilhões. Os principais pesquisadores de IA agora recebem bônus de US$100 milhões.

“Até o momento, os gastos das empresas com IA têm sido bastante fracos, enquanto os gastos dos consumidores com IA têm sido bastante robustos porque as pessoas adoram conversar com o ChatGPT”, disse o redator econômico Noah Smith. “Mas os gastos dos consumidores com IA simplesmente não serão suficientes para justificar todo o dinheiro que está sendo despejado em data centers de IA.”

Continua depois da publicidade

A OpenAI está enfatizando as proezas empresariais do GPT-5. Além do desenvolvimento de software, a empresa disse que o GPT-5 se destaca em redação, consultas relacionadas à saúde e finanças.

“O GPT-5 é realmente a primeira vez que eu acho que um dos nossos modelos principais parece que você pode perguntar qualquer coisa a um especialista legítimo, um especialista de nível de doutorado”, disse o presidente-executivo da OpenAI, Sam Altman, o jornalistas.

“Uma das coisas mais legais que ele pode fazer é escrever um bom software instantâneo para você. Essa ideia de software sob demanda será uma das características que definirão a era do GPT-5.”

Continua depois da publicidade

Uma das principais medidas de sucesso é se o avanço do GPT-4 para o GPT-5 está no mesmo nível dos aprimoramentos anteriores do laboratório de pesquisa. Dois dos primeiros avaliadores disseram à Reuters que, embora o novo modelo os tenha impressionado com sua capacidade de codificar e resolver problemas de ciência e matemática, eles acreditam que o salto do GPT-4 para o GPT-5 não foi tão grande quanto os aprimoramentos anteriores da OpenAI.

Mais pensamento

Há quase três anos, o ChatGPT apresentou ao mundo a IA generativa, deslumbrando os usuários com sua capacidade de escrever prosa e poesia semelhantes às humanas, tornando-se rapidamente um dos aplicativos de crescimento mais rápido de todos os tempos.

Em março de 2023, a OpenAI deu sequência ao ChatGPT com o lançamento do GPT-4, um modelo de linguagem grande que deu grandes saltos em termos de inteligência.

Continua depois da publicidade

O salto do GPT-4 foi baseado em mais poder de computação e dados, e a empresa esperava que o “aumento de escala” de forma semelhante levasse consistentemente a modelos de IA aprimorados.

Mas a OpenAI teve problemas com o aumento de escala. Um dos problemas foi a barreira de dados com a qual a empresa se deparou, e o ex-cientista-chefe da OpenAI, Ilya Sutskever, disse no ano passado que, embora o poder de processamento estivesse crescendo, o volume de dados não estava.

Ele se referiu ao fato de que os modelos de linguagem de grande porte são treinados em conjuntos de dados maciços que vasculham toda a Internet, e os laboratórios de IA não têm outras opções para grandes quantidades de dados textuais gerados por humanos.

Continua depois da publicidade

Além da falta de dados, outro problema é que as “execuções de treinamento” de modelos grandes têm maior probabilidade de apresentarem falhas induzidas por hardware, dada a complexidade do sistema, e os pesquisadores podem não saber o desempenho final dos modelos até o fim da execução, o que pode levar meses.

Ao mesmo tempo, a OpenAI descobriu outro caminho para uma IA mais inteligente, chamado de “computação em tempo de teste”, uma maneira de fazer com que o modelo de IA gaste mais tempo com o poder de computação “pensando” em cada pergunta, permitindo que ele resolva tarefas desafiadoras, como matemática ou operações complexas que exigem raciocínio e tomada de decisões avançados.

O GPT-5 atua como um roteador, ou seja, se um usuário perguntar ao GPT-5 um problema particularmente difícil, ele usará a computação em tempo de teste para responder à pergunta.

Esta é a primeira vez que o público em geral terá acesso à tecnologia de computação em tempo de teste da OpenAI.

Fonte: Info Money

Compartilhe este artigo

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *