Resumo criado por Smart Answers AI
Resumindo:
- A PCWorld testou o novo modelo Images 2.0 do ChatGPT, que demonstra notável precisão na renderização de texto em imagens geradas por IA, incluindo estilos manuscritos.
- O modelo atualizado agora está disponível para todos os usuários e apresenta recursos aprimorados, como pesquisa na web, criação de infográficos e suporte multilíngue, incluindo scripts não latinos.
- A renderização de texto aprimorada do Images 2.0 abre aplicações práticas para a criação de catálogos, storyboards e documentação técnica detalhada com perfeita precisão textual.
Os modelos de geração de imagens têm uma longa história de texto desajeitado. Mas, embora letras ilegíveis costumavam ser uma indicação clara da IA, a nova ferramenta de geração de imagens do ChatGPT é a melhor que já vi na renderização de texto.
Pedi ao modelo Images 2.0 do ChatGPT (disponível agora para todos os usuários do ChatGPT, incluindo aqueles no nível gratuito) para pegar algum texto de uma história recente minha e renderizá-lo a lápis em um bloco de notas amarelo e, bem, parece muito perfeito para mim:
Ben Patterson/Fundição
Também o solicitei a criar um infográfico sobre tokens de IA, instruindo-o primeiro a pesquisar na web informações precisas e a usar uma fonte serifada em uma proporção de paisagem 3:2. Aqui está o que eu consegui:

Ben Patterson/Fundição
Em seguida, encarreguei a Images 2.0 de criar outro infográfico, desta vez detalhando os vários modelos Raspberry Pi completos com especificações e outros detalhes:

Ben Patterson/Fundição
Por fim, pedi à modelo que tirasse uma foto minha à beira da piscina e criasse um lookbook de looks de verão, estrelado por mim:

Ben Patterson/Fundição
A OpenAI afirma que o Images 2.0 é seu primeiro modelo de geração de imagens com recursos de “pensamento”, o que significa que ele pode parar e refletir sobre um prompt de imagem antes de mergulhar de cabeça.
Quando se trata de texto, o Images 2.0 oferece suporte a vários idiomas, incluindo japonês, coreano, chinês, hindi, bengali e outros que empregam texto não latino.
Ele também pode pesquisar informações em tempo real na web antes de renderizar imagens, bem como criar várias imagens de uma só vez, o que é bom para renderizar imagens de catálogo, painéis em estilo de quadrinhos e storyboards.
A OpenAI promete que o Images 2.0 fornecerá um “nível sem precedentes de especificidade e fidelidade”, o que significa (espero) que fará um trabalho melhor na adesão imediata – isto é, criando imagens que seguem suas instruções ao pé da letra.
Com esse nível de precisão, o Images 2.0 poderia oferecer uma resposta à pergunta que faço há muito tempo sobre modelos de geração de imagens: para que servem, além de criar memes bobos ou deepfakes assustadores? Qual é a aplicação prática real?
A composição tipográfica quase instantânea, a criação de infográficos e a renderização de catálogo podem ser algumas das soluções, embora a correção de um erro de digitação exija uma nova renderização completa da imagem.
Também é possível que quanto mais você experimentar o Images 2.0 (só estou brincando com ele há cerca de uma hora), mais as imagens renderizadas parecerão iguais, e é por isso que você provavelmente precisará de um prompter humano qualificado com um olho para o design no comando.
Fonte: PC World












