O novo aplicativo de IA do Google é um vislumbre do futuro

Não sei sobre você, mas passo muito tempo offline. E não por escolha. É por isso que adoro novas ferramentas que funcionam off-line, como a excelente que o Google acaba de lançar.

Eu sei, sou um estranho. Como nômade digital em tempo integral que viaja constantemente, tenho problemas incomuns de conectividade. No momento, estou morando em uma fazenda na Toscana. É incrível. Eu amo isso. Mas recentemente, durante dois dias, a conectividade ficou tão ruim que mal consegui trabalhar. Havia pouco que eu pudesse fazer exceto beber Chianti e contemplar as colinas verdes. (No domingo de Páscoa e no dia seguinte – um dia de folga local – todos estavam em casa estressados ​​com suas conexões de internet, o que tornava a conectividade quase impossível.)

Muitas vezes me encontro nesta posição. Minha esposa e eu tendemos a preferir casas antigas em bairros antigos, geralmente na Europa ou na América Latina, e a conectividade pode ser ruim ou inexistente.

Perco conexões enquanto dirijo, dentro ou perto de edifícios de pedra muito antigos, enquanto voo em aviões e enquanto dirijo por áreas remotas.

Mas mesmo para pessoas que não viajam e se deslocam como eu, estar offline também pode ser uma escolha. É muito mais seguro desconectar-se, especialmente em espaços públicos como cafeterias e aeroportos e ao usar uma das muitas empresas não confiáveis ​​centradas na nuvem. Às vezes você precisa desesperadamente economizar bateria. Às vezes pode ser psicologicamente saudável saber que você está offline.

As ferramentas podem e devem funcionar melhor offline. Tenho um iPhone caro que seria considerado um supercomputador há apenas 10 anos. Um smartphone moderno é poderoso o suficiente para realizar grande parte do trabalho atualmente realizado na nuvem.

A computação em nuvem é necessária para chatbots como ChatGPT, Perplexity, Claude e Gemini porque os modelos de IA para todos os fins exigem centenas de bilhões de parâmetros, grandes quantidades de RAM e enormes quantidades de eletricidade para estarem prontos para fazer tudo e qualquer coisa muito rapidamente. Forçar essas cargas de trabalho em um dispositivo móvel limita fundamentalmente a inteligência e a capacidade da IA ​​de uso geral. Mas a divisão de tarefas individuais (como a transcrição) não requer data centers massivos.

Os maiores problemas para mim são duas das ferramentas que mais uso: MyMind e Lex.

Escrevi sobre MyMind em agosto. É uma ferramenta de registro de vida, marcação de favoritos e lembrança de tudo que torna a recuperação de informações muito rápida. Ele usa IA para etiquetar automaticamente e elimina o trabalho de salvar e recuperar informações.

Infelizmente, sem conexão, perco o MyMind. Simplesmente não tem capacidade offline. Então, quando estou desconectado e quero salvar ou recuperar algo, não consigo. Quanto mais confio nesta ferramenta protética de memória, mais estar offline me causa amnésia. Esta é a minha maior reclamação sobre o MyMind.

Eu também te contei sobre Lex. Lex é essencialmente um processador de texto com ferramentas de IA integradas, projetadas não para escrever para você (e torná-lo pior na escrita), mas, em vez disso, para apontar coisas e aconselhá-lo sobre maneiras que tornem sua escrita melhor.

Lex também não funciona offline. O que é uma pena, porque suas principais alternativas, como o Google Docs e o Apple Pages, o fazem. Você pode simplesmente usá-los off-line e, mais tarde, quando conseguir uma conexão, eles serão sincronizados com a nuvem. A falta de suporte offline de Lex é o principal motivo pelo qual penso frequentemente em cancelar minha assinatura e voltar ao Pages. (Observe que eu uso um teclado Bluetooth com meu telefone para escrever colunas, boletins informativos, postagens em blogs e até livros.)

Tanto MyMind quanto Lex usam IA e espero que em um futuro muito próximo veremos uma mudança de chatbots multifuncionais para ferramentas menores e baseadas em IA para fins especiais, como essas executadas na borda ou em nossos telefones.

Um ótimo exemplo dessa mudança é uma nova ferramenta do Google chamada AI Edge Eloquent.

Fale com o dispositivo portátil

O Google lançou seu aplicativo de ditado off-line gratuito, somente para iOS e somente em inglês, na segunda-feira. Embora o ditado não pareça muito interessante, o Google incorporou vários recursos que o tornam realmente excelente.

Em primeiro lugar, utiliza IA, com modelos de reconhecimento de voz baseados em Gemma executados localmente no telefone. Ele não captura apenas o que você diz, mas o que você quis dizer. O que quer dizer que ele ignora seus hums, ahs e repetições, capturando apenas as palavras limpas que você pretendia. (Se você ativar o processamento em nuvem, funcionará ainda melhor.) É muito bom para adicionar pontuação automaticamente.

Quando você terminar de falar, o aplicativo carrega automaticamente o texto limpo na área de transferência. Isso significa que você pode falar com o aplicativo, depois mudar para o seu processador de texto, aplicativo de mídia social, aplicativo de e-mail ou outro aplicativo e simplesmente colar os resultados.

O aplicativo pode reescrever suas transcrições usando uma das quatro opções de estilo padrão:

  1. Pontos-chave (condensa o discurso em uma lista com marcadores)
  2. Formal (muda o texto para um tom profissional)
  3. Curto (resume a mensagem)
  4. Longo (expande o texto inicial)

(Para a maior parte da escrita, não recomendo esses tipos de atalhos estilísticos; recomendo comunicar-se em seu próprio estilo.)

Depois de ditar algo, você pode pressionar um botão parar ou pausar. Este é um ótimo par de opções porque se você estiver trabalhando em uma peça mais longa, o botão de pausa permite que você organize suas ideias, faça uma pequena pesquisa e depois retome, terminando com a mesa inteira na área de transferência.

A característica mais surpreendente é que ele pode aprender palavras personalizadas. Por exemplo, ele aprende com suas edições, com a adição manual de palavras ou – espere – com seu histórico de conversas do Gmail (um botão pede sua permissão e você precisa escolher fazer login explicitamente no Gmail). A opção Gmail traz não apenas jargões, mas também nomes, marcas que você falou, abreviações, palavras estrangeiras, nomes de lugares e outros.

E, finalmente, o aplicativo exibe com destaque “estatísticas de uso”, incluindo quantas palavras, quantas palavras por minuto, velocidade média de ditado, número total de palavras ditadas e o número total de “edições de polimento” feitas pelo aplicativo.

AI Edge Eloquent sherlocks Wispr Flow e Willow, cada um custando US$ 15 por mês. Ele também sherlocks SuperWhisper, ao preço de US$ 85 por ano. (No jargão do Vale do Silício, “sherlocking” é quando uma grande empresa copia uma característica importante do produto de um concorrente, tornando assim o produto do concorrente obsoleto.)

Resumindo, AI Edge Eloquent é perfeito e extremamente útil para quem quer ditar alguma coisa.

A lenta ascensão da IA ​​offline

Estou vendo surgir algumas outras ferramentas baseadas na ideia de que a IA deve estar no limite e offline.

Uma nova ferramenta interessante lançada esta semana é chamada WarClaw, de uma startup baseada em Bellevue, WA, chamada Edgerunner AI. A empresa chama a ferramenta de “ajudante digital” (ajudante é um oficial militar que atua como assistente de um comandante militar).

A empresa afirma que o WarClaw foi construído por ex-soldados para uso por militares da ativa. É uma camada operacional segura construída sobre OpenClaw, de acordo com a empresa. (Falei sobre o OpenClaw no início deste ano, assim como meu colega Steven Vaughan-Nichols, que explicou como o OpenClaw é incrivelmente inseguro.

O software foi projetado para funcionar durante o combate no que eles chamam de configurações DDIL (largura de banda negada, desconectada, intermitente e baixa).

WarClaw funciona em um dispositivo móvel desconectado e foi treinado em dados militares específicos. Ele automatiza o planejamento da missão, o agendamento e a análise de informações. Surpreendentemente, ele pode controlar diretamente ferramentas de escritório como Microsoft Word, PowerPoint, Excel, Slack, navegadores da web e e-mail.

A empresa já ganhou contratos para fornecer WarClaw a três ramos militares dos EUA.

Embora o WarClaw seja para soldados, acho que os empresários poderiam se beneficiar com essa ferramenta. Por exemplo, seria ótimo ter um assistente off-line durante viagens de negócios para locais e ambientes (como aeroportos) com dados inseguros.

Eu adoraria ver quase todos os trabalhos de IA que atualmente exigem uma conexão serem transformados em um aplicativo executado localmente, desconectado do telefone. Além da conveniência óbvia, isso também representa uma grande oportunidade para o Google e a Apple: eles podem combinar suas ferramentas de IA com smartphones cada vez mais poderosos, o que dá aos compradores de telefones um motivo poderoso para atualizar seu hardware com mais frequência.

Divulgação de IA: Eu não uso IA para escrever. As palavras que você vê aqui são minhas. Eu uso uma variedade de ferramentas de IA por meio do Kagi Assistant (divulgação: meu filho trabalha na Kagi) – apoiadas pelo Kagi Search, pelo Google Search, bem como por telefonemas para pesquisa e verificação de fatos. Eu uso um aplicativo de processamento de texto chamado Lex, que possui ferramentas de IA, e depois de escrever, uso as ferramentas de verificação gramatical do Lex para encontrar erros de digitação e sugerir alterações de palavras. É por isso que divulgo meu uso de IA e incentivo você a fazer o mesmo.

Fonte: Computer World

Compartilhe este artigo