Resumo criado por Smart Answers AI
Resumindo:
- PCWorld relata que um vazamento do Claude Code revelou que a IA da Anthropic verifica ativamente as mensagens dos usuários em busca de palavrões e indicadores de frustração usando detecção de regex.
- O arquivo ‘userPromptKeywords.ts’ vazado mostra que Claude Code monitora frases negativas, embora o propósito dessa coleta de dados permaneça obscuro.
- Esta descoberta levanta preocupações mais amplas sobre privacidade sobre possíveis práticas de monitoramento semelhantes em outras plataformas de IA, como ChatGPT e Gemini.
“O que é isso?” “Droga!” “Agora estou realmente incomodado.” Amaldiçoar um ajudante de IA agitado é algo que todos nós já fizemos, mas acontece que uma das ferramentas mais populares de Claude é verificar ativamente nossas mensagens em busca de sinais específicos de frustração – incluindo palavrões.
A revelação é um dos muitos detalhes surpreendentes decorrentes de um vazamento massivo do Claude Code que revelou muitos dos planos da Anthropic para suas próximas ferramentas e modelos. As mais de 500.000 linhas de código, que a Anthropic publicou acidentalmente em um registro de software público na terça-feira, incluem todos os tipos de detalhes interessantes, incluindo especificações para novos modelos de Claude, um “modo secreto” para Claude que permite fazer contribuições “furtivas” para bases de código públicas, um agente “sempre ativo” para Claude Code e até mesmo um “Buddy” no estilo Tamagotchi para Claude.
Mas uma das coisas mais estranhas descobertas no vazamento é que Claude Code está monitorando ativamente nossas mensagens de bate-papo em busca de palavras e frases – incluindo bombas F e outros palavrões – que sirvam como sinais de frustração do usuário.
Especificamente, Claude Code inclui um arquivo chamado “userPromptKeywords.ts” com uma ferramenta simples de correspondência de padrões chamada regex, que varre cada mensagem enviada a Claude em busca de determinadas correspondências de texto. Neste caso específico, o padrão regex está procurando por “wtf”, “wth”, “omfg”, “idiota”, “horrível”, “horrível”, “pedaço de —-” (insira sua palavra favorita de quatro letras para essa), “f— you”, “dane-se”, “isso é uma merda” e várias outras metáforas coloridas.
Para ser claro, esta função de pesquisa de “palavrões” foi detectada especificamente em Código Claude através do vazamento antrópico. O código dos aplicativos de desktop e web de Claude não foi incluído no vazamento, então não sabemos o que está acontecendo nos bastidores dessas interfaces de Claude.
Também é importante notar que a função regex usada aqui não é nada sofisticada. Na verdade, regex é suportado por uma ampla variedade de linguagens de programação (tudo de Java a Python) e está em uso há décadas, e sua funcionalidade não está muito diferente de um simples Ctrl-F.
Embora o vazamento do Código Claude tenha revelado a existência do regex “palavras de frustração”, ele não dá nenhuma indicação de por que o Código Claude está vasculhando mensagens em busca dessas palavras ou o que está fazendo com elas.
Entrei em contato com a Anthropic para comentar.
Claro, podemos adivinhar. Uma razão plausível é que a Anthropic está coletando telemetria para ajudá-la a determinar o desempenho de modelos e ferramentas específicos de Claude. Um aumento nas palavras de “frustração” detectadas seria uma maneira fácil de detectar se um novo recurso de Claude não está indo bem.
Outra possibilidade é que um aumento nos sinais de frustração detectados possa desencadear mudanças comportamentais no próprio Claude, talvez tornando-o mais empático ou apologético. É claro que xingar Claude ou qualquer outra IA geralmente direcionará o bate-papo em uma direção diferente (como aconteceu com os resultados da Pesquisa Google), mas uma verificação de regex específica como a do Código Claude poderia ajudar a tornar um pivô comportamental mais confiável.
Embora o regex de “palavras de frustração” só tenha sido confirmado para Claude Code, isso faz você se perguntar se ele existe nos aplicativos de desktop e web de Claude – ou se ChatGPT, Gemini e outros grandes players de IA possuem funções semelhantes em suas bases de código.
Fonte: PC World












