Ataque dos rastreadores da AI – Computerworld

Um problema que a empresa encontrou é quando os sites desejam permitir rastreadores de mecanismos de pesquisa, mas bloqueia os rastreadores de Genai, disse Tatoris. Isso é facilmente realizado na maioria dos casos, mas “o bot do Google é complicado, um desafio agora”, porque é difícil, se não impossível, distinguir entre o rastreador do Google Search Engine e o Google Genai Crawler, disse Tatoris.

O consultor Schubert disse que não tem uma boa resposta sobre como proteger os ativos da Web dos rastreadores de AI. “Muitas pessoas fazem o ‘vamos usar um LLM para gerar conteúdo de lixo para alimentar o lixo com os robôs de treinamento’ (tática) e, embora eu ache que isso funcione, eu não sou um grande fã”, disse ele. “Isso está efetivamente desperdiçando energia para permitir que outra pessoa desperdiça energia. Idealmente, teríamos uma legislação clara e julgamos decisões dizendo a essas empresas que o que elas fazem não é um uso justo”.

Pouca ajuda da lei

No vácuo, essa situação seria ideal para um processo de ação coletiva, porque há muitas vítimas e os danos são relativamente fáceis de quantificar. A empresa host da web pode listar os custos típicos da largura de banda para um site antes que a Genai Crawler visite e depois.

Fonte: Computer World

Compartilhe este artigo

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *