02 de jun 2025
Aumento de bots causa instabilidade em sites de publicações acadêmicas e científicas
Aumento de bots na internet causa caos em sites acadêmicos, levantando preocupações sobre a coleta de dados para IA generativa.
Alguns sites ficaram sobrecarregados devido ao grande volume de tráfego de bots. Reprodução: Marco VDM/Getty
Ouvir a notícia:
Aumento de bots causa instabilidade em sites de publicações acadêmicas e científicas
Ouvir a notícia
Aumento de bots causa instabilidade em sites de publicações acadêmicas e científicas - Aumento de bots causa instabilidade em sites de publicações acadêmicas e científicas
Recentemente, sites acadêmicos, como o DiscoverLife e o BMJ, enfrentaram picos de tráfego de bots, resultando em interrupções e preocupações sobre o uso de dados para treinar modelos de inteligência artificial (IA) generativa. O DiscoverLife, um repositório online com quase três milhões de fotografias de espécies, começou a receber milhões de acessos diários, muito acima do normal. Esse aumento causou lentidão e, em alguns momentos, tornou o site inacessível.
Os bots, programas automatizados que raspam conteúdo de sites, têm se tornado um problema crescente para editores acadêmicos e pesquisadores. Andrew Pitts, executivo da PSI, afirma que o volume de solicitações está causando strain nos sistemas, resultando em custos e interrupções para usuários legítimos. Sites afetados estão buscando maneiras de bloquear esses bots, mas a tarefa é desafiadora, especialmente para organizações com recursos limitados.
A situação é alarmante, com o BMJ relatando que o tráfego de bots superou o de usuários reais, levando a interrupções nos serviços. Ian Mulvany, diretor de tecnologia do BMJ, destacou que o comportamento agressivo dos bots sobrecarregou os servidores da editora. Outros editores também estão enfrentando problemas semelhantes, com Jes Kainth, da Highwire Press, mencionando um aumento significativo no tráfego de "bots ruins".
Impacto nos Repositórios
A Confederação de Repositórios de Acesso Aberto (COAR) revelou que mais de noventa por cento dos membros entrevistados relataram que bots de IA estavam raspando conteúdo de seus sites, resultando em interrupções nos serviços. Kathleen Shearer, diretora executiva da COAR, observou que, embora os repositórios sejam de acesso aberto e incentivem a reutilização de conteúdos, a agressividade de alguns bots tem causado sérios problemas operacionais.
Um fator que contribui para o aumento dos bots de IA é a revelação do modelo de linguagem DeepSeek, que demonstrou que é possível criar um modelo competitivo com menos recursos. Isso desencadeou uma onda de bots em busca de dados para treinar modelos semelhantes. A situação atual é descrita por especialistas como um verdadeiro "far west", onde a falta de regulamentação e controle está gerando desafios significativos para a comunidade acadêmica.
Perguntas Relacionadas
Comentários
Os comentários não representam a opinião do Portal Tela;
a responsabilidade é do autor da mensagem.