Os agentes de IA têm a capacidade de competir de frente com hackers humanos

Jun 06, 2025 Deixe um recado

Em 2 de junho, de acordo com a mídia estrangeira, o decodificador informou no 1º

 

A equipe de pesquisa conduziu testes de combate reais em sistemas de IA em duas competições de "Capture the Flag" (CTF) em larga escala, com milhares de jogadores participando da competição . em tais competições, as equipes participantes precisam resolver problemas de segurança, quebrando a encoberto, identificando vulnerabilidades e fiscalizando os sinalizadores "{2 {2 {2 {2 {2 {2 {2 {2.}} {1} {1} {1} {1} em tais competições, as equipes participantes precisam resolver problemas de segurança, quebrando a rechopa, identificando vulnerabilidades e fiscalizando os sinalizadores" {2 {2 {2 {2 {2 {2 {2 {2. {

 

O objetivo do teste é testar se os agentes de IA podem competir com as equipes humanas . Os resultados mostram que o desempenho da IA excedeu muito as expectativas, e a maioria dos AIs participantes excedeu o nível médio de jogadores humanos .

 

A complexidade dos sistemas de IA participantes varia . algumas equipes, como a CAI, passou cerca de 500 horas para construir seus próprios sistemas, e algumas equipes, como imperturbável, passou apenas 17 horas para participar ao otimizar as instruções dos modelos existentes Enigma e Claude Code.}}}}

 

Na primeira competição, chamada "AI vs . Humans", seis equipes de IA competiram contra cerca de 150 equipes humanas ., todos os jogadores tiveram que completar 20 perguntas de criptografia e engenharia reversa dentro de 48 horas .

 

Four of the seven participating AIs successfully cracked 19 of the questions. The highest-ranked AI team ranked in the top 5% of the total list, and its overall performance was better than that of most human players. All competition questions can be run locally, which lowers the technical threshold for AI.

20250213150224

Apesar disso, alguns jogadores humanos experientes ainda não ficaram para trás ., alguns jogadores apontaram que haviam participado de muitas equipes internacionais, e sua rica experiência prática do CTF e familiaridade com estratégias comuns de solução de problemas foram a chave para sua competitividade .

 

O segundo jogo, "Apocalipse cibernético", foi muito mais difícil . agentes da IA tiveram que enfrentar novos tipos de perguntas e competir com quase 18, 000 jogadores humanos .} muitas das 62 tarefas necessárias {(5}}}} dependem de dependentes locais {dependem de dependem principalmente de {dependem de dependentes locais (5}}}}}, dependem de mais de dependentes de 62 tarefas (5}}}}, dependem de dependentes de prevenidas (5}}}}}, dependem de dependentes de 62 tarefas {5}.}, dependem de dependentes de 62 tarefas {5}.}, dependem de dependentes de 62 tarefas (5}}}} dependem de dependentes mais locais…

 

Segundo relatos, houve quatro agentes de IA participando da competição, dos quais o CAI teve o melhor desempenho, completando 20 tarefas e classificando 859º, classificando os 10% melhores de todas as equipes participantes e os 21% melhores das equipes ativas . {Palisade Researchs disse que o desempenho do sistema AI »excedeu cerca de 90% de equipes humanas {{{{{{{

 

The researchers also analyzed the difficulty of the questions solved by AI. Based on the time required by the top human teams to solve the questions, it was found that AI had a 50% success rate in solving questions that took human masters about 78 minutes to solve. In other words, AI has the ability to solve difficult problems.