Apresentando ChatGPT Atlas

Apresentando ChatGPT Atlas (através de) OpenAI do ano passado contratou o engenheiro do Chrome Darin Fishero que gerou especulações de que eles poderiam ter seu próprio navegador em desenvolvimento. Hoje chegou.

ChatGPT Atlas é um navegador somente para Mac com uma variedade de recursos habilitados para ChatGPT. Você pode abrir um painel de bate-papo próximo a uma página da web, que será preenchido automaticamente com o contexto dessa página.

O recurso “memórias do navegador” é particularmente notável, descrito aqui:

Se você ativar as memórias do navegador, o ChatGPT lembrará os principais detalhes da sua navegação na web para melhorar as respostas do bate-papo e oferecer sugestões mais inteligentes, como recuperar uma página da web que você leu há algum tempo. As memórias do navegador são privadas da sua conta e estão sob seu controle. Você pode visualizá-los todos nas configurações, arquivar aqueles que não são mais relevantes e limpar seu histórico de navegação para excluí-los.

O Atlas também possui um “modo agente” experimental onde o ChatGPT pode assumir a navegação e a interação com a página para você, acompanhado por um estranho efeito de sobreposição de brilho:

Veja como o página de ajuda descreve esse modo:

No modo de agente, o ChatGPT pode realizar tarefas completas para você, como pesquisar um plano de refeições, fazer uma lista de ingredientes e adicionar mantimentos a um carrinho de compras pronto para entrega. Você está sempre no controle: o ChatGPT é treinado para perguntar antes de realizar muitas ações importantes, e você pode pausar, interromper ou assumir o controle do navegador a qualquer momento.

As execuções do modo agente também operam sob limites:

  • Acesso ao sistema: não é possível executar código no navegador, baixar arquivos ou instalar extensões.
  • Acesso a dados: não é possível acessar outros aplicativos em seu computador ou sistema de arquivos, ler ou gravar memórias ChatGPT, acessar senhas salvas ou usar dados de preenchimento automático.
  • Atividade de navegação: as páginas visitadas pelo ChatGPT no modo de agente não são adicionadas ao seu histórico de navegação.

Você também pode optar por executar o agente no modo desconectado, e o ChatGPT não usará nenhum cookie pré-existente e não fará login em nenhuma de suas contas online sem sua aprovação específica.

Estes esforços não eliminam todos os riscos; os usuários ainda devem ter cuidado e monitorar as atividades do ChatGPT ao usar o modo de agente.

Continuo encontrando toda essa categoria de agentes de navegador profundamente confuso.

Os riscos de segurança e privacidade envolvidos aqui ainda parecem intransponíveis para mim – certamente não confiarei em nenhum desses produtos até que um grupo de pesquisadores de segurança lhes dê uma surra completa.

Eu gostaria de ver um profundo explicação das etapas que o Atlas executa para evitar ataques de injeção imediata. No momento, parece que a defesa principal espera que o usuário observe cuidadosamente o que o modo agente está fazendo o tempo todo!

Atualizar: O CISO Dane Stuckey da OpenAI forneceu exatamente isso no dia seguinte ao lançamento.

Também acho esses produtos muito desinteressantes de usar. Experimentei o modo agente e foi como assistir um usuário iniciante de computador aprender meticulosamente a usar um mouse pela primeira vez. Ainda não encontrei meus próprios casos de uso para quando esse tipo de interação parece útil para mim, embora não esteja descartando isso.

Houve outro detalhe na postagem do anúncio que chamou minha atenção:

Os proprietários de sites também podem adicionar ÁRIA tags para melhorar a forma como o agente ChatGPT funciona em seus sites no Atlas.

Quais links para isso:

ChatGPT Atlas usa tags ARIA – os mesmos rótulos e funções que suportam leitores de tela – para interpretar a estrutura da página e os elementos interativos. Para melhorar a compatibilidade, siga Melhores práticas WAI-ARIA adicionando funções descritivas, rótulos e estados a elementos interativos como botões, menus e formulários. Isso ajuda o ChatGPT a reconhecer o que cada elemento faz e a interagir com seu site com mais precisão.

Um belo lembrete de que os “agentes” de IA compartilham muitas das características das tecnologias assistivas e se beneficiam das mesmas possibilidades.

O user-agent do Atlas é Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/141.0.0.0 Safari/537.36 – idêntico ao user-agent que recebo para o Google Chrome mais recente no macOS.