Ícone do site Café Codificado

Arte SVG e ASCII revelam compreensão intermodal

Diagram showing a pelican riding a bicycle illustration alongside its SVG source code. The left side displays two versions: a completed color illustration at top with a white pelican with yellow beak on a red bicycle with blue wheels (labeled "Bike" and "Wheels"), and a line drawing sketch below with labels "Fur/Wool", "Eyes", "Mouth", "Tail", and "Bird". The right side shows the corresponding SVG XML code with viewBox, rect, ellipse, circle, and path elements defining the illustration

Recursos visuais entre modalidades: arte SVG e ASCII revelam compreensão intermodal (através de) Nova pesquisa de interpretabilidade de modelos da Anthropic, desta vez focada na geração de arte SVG e ASCII.

Descobrimos que o mesmo recurso ativado nos olhos em uma face ASCII também é ativado nos olhos em diversas modalidades baseadas em texto, incluindo código SVG e prosa em vários idiomas. Isso não se limita aos olhos – encontramos vários recursos intermodais que reconhecem conceitos específicos: desde pequenos componentes, como bocas e orelhas, em rostos ASCII ou SVG, até representações visuais completas, como cães e gatos. (…)

Esses recursos dependem do contexto circundante na representação visual. Por exemplo, um elemento circular SVG ativa recursos de “olho” somente quando posicionado dentro de uma estrutura maior que ativa recursos de “rosto”.

E realmente, eu não posso não link para este dado o bônus que eles marcaram no final!

Como bônus, também inspecionamos recursos de um SVG de um pelicano andando de bicicleta, primeiro popularizado por Simon Willison como forma de testar as capacidades artísticas de um modelo. Encontramos recursos que representam conceitos incluindo “bicicleta”, “rodas”, “pés”, “cauda”, “olhos” e “boca” ativados nas partes correspondentes do código SVG.

Agora que eles podem identificar recursos de modelo associados a conceitos visuais em imagens SVG, eles podem usá-los para orientação?

Acontece que eles podem! Começar com um SVG sorridente (fornecido como XML sem nenhuma indicação do que estava desenhando) e depois aplicar uma pontuação negativa ao recurso “sorriso” produziu uma carranca e também funcionou contra a arte ASCII.

Eles também poderiam melhorar recursos como unicórnio, gato, coruja ou leão e obter novos smileys SVG tentando representar claramente essas criaturas.

Diagrama mostrando um rosto sorridente amarelo no centro com setas bidirecionais conectando-se a seis rostos circulares diferentes dispostos ao redor dele, com o texto acima perguntando "Para onde esse rosto pode ser direcionado?" As faces circundantes são rotuladas no sentido horário a partir do canto superior esquerdo: "Unicórnio" (círculo rosa com chifre triangular amarelo e brincos de diamante), "Gato" (círculo cinza com orelhas triangulares e nariz pequeno), "Rugas" (círculo bege com cílios e linhas de rugas), "Coruja" (círculo marrom com grandes olhos redondos e bico pequeno), "Leão" (círculo laranja com face interna amarela) e "Olho" (círculo branco com grande pupila preta e destaque

Eu adoraria ver como isso se comportaria se você aumentasse o recurso da Ponte Golden Gate.

Sair da versão mobile