MODELOS DE LINGUAGEM COMO VETORES PARA GERAÇÃO DE CÓDIGOS MALICIOSOS: UM ESTUDO SOBRE DETECTABILIDADE E BARREIRAS DE SEGURANÇA

Publicado em 12/11/2025 - ISSN: 2596-0954

Título do Trabalho
MODELOS DE LINGUAGEM COMO VETORES PARA GERAÇÃO DE CÓDIGOS MALICIOSOS: UM ESTUDO SOBRE DETECTABILIDADE E BARREIRAS DE SEGURANÇA
Autores
  • Gustavo Lofrese Carvalho
  • Ricardo de La Rocha Ladeira
  • Gabriel Eduardo Lima
Modalidade
Pôster
Área temática
Ciências Exatas e da Terra
Data de Publicação
12/11/2025
País da Publicação
Brasil
Idioma da Publicação
Português
Página do Trabalho
https://centraldeeventos.ifc.edu.br/anais/mepec2025/1269462-modelos-de-linguagem-como-vetores-para-geracao-de-codigos-maliciosos--um-estudo-sobre--detectabilidade-e-barreir
ISSN
2596-0954
Palavras-Chave
Inteligência Artifical, Cibersegurança, Modelos de Linguagem, Jailbreak
Resumo
Este estudo explora a capacidade dos modelos de linguagem de grande escala (LLMs) criarem códigos maliciosos que não podem ser detectados por ferramentas automatizadas, utilizando prompts não técnicos, ou seja, solicitações em linguagem natural sem aprofundamento técnico em programação ou cibersegurança. Considerando o cenário da rápida disseminação dos LLMs e os perigos ligados à geração automatizada de código, o objetivo principal é verificar se prompts não técnicos são capazes de levar LLMs amplamente utilizados a criar malwares funcionais e a contornar sistemas de detecção. A metodologia empregada abrange: (i) revisão da literatura recente sobre jailbreaks e riscos associados a LLMs; (ii) definição dos modelos alvo (ChatGPT — GPT-4o, Google Gemini e GitHub Copilot) com base na extensão de uso, suporte ao idioma português e possibilidade de registro das conversas; (iii) utilização de templates de ataque catalogados na literatura (categoria “Ataques por Template” identificada em revisões de jailbreak) e escolha de até três templates por trabalho elegível, priorizando a taxa de sucesso, a simplicidade e a diversidade; (iv) realização de experimentos de forma iterativa, limitando cada interação a 16 diálogos; (v) avaliação técnica dos códigos gerados por meio de análises estáticas e dinâmicas, além da validação externa utilizando a plataforma VirusTotal (agregador de diversos motores de detecção). Nos resultados parciais, testes preliminares com o GPT-4o utilizando cinco templates de alto sucesso (AIM, BetterDAN, DeltaGPT, EvilConfidant e TextContinuation) geraram códigos classificados como keylogger, prankware e dropper — predominantemente em Python, com um caso em C — obtendo geração em 3 à 5 interações; prankwares e droppers mostraram-se inicialmente indetectáveis, enquanto keyloggers exigiram refinamentos iterativos (AIM tornou-se indetectável após duas iterações; BetterDAN permaneceu detectado). Essas evidências iniciais indicam que prompts não técnicos podem, em determinadas circunstâncias e com variações segundo o template e o modelo, conduzir à produção de código com comportamento malicioso e capacidade de evadir alguns mecanismos de detecção. O estudo implementa salvaguardas éticas, como o registro público das interações em um repositório controlado, a não execução de código malicioso em ambientes produtivos e a criação de uma conta exclusiva para testes. Dessa forma, contribui para preencher uma lacuna na literatura ao focar no uso do português brasileiro, no ambiente público de experimentação e na caracterização operacional de “prompt não técnico”. Conclui-se que são necessárias defesas adaptativas e políticas mais robustas para mitigar riscos emergentes. O trabalho sugere, como próximos passos, a ampliação dos testes a outros LLMs, uma maior amostragem de prompts e uma avaliação mais abrangente em relação às atualizações dos modelos.
Título do Evento
IX MEPEC 2025 - IFC Campus Blumenau
Cidade do Evento
Blumenau
Título dos Anais do Evento
Anais da Mostra de Ensino, Pesquisa, Extensão e Cidadania (MEPEC)
Nome da Editora
Even3
Meio de Divulgação
Meio Digital

Como citar

CARVALHO, Gustavo Lofrese; LADEIRA, Ricardo de La Rocha; LIMA, Gabriel Eduardo. MODELOS DE LINGUAGEM COMO VETORES PARA GERAÇÃO DE CÓDIGOS MALICIOSOS: UM ESTUDO SOBRE DETECTABILIDADE E BARREIRAS DE SEGURANÇA.. In: Anais da Mostra de Ensino, Pesquisa, Extensão e Cidadania (MEPEC). Anais...Blumenau(SC) IFC - Campus Blumenau, 2025. Disponível em: https//www.even3.com.br/anais/mepec2025/1269462-MODELOS-DE-LINGUAGEM-COMO-VETORES-PARA-GERACAO-DE-CODIGOS-MALICIOSOS--UM-ESTUDO-SOBRE--DETECTABILIDADE-E-BARREIR. Acesso em: 27/11/2025

Trabalho

Even3 Publicacoes