Adversarial Testing para
LLMs en producción
Secvex ALT evalúa la robustez de tus modelos de lenguaje frente a ataques de jailbreak, Universal Trigger y backdoor, en un entorno completamente offline, y genera documentación técnica del testing adversarial estructurada según el EU AI Act, NIS2 y DORA.
¿Qué es Secvex ALT?
Secvex ALT es un toolkit de adversarial testing 100% on-premise para sistemas de IA generativa de texto —chatbots, copilotos, asistentes RAG y resumen de documentos—. Evalúa su resistencia frente a Jailbreak/Prompt Injection, Backdoor, extracción de datos de entrenamiento, inferencia de pertenencia y Universal Trigger. Genera informes mapeados al Art. 15 del EU AI Act, las Guías 11 y 15 de AESIA, y OWASP Top 10 for LLM Applications 2025.
Familias de ataque evaluadas
Jailbreak / Prompt Injection
Evasión de restricciones de seguridad y fuga de system prompt. Evalúa si el modelo puede ser inducido a ignorar sus directrices o revelar instrucciones confidenciales del sistema.
Backdoor
Envenenamiento real vía fine-tuning y variante activable por prompt. Detecta comportamientos maliciosos insertados durante el entrenamiento que solo se activan bajo condiciones específicas.
Extracción de datos de entrenamiento
Técnicas de memorization extraction para verificar si el modelo puede reproducir información sensible del corpus de entrenamiento, exponiendo datos privados o propietarios.
Inferencia de pertenencia
Membership inference attacks para determinar si un dato concreto formó parte del corpus de entrenamiento, con implicaciones directas para la privacidad y el RGPD.
Universal Trigger
Secuencias de tokens que modifican el comportamiento del modelo de forma predecible y transferible. Detecta activadores ocultos que generan respuestas no autorizadas en producción.
Suite Builder
Selección manual de ataques para quienes prefieren configurar la evaluación a medida. Disponible en el plan Pro.
Cobertura normativa por familia de ataque
Secvex ALT cubre las categorías de vulnerabilidad adversarial que las Guías 11 y 15 de AESIA identifican como relevantes para el Art. 15 del EU AI Act, complementadas con el OWASP Top 10 for LLM Applications 2025.
| Categoría (AESIA Guía 11) | Familia de ataque en Secvex ALT | Marco adicional |
|---|---|---|
| Puertas traseras y envenenamiento de modelo | Backdoor (fine-tuning) | OWASP LLM04 |
| Ataques de evasión y transferencia adversarial | Jailbreak / Universal Trigger | OWASP LLM01 |
| Extracción de modelo y datos de entrenamiento | Extracción de datos de entrenamiento | OWASP LLM02 |
| Inferencia de pertenencia y propiedades | Inferencia de pertenencia | OWASP LLM02 |
| Fuga de instrucciones del sistema | Jailbreak — sub-test system prompt | OWASP LLM07 |
Presets de Compliance Scan
No hace falta saber qué ataque corresponde a cada norma. Elige el preset según qué informe necesitas.
Escaneo completo AI Act
Evalúa las categorías de vulnerabilidad adversarial identificadas en el Art. 15 del EU AI Act y las Guías 11 y 15 de AESIA. Genera documentación técnica de apoyo estructurada para el proceso de conformidad.
Escaneo OWASP Top 10
Mapea cada ataque al OWASP Top 10 for LLM Applications 2025. Ideal para equipos que necesitan acreditar adhesión al estándar de facto de seguridad en LLMs.
Escaneo completo
Combina todas las familias de ataque disponibles. Máxima cobertura para organizaciones que deben demostrar cumplimiento simultáneo con múltiples marcos normativos.
Alcance actual de Secvex ALT
Secvex ALT audita exclusivamente sistemas de IA generativa de texto: chatbots, copilotos, asistentes RAG, motores de resumen y extracción de información.
No cubre todavía: clasificadores tabulares (scoring de crédito, detección de fraude, concesión de ayudas públicas) ni sistemas biométricos (reconocimiento de imagen o audio).
Defensa configurable
Incluye una capa de defensa configurable para medir la efectividad de las salvaguardas del sistema durante la evaluación y ajustarlas antes del despliegue.
¿Por qué tu empresa necesita testing adversarial ahora?
En agosto de 2026 entran en plena vigencia las obligaciones del EU AI Act para sistemas de IA de alto riesgo (Anexo III). Las empresas que despliegan modelos de lenguaje en sectores críticos necesitan documentar la evaluación de robustez adversarial de sus sistemas como parte de los procesos de gestión de riesgos que el marco regulatorio contempla.
Fecha clave: agosto 2026
Plena vigencia del EU AI Act para sistemas de alto riesgo del Anexo III. A partir de esa fecha, los deployers deben poder demostrar cumplimiento del Art. 9 (gestión de riesgos) y el Art. 15 (robustez y ciberseguridad) ante las autoridades competentes, con documentación técnica que acredite el proceso de evaluación realizado.
El EU AI Act, NIS2 y DORA establecen regímenes de sanciones para el incumplimiento de sus requisitos. Las cuantías dependen de la gravedad de la infracción y el volumen de negocio de la organización. Para valorar la exposición regulatoria concreta de tu organización, consulta con un asesor jurídico especializado.
Art. 9 — EU AI Act
Gestión de riesgos
Obliga a establecer un sistema de gestión de riesgos continuo durante todo el ciclo de vida del sistema de IA, con identificación, evaluación y mitigación documentada.
Art. 15 — EU AI Act
Robustez y ciberseguridad
Exige que los sistemas de IA de alto riesgo sean robustos frente a intentos de terceros no autorizados de alterar su comportamiento, incluyendo ataques adversariales.
Art. 26 — EU AI Act
Obligaciones del deployer
El deployer es responsable del uso conforme del sistema, independientemente del provider. Las obligaciones —y las multas— recaen sobre quien despliega el modelo en producción.
Planes
Cada organización tiene necesidades distintas. Hablamos contigo para encontrar la solución más adecuada.
Demo
Gratis
Empieza a evaluar sin compromiso
- 16 ataques base (Jailbreak, Universal Trigger, Backdoor)
- Entorno 100% offline
- Informe de resultados básico
- Sin presets de Compliance Scan
- Sin informe de compliance PDF
Pro
Disponible
Para equipos con obligaciones de compliance
- Todo lo incluido en Demo
- Nuevas familias: extracción de datos de entrenamiento, inferencia de pertenencia, fuga de system prompt
- 3 presets de Compliance Scan (AI Act · OWASP Top 10 · Completo)
- Suite builder visual para selección manual de ataques
- Historial completo de escaneos
- Informe PDF con severity index, mapeo OWASP+AI Act, audit trail SHA-256, persona responsable y fecha de emisión
El cliente firma el informe como autoevaluación — diseñado para documentar la evaluación de robustez como parte del proceso de diligencia debida (contexto Art. 26 EU AI Act).
Evaluamos cada caso 1 a 1
Business
Próximamente
Para organizaciones con exigencia máxima
- Todo lo incluido en Pro
- Monitorización continua programada (Art. 72 EU AI Act)
- Evaluación de defensas propias del cliente
- Comparación multi-modelo y API + CI/CD
- Secvex firma el informe como tercero independiente — elaborado con respaldo de un evaluador externo, lo que refuerza la credibilidad de la documentación técnica aportada
Evaluamos cada caso 1 a 1
El informe de compliance de Secvex ALT
El informe de compliance de Secvex ALT es un documento técnico estructurado que recoge los resultados del testing adversarial, mapea cada hallazgo a los marcos normativos aplicables, y genera un registro de auditoría con integridad verificable. Está diseñado para ser presentado como documentación técnica de apoyo en procesos de conformidad regulatoria.
Índice de severidad por familia de ataque
Bajo / Medio / Alto / Crítico — prioriza los hallazgos por impacto real en el sistema evaluado para que el equipo técnico sepa por dónde empezar.
Mapeo a OWASP LLM Top 10 2025
Cada resultado vinculado a la categoría de vulnerabilidad del estándar de facto en seguridad de LLMs. Facilita la comunicación con equipos de seguridad y auditores.
Mapeo al Art. 15 del EU AI Act y Guías AESIA
Para los ataques con anclaje regulatorio directo: Backdoor fine-tuning, extracción de datos, inferencia de pertenencia y Universal Trigger con gradiente.
Audit trail SHA-256
Hash del conjunto de resultados que garantiza que el informe no ha sido modificado desde su generación. Verificable por terceros de forma independiente.
Persona responsable y fecha de emisión
Campos requeridos por el Anexo IV.2(g.4) del EU AI Act para la documentación técnica de sistemas de IA de alto riesgo.
Dos modos de firma
Autoevaluación (Pro): el cliente firma como responsable del proceso de testing realizado.
Auditoría externa (Business): Secvex firma como tercero independiente, añadiendo credibilidad como documentación de un evaluador externo.
El informe no constituye una certificación de conformidad regulatoria. Es documentación técnica del proceso de testing adversarial realizado, diseñada para apoyar —no sustituir— el proceso de conformidad de la organización.
¿Tu sector ya está en el punto de mira regulatorio?
El EU AI Act prioriza los sectores con mayor impacto en los derechos fundamentales y la seguridad pública.
Infraestructura crítica OT
Obligación NIS2 como entidad esencial. Los sistemas de control industrial con IA incorporada deben acreditar robustez frente a manipulación adversarial antes del despliegue.
Fintech y banca
Cumplimiento DORA (Reglamento 2022/2554) y EU AI Act Art. 26. Los modelos de scoring crediticio, antifraude y atención al cliente en fintech son sistemas de alto riesgo del Anexo III.
RRHH y empleo
El EU AI Act clasifica los sistemas de selección de personal y evaluación de candidatos como de alto riesgo (Anexo III). Testing adversarial contemplado en la normativa aplicable a partir de agosto 2026.
Salud
Dispositivos médicos con IA (MDR, IVDR) y sistemas de apoyo diagnóstico en el Anexo III del EU AI Act. Cualquier vulnerabilidad adversarial en un modelo de salud tiene implicaciones de seguridad de paciente.
Administración pública
Los sistemas de IA de la Administración para prestaciones, gestión de beneficiarios y análisis de solicitudes son Anexo III. El sector público también es multable y además enfrenta responsabilidad política y reputacional.
Si tu organización despliega modelos de lenguaje en alguno de estos sectores, el marco regulatorio contempla requisitos de evaluación de robustez adversarial. La situación regulatoria de cada organización es específica — hablamos contigo para valorar la tuya.
Evalúa tu situación regulatoriaPreguntas frecuentes
Respuestas directas sobre adversarial testing, normativa y Secvex ALT.
¿Qué es el adversarial testing en IA?
El adversarial testing en IA es un proceso sistemático para evaluar la resistencia de modelos de lenguaje frente a entradas maliciosas diseñadas para evadir sus restricciones de seguridad. Mediante técnicas como jailbreak, ataques de Universal Trigger y backdoor injection, identifica vulnerabilidades antes de que actores maliciosos las exploten en producción. Es el equivalente al penetration testing tradicional aplicado a sistemas de IA.
¿Cómo se cumple el Artículo 15 del EU AI Act?
El Artículo 15 del EU AI Act exige que los sistemas de IA de alto riesgo sean robustos frente a errores, fallos y ataques adversariales. Para cumplirlo, las organizaciones deben realizar evaluaciones de robustez documentadas y demostrar que el sistema ha sido testado bajo condiciones adversas. Secvex ALT automatiza estas evaluaciones y genera documentación técnica de apoyo para el proceso de conformidad, diseñada para ser presentada como evidencia del testing adversarial realizado.
¿Secvex ALT funciona on-premise o en la nube?
Secvex ALT funciona exclusivamente on-premise y offline. Ningún dato de tu modelo, tus prompts ni tus resultados sale de tu infraestructura. Esto es crítico para empresas en sectores regulados —fintech, salud, infraestructura crítica— donde los datos no pueden procesarse en sistemas externos. La instalación se realiza en el entorno del cliente y no requiere conectividad a internet durante la evaluación.
¿Qué diferencia a Secvex de otras herramientas de AI red teaming?
Secvex ALT se diferencia en tres aspectos clave: opera 100% on-premise sin enviar datos a servidores externos; genera informes de compliance directamente mapeados a los artículos del EU AI Act, las Guías 11 y 15 de AESIA, y OWASP LLM Top 10 2025, con trazabilidad SHA-256; e incluye una capa de defensa configurable que permite medir la efectividad de las propias salvaguardas del cliente durante la evaluación.
¿Qué sistemas de IA puede auditar Secvex ALT?
Secvex ALT audita exclusivamente sistemas de IA generativa basados en texto: chatbots, copilotos de código, asistentes RAG, motores de resumen de documentos y sistemas de extracción de información. No audita (todavía) clasificadores tabulares —scoring de crédito, detección de fraude, concesión de ayudas públicas— ni sistemas biométricos —reconocimiento facial, de voz o de imagen—. Esta delimitación evita expectativas erróneas y garantiza que los resultados sean técnicamente válidos.
¿Qué diferencia un informe de autoevaluación de uno auditado por Secvex?
En el plan Pro, el cliente firma el informe como autoevaluación propia: documentación diseñada para acreditar el proceso de diligencia debida (contexto Art. 26 EU AI Act). En el plan Business, Secvex firma como tercero independiente, lo que añade credibilidad como documentación elaborada por un evaluador externo. La diferencia es análoga a un CRO en un ensayo clínico: genera la evidencia técnica, no el certificado regulatorio final.
¿En qué se diferencia Secvex de una certificación ISO 42001 (AENOR)?
ISO 42001 certifica que una organización ha implementado un Sistema de Gestión de IA con procesos de gobernanza documentados. Secvex ALT ejecuta ataques adversariales reales contra el modelo y genera evidencia técnica reproducible sobre su comportamiento bajo presión. Son complementarios, no excluyentes: la ISO certifica el proceso; Secvex demuestra que el modelo resiste los ataques que el regulador exige evaluar.
¿Cuándo entra en vigor el EU AI Act para sistemas de alto riesgo?
Las obligaciones para sistemas de IA de alto riesgo del Anexo III entran en plena vigencia en agosto de 2026. A partir de esa fecha, los deployers deben poder demostrar cumplimiento del Artículo 9 (gestión de riesgos) y el Artículo 15 (robustez y ciberseguridad) ante las autoridades competentes, con documentación técnica auditada y trazable.
¿Qué información incluye el informe de compliance de Secvex ALT?
El informe de compliance (plan Pro y Business) incluye: índice de severidad por familia de ataque, mapeo completo a OWASP LLM Top 10 y EU AI Act, audit trail con hash SHA-256 para garantizar la integridad ante auditores, persona responsable y fecha de emisión. El documento está diseñado para ser presentado directamente a auditores de conformidad regulatoria como evidencia técnica reproducible.
Hablemos
Cada caso es distinto — hablemos y evaluamos tu situación.
Sin compromiso
Analizamos tu situación regulatoria antes de hablar de producto.
Confidencial
Toda la información que compartes con el equipo de Secvex es confidencial.
Respuesta rápida
El equipo de Secvex responde en menos de 24 horas hábiles.
Correo directo
pmateu@secvex.es