- El “red team” de GPT-4 lo han configurado un grupo de expertos a nivel mundial cuyo objetivo era encontrar fallos y vulnerabilidades en el sistema y evaluar sus capacidades y riesgos de uso
- El trabajo ha ayudado a investigar riesgos iniciales, motivar la investigación sobre seguridad, realizar pruebas iterativas en áreas clave y reducir los riesgos en muchas áreas identificadas
València, 22 de abril de 2023. Un equipo de investigadores del instituto VRAIN de la Universitat Politècnica de València (UPV) ha colaborado recientemente con OpenAI en la evaluación y mejora de GPT-4, el nuevo modelo de lenguaje basado en inteligencia artificial.
El equipo integrado en el instituto VRAIN de la UPV, ha sido parte del “red team” de GPT-4, cuya misión era encontrar fallos y vulnerabilidades en el sistema, así como evaluar sus capacidades y posibles riesgos asociados a su uso.
La colaboración se realizó debido a la experiencia del grupo de investigación en la evaluación de la Inteligencia Artificial (IA) y sus anteriores trabajos con OpenAI. Investigadores de OpenAI se pusieron en contacto con el equipo de investigadores de VRAIN de la UPV para solicitar su ayuda en la evaluación de GPT-4, dada la relación entre sus áreas de investigación.
Identificación de riesgos iniciales e investigación en seguridad
El equipo, compuesto por Yael Moros, Lexin Zhou, Wout Schellaert, Cèsar Ferri y José Hernández-Orallo, ha trabajado con otros investigadores de fuera y dentro de OpenAI en el “red team”. Su labor consistió en la identificación de riesgos y vulnerabilidades en el sistema, adoptando la mentalidad y métodos de posibles atacantes, así como en la evaluación de las capacidades de GPT-4 y el potencial exceso de confianza de los usuarios en el mismo.
El trabajo realizado por el equipo del instituto VRAIN de la UPV ayudó a identificar riesgos iniciales, motivar la investigación sobre seguridad, realizar pruebas iterativas en áreas clave y reducir los riesgos en muchas áreas identificadas. También permitió comprender mejor las capacidades de GPT-4, sus mejoras con respecto a modelos anteriores y si estaba avanzando en la dirección deseada.
Sistemas más seguros y gran salto en rendimiento
Los investigadores destacan la determinación del “red team” para conseguir sistemas más seguros y el gran salto en rendimiento de GPT-3 a GPT-4 en solo dos años. Aunque consideran que es importante utilizar GPT-4 con cautela para evitar una dependencia excesiva. Y opinan que tiene un gran potencial para cambiar la forma en que se trabaja, automatizando tareas tediosas y permitiendo centrarse en tareas más desafiantes y divertidas.
En el ámbito de la ingeniería informática, GPT-4 podría influir significativamente en el proceso de desarrollo de software y hardware, mejorar la productividad en tareas como generación de código, detección y corrección de errores, generación de documentación, revisión y optimización de código, extracción y resumen de conocimientos o ciberseguridad, entre otros.