La ciberseguridad se ha convertido en un elemento transversal que afecta a todos los aspectos de la vida cotidiana. Desde nuestros datos personales hasta las infraestructuras críticas que aportan elementos indispensables para que la ciudadanía pueda verse afectada por un ciberataque.

Ante esta situación, es imprescindible desarrollar técnicas cada vez más complejas para proteger la información, pero también para detectar y prevenir todo tipo de accesos maliciosos. En este campo, la aplicación de algoritmos de aprendizaje automático (machine learning o ML, en su versión anglosajona) permite anticiparse a muchas situaciones críticas, por lo que su estudio en el contexto académico es fundamental.

Dentro de esta línea de estudio, la incipiente disciplina de la computación cuántica abre un nuevo y fascinante campo de trabajo donde los principios de la física cuántica se aprovechan para poner a nuestra disposición una capacidad de cómputo difícilmente alcanzable con la computación clásica.

Carlos Rosa y Pino Caballero en un congreso en Washington.

El trabajo realizado y publicado en la revista Optimization and Engineering, editada por Springer, que firma el doctorando de la Universidad de La Laguna Carlos Rosa Remedios tutorizado por la catedrática Pino Caballero Gil, parte de este punto para explorar terrenos aún poco estudiados, como es trasladar al mundo cuántico los algoritmos tradicionales de aprendizaje automático, analizando su capacidad para identificar determinados ataques de ciberseguridad.

Esto lleva aparejado un proceso laborioso que comienza con la obtención de un conjunto de datos (dataset) que aglutine información sobre ataques ya realizados, donde se identifican una serie de variables, denominadas características, que permiten caracterizar el posible ataque frente a una situación de normalidad, asignando a cada conjunto de valores una etiqueta que nos dice si corresponden a un ataque o no.

Pero al utilizar computación cuántica, ese conjunto de datos requiere unas condiciones especiales, por lo que ha sido necesario aplicar diferentes técnicas antes de su uso en el mundo cuántico: conversión de variables alfanuméricas a numéricas, ajuste de la cantidad de características disponibles (lo que se conoce como ajuste de la dimensionalidad) o control del balanceo (asegurar que, aproximadamente, tengamos los mismos datos que reflejen un ataque que los que reflejan situaciones de normalidad). Para facilitar la comprensión del trabajo se ha incluido una sección donde se detallan tanto los principios básicos de la computación cuántica como la base matemática de los diferentes algoritmos usados posteriormente.

Tras este proceso, se desarrolla una minuciosa metodología para implementar en el contexto cuántico los algoritmos de machine learning (lo que se conoce como Quantum Machine Learning o QML).  En primer lugar, se ha realizado un mapeo de características, transformando los datos clásicos del dataset en estados cuánticos, usando la unidad fundamental de trabajo: el qubit. Posteriormente se aplica un circuito cuántico parametrizado o ansatz y se emplea un algoritmo de optimización que termina de conformar el proceso de QML.

En este trabajo se analizan desde el punto de vista cuántico tres problemas de ciberseguridad, como son la detección de programas maliciosos (malware) en sistemas Android, el correo Spam y el Phising en páginas web.

Además de detallar de forma precisa todos los pasos y técnicas necesarias para llevar un dataset tradicional hacia la aplicación de algoritmos de QML, el principal foco de estudio ha sido identificar las combinaciones óptimas entre los algoritmos disponibles en cada etapa del proceso.

Esto ha llevado a realizar un amplio análisis comparativo entre las diferentes combinaciones de algoritmos empleados en QML, obteniendo en algunas de ellas resultados que muestran precisiones cercanas a los algoritmos de Ml clásico. Teniendo en cuenta el tiempo de evolución de los algoritmos clásicos y comparándolo con la casi incipiente disciplina del Quantum Machine Learning, esto supone un avance significativo que hace prever un futuro prometedor en este campo.

A su vez, se han confrontado las arquitecturas de los procesadores x86 de INTEL con las de los procesadores ARM (en este caso, la arquitectura SILICON de APPLE) obteniendo de forma generalizada una reducción del tiempo de cómputo apreciable cuando se utiliza esta última, lo que abre la puerta a futuras líneas de trabajo sobre esta arquitectura.