L’intelligence artificielle et la cyber sécurité
L’intelligence artificielle et la cyber sécurité
Le terme Intelligence Artificielle suscite depuis longtemps de nombreux fantasmes, craintes et inquiétudes véhiculées par les récits ou films de science-fiction ainsi que dans les essais philosophiques. Avec les progrès de l’informatique et la numérisation de notre société, les Intelligences Artificielles n’ont jamais engendré autant d’intérêts. Voitures intelligentes, téléphones intelligents, systèmes de surveillance intelligents, ces machines se répandent de plus en plus dans le quotidien de l’homme que ce soit dans les domaines de la santé, du commerce, de la domotique ou des transports.
Alors qu’en est-il de l’IA dans le domaine de la cyber sécurité ?
Qu’est-ce que l’Intelligence Artificielle ?
Une Intelligence Artificielle (IA) est un système qui simule un comportement humain afin de résoudre des problèmes complexes. Ce comportement, elle le simule au travers de différents concepts et techniques mettant en œuvre plusieurs domaines comme la neurobiologie computationnelle, la logique mathématique et bien sur l’informatique.
Quant aux problèmes que l’IA permet de résoudre, ils peuvent être de différents types, reconnaissance d’images, gestion des finances, contrôle de robots…
Quand on parle d’IA, on entend souvent le terme Machine Learning (ML). Pour donner une définition simple, on peut dire que les algorithmes de ML sont des algorithmes qui apprennent des modèles à partir d’un large éventail de données (généralement une ou plusieurs bases de données).
De cette manière, au lieu d’écrire et éditer des règles strictes manuellement, un algorithme de ML va apprendre et reconnaître le modèle mathématique grâce aux données brutes qu’on lui fournit.
Comment l’IA intervient dans la sécurisation des sites web ?
Justement avec le Machine Learning ! Comme je viens de vous l’expliquer au-dessus, le ML va se nourrir d’une énorme quantité de données afin de construire un modèle mathématique qui suit un schéma bien précis. Faisons un focus sur ce schéma en prenant un exemple (au hasard) : un site web.
L’entreprise E travaille dans le bâtiment et possède un site sur internet pour attirer des clients. Sur ce site, elle expose quelques-unes de ses « réalisations » au travers d’articles et d’images prises sur les chantiers. Il y a bien sûr un formulaire de contact afin de pouvoir la joindre, ou même de s’y rendre.
Donc, sur ce site, un utilisateur lambda va arriver sur la page d’accueil, se balader dans les « réalisations » afin de se faire une idée du travail que réalise E, une fois convaincu l’utilisateur se rend sur le formulaire de contact, puis quitte le site.
Ceci constitue un scénario de comportement « normal » d’un utilisateur lambda. Et c’est de ces scénarios-là, que l’IA va tirer un « schéma comportemental », en observant le parcours de tous les utilisateurs à l’intérieur du site. Le modèle mathématique sera ainsi déduit à partir de tous ces déplacements standards d’un utilisateur.
Tout ceci ne nous dit toujours pas comment cette IA va vous aider à protéger votre site web me direz-vous ! En effet, j’y viens.
Imaginons maintenant qu’un utilisateur malintentionné arrive sur le site de E. Cet utilisateur souhaite ne plus rendre accessible le site web en générant une énorme quantité de requêtes d’accès par seconde à la page d’accueil, la conséquence pour E serait une perte de clients et donc un manque à gagner, cela ne peut être admissible.
Quelles sont les conséquences d’une cyberattaque ?
Faisons une courte parenthèse pour parler des conséquences d’une attaque sur le SI d’une entreprise. Ils sont multiples et varient en fonction de la volonté de l’attaquant : un concurrent de E pourrait nuire à l’image de marque de l’entreprise en volant des données client, on peut ici citer Facebook comme exemple, ces dernières années son image a lourdement été entachée.
Prenons une autre situation, un hacker infiltre le réseau et déploie un ransomware, ce dernier va infecter tout le réseau et chiffrer les disques durs de tous les ordinateurs, rendant les données inaccessibles. L’attaquant prend l’entreprise en otage. Il va ensuite demander à l’entreprise de payer une certaine somme d’argent, sans quoi elle perdra toutes ces données. Selon une étude d’IBM Security, la moyenne des sommes payées par les entreprises se situait autour de 2500 euros en 2016, mais certaines de ses entreprises avouaient avoir versé plus de 10 000 euros…
Qu’est-ce qu’un score de réputation ?
Bon, revenons à notre exemple avec notre entreprise du bâtiment, l’utilisateur malintentionné est en train de générer d’énorme quantités de requêtes vers le site de E afin de le saturer.
C’est dans ce score que réside la clef du système. À chaque nouvelle requête suspecte, le score de réputation qu’a attribuée notre IA à l’utilisateur malveillant va monter, une fois atteint un certain seuil, l’utilisateur va passer de « suspect » à « malveillant », et notre IA va le bannir. Ainsi, toutes ses requêtes ne seront pas transmises au site, qui restera disponible pour de potentiels clients de E.
C’est là que notre IA intervient, lorsqu’elle va voir passer la première requête, elle va la considérer comme une demande d’un utilisateur lambda, comme si un utilisateur arrivait sur le site. Puis va venir la seconde, avec un différentiel de quelques millisecondes, voire moins, et la nôtre d’IA va commencer à trouver cela suspect. Pourquoi un utilisateur voudrait ré accéder à la page d’accueil, alors qu’il vient de le faire ? Il a peut-être un problème internet, la page s’est mal affichée, il a rafraichi la page trop de fois… bref ce n’est pas forcément un comportement malveillant, c’est pour cela que notre IA ne va, pour l’instant, rien faire, si ce n’est attribuer un « score de réputation » à notre utilisateur.
Voilà comment l’IA intervient dans la sécurisation de vos sites web chez v6Protect, elle analyse le comportement des utilisateurs afin de différencier les utilisateurs lambda de ceux malveillants.
La majorité des Web Application Firewall (WAF) existant utilisent des règles strictes pour opérer. Ces règles doivent être rentrées et configurées manuellement par les équipes techniques et il faudra gérer ces règles quotidiennement afin de les maintenir. Cela demande du temps et des compétences. C’est sur ce point que l’IA prend tout son intérêt, grâce à l’auto-apprentissage, l’intervention des équipes techniques n’est plus nécessaire, pour la configuration et même la maintenance.
On pourrait même aller plus loin, puisque l’IA va continuer d’apprendre en permanence, elle va donc s’inscrire dans une politique d’amélioration continue.