Des chercheurs de l’Université Concordia proposent une nouvelle méthode pour filtrer les messages indésirables
Montréal, le 20 novembre 2012 – Tout le monde en rêve : tous les pourriels facilement renvoyés à la poubelle. De nos jours, les messages indésirables polluent les boîtes de réception du monde entier pour vanter les mérites de pilules soi-disant miraculeuses et attirer les plus crédules avec des histoires de comptes bancaires extraterritoriaux renfermant des fortunes secrètes.
Or, ces messages intrus, auparavant constitués d’un simple texte, se sont récemment perfectionnés au moyen d’images multicouches qui trompent les filtres automatiques. Heureusement, grâce à une méticuleuse enquête cybernétique, des chercheurs de l’Institut d’ingénierie des systèmes d’information de l’Université Concordia travaillent à un remède.
La doctorante Ola Amayri et son directeur de thèse, le Pr Nizar Bouguila ont en effet réalisé une étude approfondie de plusieurs filtres antipourriel afin d’en concevoir un nouveau qui soit encore plus efficace. Ils ont ainsi proposé un nouveau cadre statistique inédit pour le filtrage antipourriel qui bloque rapidement et efficacement les messages indésirables.
« La majorité des recherches précédentes se sont concentrées sur le contenu textuel des pourriels, sans tenir compte des éléments visuels qui se trouvent dans le contenu multimédia, comme les images. En examinant les composants textuels et graphiques simultanément, nous avons pu proposer une nouvelle méthode pour trier le courrier indésirable », explique la chercheuse, qui a récemment diffusé en ligne les résultats de ses travaux dans le cadre d’une série de colloques internationaux et de revues avec comité de lecture.
Selon Ola Amayri, la nouvelle génération de concepteurs de pourriels recourt souvent à des ruses subtiles, par exemple cacher délibérément du texte, masquer des mots avec des symboles, et allier des ensembles d’images identiques à des couleurs et des arrière-plans différents qui peuvent contenir du texte pris au hasard sur le Web. Jusqu’à ce jour, la plupart des recherches dans le domaine des filtres étaient axées sur l’extraction et l’analyse automatiques du contenu textuel des pourriels, faisant abstraction de leur nature riche en images. Pourtant, lorsque ces deux éléments sont combinés, les filtres antipourriel classiques sont incapables de stopper les messages, justement parce qu’ils analysent en général soit les textes, soit les images, mais rarement les deux.
Comment, alors, bloquer les pourriels avant qu’ils ne polluent nos boîtes de réception? « Notre nouvelle méthode est capable de s’adapter à la nature dynamique des pourriels, poursuit Amayri. Elle en déjoue avec précision les stratagèmes en analysant soigneusement les éléments informatifs qui sont automatiquement extraits des textes et des images. »
Grâce à des expériences poussées sur les méthodes de filtrage classiques généralement axées sur les composants ou textuels, ou graphiques, la chercheuse a pu élaborer un filtre beaucoup plus puissant fondé sur les techniques de reconnaissance des formes et d’exploration de données. Bien que cette nouvelle méthode n’ait été testée que sur les pourriels rédigés en anglais, Amayri précise qu’elle peut facilement être appliquée à différentes langues.
Aussi, même si leur approche en est toujours au stade du développement, la chercheuse travaille actuellement à un module d’extension pour SpamAssassin, le logiciel libre antipourriel le plus utilisé dans le monde. Elle espère ainsi permettre à d’autres chercheurs de poursuivre les tests et de progresser encore davantage dans le domaine de la détection du courrier indésirable.
« Les polluposteurs adaptent constamment leurs méthodes pour échapper aux filtres, conclut-elle. Les chercheurs doivent se concerter pour pouvoir, eux aussi, ajuster continuellement leurs procédés et parvenir à rejeter tous les pourriels. C’est ainsi que nous pourrons nous concentrer sur les messages qui sont réellement importants. »
Partenaires de recherche : Cette recherche a pu être menée à terme avec l’appui du Conseil de recherches en sciences naturelles et en génie du Canada (CRSNG).
Liens connexes
- Département de génie électrique et informatique de Concordia
- Institut d’ingénierie des systèmes d’information de Concordia
- Conseil de recherches en sciences naturelles et en génie du Canada
Source :
Cléa Desjardins
Conseillère principal, relations avec les médias
Service de communications de l'Université Concordia
Université Concordia
Téléphone : 514 848-2424, ext. 5068
Courriel : clea.desjardins@concordia.ca
Web : concordia.ca/now/media-relations
Twitter : twitter.com/CleaDesjardins
