Le nouvel IA RETVec de Gmail améliore la détection des spams de 38%
Google a déployé RETVec, un filtre anti-spam alimenté par l'IA qui détecte les spams obfusqués, améliorant la détection de 38% tout en réduisant les faux positifs de 19,4%. Voici ce que les professionnels du marketing par email doivent savoir.
Google a offert au filtre anti-spam de Gmail sa mise à jour la plus importante depuis des années, et les chiffres le prouvent. En remplaçant son ancien vectoriseur de texte par RETVec, Google a amélioré le taux de détection des spams de Gmail de 38% et réduit le taux de faux positifs de 19,4%. Selon Mailbird, cette mise à jour répond directement aux tactiques d'évasion sophistiquées qui ont régulièrement contourné les anciens filtres, avec des conséquences réelles pour chaque spécialiste du marketing tentant de rejoindre la boîte de réception Gmail.
Ce que RETVec fait réellement
La mise à jour, connue sous le nom de RETVec (Resilient and Efficient Text Vectorizer), représente une avancée majeure dans la technologie de classification de textes. Les filtres anti-spam traditionnels fonctionnent à partir de dictionnaires fixes et cherchent des modèles connus dans le texte. Cette approche s'effondre rapidement lorsque les spammeurs déforment intentionnellement leur contenu.
RETVec est conçu pour identifier les homoglyphes (lettres et symboles manipulés), les caractères invisibles et le texte bourré de mots-clés que les spammeurs utilisent pour contourner les filtres. En termes pratiques, cela signifie qu'il peut détecter les messages déguisés avec des tactiques comme la substitution de chiffres aux lettres ou l'insertion de caractères spéciaux entre les mots. RETVec convertit le texte en vecteurs numériques qui interprètent le sens des mots, ignorant les tours visuels, et comprend l'intention du message même avec ces manipulations en place.
Selon la description du projet sur GitHub, « RETVec est entraîné pour être résilient contre les manipulations au niveau des caractères, notamment l'insertion, la suppression, les fautes de frappe, les homoglyphes, la substitution LEET et bien d'autres. »
Crucialmente, les chercheurs de Google Elie Bursztein et Marina Zhang ont noté que « grâce à son architecture novatrice, RETVec fonctionne directement sur toutes les langues et tous les caractères UTF-8 sans besoin de prétraitement du texte, ce qui en fait le candidat idéal pour les déploiements de classification de textes sur appareil, web et à grande échelle. »
Le nouvel IA RETVec de Gmail améliore la détection des spams de 38%
Google a déployé RETVec, un filtre anti-spam alimenté par l'IA qui détecte les spams obfusqués, améliorant la détection de 38% tout en réduisant les faux positifs de 19,4%. Voici ce que les professionnels du marketing par email doivent savoir.
Google a offert au filtre anti-spam de Gmail sa mise à jour la plus importante depuis des années, et les chiffres le prouvent. En remplaçant son ancien vectoriseur de texte par RETVec, Google a amélioré le taux de détection des spams de Gmail de 38% et réduit le taux de faux positifs de 19,4%. Selon Mailbird, cette mise à jour répond directement aux tactiques d'évasion sophistiquées qui ont régulièrement contourné les anciens filtres, avec des conséquences réelles pour chaque spécialiste du marketing tentant de rejoindre la boîte de réception Gmail.
Ce que RETVec fait réellement
La mise à jour, connue sous le nom de RETVec (Resilient and Efficient Text Vectorizer), représente une avancée majeure dans la technologie de classification de textes. Les filtres anti-spam traditionnels fonctionnent à partir de dictionnaires fixes et cherchent des modèles connus dans le texte. Cette approche s'effondre rapidement lorsque les spammeurs déforment intentionnellement leur contenu.
RETVec est conçu pour identifier les homoglyphes (lettres et symboles manipulés), les caractères invisibles et le texte bourré de mots-clés que les spammeurs utilisent pour contourner les filtres. En termes pratiques, cela signifie qu'il peut détecter les messages déguisés avec des tactiques comme la substitution de chiffres aux lettres ou l'insertion de caractères spéciaux entre les mots. RETVec convertit le texte en vecteurs numériques qui interprètent le sens des mots, ignorant les tours visuels, et comprend l'intention du message même avec ces manipulations en place.
Selon la description du projet sur GitHub, « RETVec est entraîné pour être résilient contre les manipulations au niveau des caractères, notamment l'insertion, la suppression, les fautes de frappe, les homoglyphes, la substitution LEET et bien d'autres. »
Crucialmente, les chercheurs de Google Elie Bursztein et Marina Zhang ont noté que « grâce à son architecture novatrice, RETVec fonctionne directement sur toutes les langues et tous les caractères UTF-8 sans besoin de prétraitement du texte, ce qui en fait le candidat idéal pour les déploiements de classification de textes sur appareil, web et à grande échelle. »
L'ampleur du problème que RETVec cible
Le contexte est important ici. Les défenses alimentées par l'IA de Gmail arrêtent plus de 99,9% des spams, hameçonnages et malveillances avant qu'ils n'atteignent les boîtes de réception et bloquent près de 15 milliards d'emails indésirables chaque jour. Même à cette échelle, la manipulation de texte contradictoire avait été une faille efficace. Les spammeurs exploitaient l'écart entre ce qu'un œil humain pourrait lire et ce qu'un classificateur automatique pourrait analyser. RETVec a été construit spécifiquement pour combler cet écart.
Le système détecte également les emails contenant des homoglyphes, des caractères qui se ressemblent mais qui ont des significations distinctes, chose qui passait auparavant facilement à travers les filtres de Gmail.
Ce que les chiffres signifient pour les professionnels du marketing par email
L'amélioration de la détection de 38% fait les gros titres, mais la réduction des faux positifs de 19,4% est probablement le chiffre le plus important pour les expéditeurs légitimes.
La recherche Validity confirme qu'environ 1 email de marketing autorisé et basé sur la permission sur 6 échoue la livraison à la boîte de réception, représentant 16,7% du volume total d'envoi. C'est un manque à gagner significatif pour toute entreprise disposant d'un programme de marketing par email actif. Un filtre qui capture plus de spams tout en mal classant moins d'emails légitimes est directement utile aux spécialistes du marketing qui suivent les meilleures pratiques.
Bien que la détection des spams augmente avec le nouveau filtre d'IA, les faux positifs diminuent. Pour les professionnels du marketing par email qui font les choses correctement, l'espoir est que, à mesure que la détection des spams de Google devient plus intelligente, les emails légitimes ont une meilleure chance d'atteindre la boîte de réception principale, ce qui se traduit par une meilleure délivrabilité et une meilleure réputation d'expéditeur globale.
Si vous êtes un professionnel du marketing par email légitime concentré sur la livraison de contenu précieux conformément aux meilleures pratiques, RETVec peut s'assurer que vos véritables emails de marketing ont une plus grande chance d'atteindre la boîte de réception principale de vos destinataires au lieu d'être envoyés au dossier spam.
Le gain d'efficacité dont personne ne parle
RETVec a également livré une victoire d'efficacité matérielle qui a des implications en aval. Son efficacité informatique est impressionnante, réduisant l'utilisation des TPU (Tensor Processing Units) de 83%, ce qui permet à RETVec de fonctionner non seulement sur des serveurs robustes mais aussi sur les appareils aux ressources limitées, comme les smartphones, garantissant une protection en temps réel pour tous les utilisateurs de Gmail.
RETVec a été développé par Google Research et est entièrement open source. Après une longue période de test interne chez Google, l'entreprise l'a jugé « hautement efficace pour les applications de sécurité et de lutte contre les abus. »
Ce que les professionnels du marketing doivent faire maintenant
RETVec élève le niveau de ce que le filtre de Gmail peut détecter, mais ne change pas les principes fondamentaux de la bonne pratique d'envoi. Cela rend l'environnement meilleur pour les expéditeurs qui font les choses correctement, et pire pour ceux qui ne le font pas.
L'introduction de cet algorithme signifie que les expéditeurs doivent accorder une attention particulière au contenu des emails, en évitant le bourrage de mots-clés, en rendant les emails personnalisés et pertinents, en utilisant de préférence uniquement des caractères standards, et en éliminant les mots déclencheurs de spam.
Cette mise à jour s'accompagne également des exigences d'expéditeur plus larges de Google, qui ont pris effet en février 2024 et incluent désormais l'authentification obligatoire SPF, DKIM et DMARC pour les expéditeurs en masse. Les messages qui échouent l'authentification ou qui dépassent le seuil de taux de spam reçoivent maintenant des rejets permanents au niveau SMTP, et ne sont pas simplement filtrés vers le dossier spam.
Pour les équipes de croissance et les professionnels du marketing, l'effet combiné est simple: un expéditeur correctement authentifié avec des listes propres, du contenu pertinent et aucune manipulation de caractères a maintenant un chemin mesurément plus propre vers la boîte de réception. Ce n'est pas rien quand on considère que Litmus a découvert que le marketing par email génère entre 10x et 50x ROI pour 65% des programmes, avec un ROI moyen se situant entre 36 et 42 dollars pour chaque dollar dépensé, et ces retours ne se matérialisent que lorsque les emails atteignent réellement la boîte de réception.
L'ampleur du problème que RETVec cible
Le contexte est important ici. Les défenses alimentées par l'IA de Gmail arrêtent plus de 99,9% des spams, hameçonnages et malveillances avant qu'ils n'atteignent les boîtes de réception et bloquent près de 15 milliards d'emails indésirables chaque jour. Même à cette échelle, la manipulation de texte contradictoire avait été une faille efficace. Les spammeurs exploitaient l'écart entre ce qu'un œil humain pourrait lire et ce qu'un classificateur automatique pourrait analyser. RETVec a été construit spécifiquement pour combler cet écart.
Le système détecte également les emails contenant des homoglyphes, des caractères qui se ressemblent mais qui ont des significations distinctes, chose qui passait auparavant facilement à travers les filtres de Gmail.
Ce que les chiffres signifient pour les professionnels du marketing par email
L'amélioration de la détection de 38% fait les gros titres, mais la réduction des faux positifs de 19,4% est probablement le chiffre le plus important pour les expéditeurs légitimes.
La recherche Validity confirme qu'environ 1 email de marketing autorisé et basé sur la permission sur 6 échoue la livraison à la boîte de réception, représentant 16,7% du volume total d'envoi. C'est un manque à gagner significatif pour toute entreprise disposant d'un programme de marketing par email actif. Un filtre qui capture plus de spams tout en mal classant moins d'emails légitimes est directement utile aux spécialistes du marketing qui suivent les meilleures pratiques.
Bien que la détection des spams augmente avec le nouveau filtre d'IA, les faux positifs diminuent. Pour les professionnels du marketing par email qui font les choses correctement, l'espoir est que, à mesure que la détection des spams de Google devient plus intelligente, les emails légitimes ont une meilleure chance d'atteindre la boîte de réception principale, ce qui se traduit par une meilleure délivrabilité et une meilleure réputation d'expéditeur globale.
Si vous êtes un professionnel du marketing par email légitime concentré sur la livraison de contenu précieux conformément aux meilleures pratiques, RETVec peut s'assurer que vos véritables emails de marketing ont une plus grande chance d'atteindre la boîte de réception principale de vos destinataires au lieu d'être envoyés au dossier spam.
Le gain d'efficacité dont personne ne parle
RETVec a également livré une victoire d'efficacité matérielle qui a des implications en aval. Son efficacité informatique est impressionnante, réduisant l'utilisation des TPU (Tensor Processing Units) de 83%, ce qui permet à RETVec de fonctionner non seulement sur des serveurs robustes mais aussi sur les appareils aux ressources limitées, comme les smartphones, garantissant une protection en temps réel pour tous les utilisateurs de Gmail.
RETVec a été développé par Google Research et est entièrement open source. Après une longue période de test interne chez Google, l'entreprise l'a jugé « hautement efficace pour les applications de sécurité et de lutte contre les abus. »
Ce que les professionnels du marketing doivent faire maintenant
RETVec élève le niveau de ce que le filtre de Gmail peut détecter, mais ne change pas les principes fondamentaux de la bonne pratique d'envoi. Cela rend l'environnement meilleur pour les expéditeurs qui font les choses correctement, et pire pour ceux qui ne le font pas.
L'introduction de cet algorithme signifie que les expéditeurs doivent accorder une attention particulière au contenu des emails, en évitant le bourrage de mots-clés, en rendant les emails personnalisés et pertinents, en utilisant de préférence uniquement des caractères standards, et en éliminant les mots déclencheurs de spam.
Cette mise à jour s'accompagne également des exigences d'expéditeur plus larges de Google, qui ont pris effet en février 2024 et incluent désormais l'authentification obligatoire SPF, DKIM et DMARC pour les expéditeurs en masse. Les messages qui échouent l'authentification ou qui dépassent le seuil de taux de spam reçoivent maintenant des rejets permanents au niveau SMTP, et ne sont pas simplement filtrés vers le dossier spam.
Pour les équipes de croissance et les professionnels du marketing, l'effet combiné est simple: un expéditeur correctement authentifié avec des listes propres, du contenu pertinent et aucune manipulation de caractères a maintenant un chemin mesurément plus propre vers la boîte de réception. Ce n'est pas rien quand on considère que Litmus a découvert que le marketing par email génère entre 10x et 50x ROI pour 65% des programmes, avec un ROI moyen se situant entre 36 et 42 dollars pour chaque dollar dépensé, et ces retours ne se matérialisent que lorsque les emails atteignent réellement la boîte de réception.