Le 11 octobre 2009

Astuce : comment filtrer ses spams avec Gmail


Google gmail spam Une suite d’astuces qui devrait en aider plus d’un.

Disons-le tout de suite : le filtre anti-spam de Gmail est bon, si ce n’est l’un des meilleurs. Mais comme tous les anti-spams, il peut commettre des erreurs. Voici comment les détecter efficacement, et pourquoi vous devez les détecter.

Les deux erreurs possibles du filtre anti-spam

Premier type d’erreur, le plus visible : les faux-négatifs. Il s’agît des e-mails indésirables qui atterrissent dans votre boîte de réception. Il sont de plus en plus rares de nos jours. Ils sont également facilement repérables : un e-mail pour vous vendre du viagra rédigé en cyrillique quand vous êtes une jeune femme ne parlant pas un mot de russe, pas la peine d’ouvrir l’e-mail pour comprendre de quoi il s’agît, vous le marquez directement comme spam et l’affaire est réglée.

Second type d’erreur, le plus problématique : les faux-positifs. Ce sont des courriels qui vous sont bien destinés, qui ne sont pas des spams à vos yeux, et qui atterrissent pourtant dans votre boîte de spams. Le problème vient du fait que la majorité des internautes ne regarde jamais le contenu de ce répertoire. Rien de grave si c’était un message de votre belle-mère vous invitant à participer à une réunion avec le club de tricot du troisième-âge, ça le devient si c’est un message de votre patron vous demandant quelque-chose de toute urgence…

De la nécessité de filtrer ses spams

Boite de spam Gmail

Étant donné que les messages importants sont de plus en plus couramment envoyés par e-mail, et que les filtres anti-spams ne seront probablement jamais parfaits, il devient nécessaire de vérifier régulièrement le contenu de sa boîte de spams.

Avec Gmail les messages marqués comme « pourriel » sont conservés 30 jours. Si vous recevez très peu de messages, vous devriez jeter un œil à votre boîte de spams qu’une fois par mois, le tri pour retrouver d’éventuels faux-positifs devrait se faire rapidement. À l’inverse, si comme votre fidèle serviteur vous avez une pléiades d’adresses e-mails, toutes plus ou moins connues aux quatre coins du web et recevez des dizaines de messages chaque jour (sans compter les spams), mieux vaut nettoyer cette même boîte trois fois par jour.

Les étapes pour bien trier ses spams avec Gmail

Problème : faire le tri de ses spams, ça prend du temps. Et en général, si vous vérifiez et supprimez ces messages un par un, arrivé à la fin il vous en reste le double. Voici donc les quelques astuces pour vous faire gagner du temps, avec Gmail.

La première chose à faire, c’est de rechercher rapidement si parmi ces milliers de spams il y en a qui vous serons adressés à coup sur. Il s’agît de rechercher si des e-mails contiennent votre nom de famille ou le nom de votre société (nota bene: cette astuce ne fonctionne pas si ces informations sont présentes dans votre adresse e-mail…) ou encore des informations qui vous concernent. Cela donne la requête suivante à effectuer dans Gmail : « Y allerin:spam (« John Locke » OR « Locke John » OR « Lost ») » pour l’aventurier chauve ou encore, dans mon cas, juste « Y allerin:spam Google« . Avec les quelques résultats obtenus, supprimez définitivement ceux qui ne vous concernent pas, et déplacez dans la boîte de réception les autres — le bouton pour effectuer cette opération s’intitule « Move to inbox » en anglais, « non-spam » en français.

Si jamais plusieurs messages d’une même personne sont systématiquement classés comme spam, ajoutez son adresse e-mail à la liste de vos contacts Gmail.

Les deux étapes suivantes consistent à supprimer définitivement les e-mails que vous savez pertinemment être des spams. Ils sont de deux types : ceux qui ne sont pas dans une langue que vous comprenez (étape 2), et ceux qui vous parlent de viagra, crédits et autres sujets que les expéditeurs de messages indésirables adorent (étape 3).

Avec Gmail, il existe l’opérateur « lang: » pour filtrer les messages en fonction de leur langue, mais il n’est pas parfaitement efficace. Tous les messages retournés par la requête « lang:fr » seront bien en français, mais tous les messages en français ne seront pas forcément retournés. Encore moins ceux en SMS ou en « wesh / kikoolol ». Avec les opérateurs de Gmail, vous pouvez tout de même retirer tous les mails en russe ou chinois, mais aussi ceux provenant d’adresses enregistrées en Russie ou en Chine. Exemple de requêtes à effectuer dans la deuxième étape :

Y allerin:spam (from:.by OR from:.ru OR from:.cn OR from:.su OR from:.ua)

Y allerin:spam (lang:af OR lang:am OR lang:ar OR [plein d'autres langues étrangères ici] OR lang:chinese OR lang:zh-TW)

Bien entendu, si vous parlez polonais ou japonais, évitez de laisser « lang:pl » et « lang:ja dans la liste…

Jetez un coup d’œil aux premiers résultats — on ne sait jamais — puis cliquez sur le lien « Sélectionner : tous » ainsi que sur le lien apparaissant juste en dessous si vous avez plus de 50 résultats, et pressez enfin le bouton « Supprimer ».

La troisième étape consiste donc à retirer les vrais spams. Cette opération est la plus délicate, et chacun doit choisir ses mots-clés en fonction de son mode de vie, des abonnements et services auxquels vous avez souscrits, etc. Je peux ainsi supprimer tous les messages contenant le mot « Paypal » — qui sont généralement là pour vous hameçonner — puisque je n’ai pas de compte à ce service, ainsi que ceux contenant la marque de médicaments « Vicodin »; le docteur House ne considérerait peut-être pas ces messages comme des spams, lui.

Soyez libre d’ajouter des mots que vous rencontrez souvent dans votre boîte de spams. Attention à ne pas supprimer des spams contenant des mots qui peuvent être utilisés par vos véritables contacts ! Si vous supprimez systématiquement tous les messages qui contiennent le mot « Abidjan » car vous recevez souvent des demandes en mariage des femmes de cette ville, il est possible que vous puissiez supprimer l’e-mail annonçant votre mutation en Côte d’Ivoire sans même vous en rendre compte, noyé dans la masse… Mais ceci ne devrait pas se produire si vous avez filtré les messages avec votre nom et prénom au préalable.

Voici la liste des mots-clé indésirables généralement contenus dans les spams de votre humble serviteur :
Y allerin:spam (viagra OR casino OR « having trouble » OR rolex OR diploma OR « Dir Sir » OR Bank OR purchase OR buy OR logiciel OR « urgent notification » OR price OR paypal OR greetings OR « je me nomme » OR medical OR health OR unsubscribe OR subscribe OR « click here » OR « go here » OR download OR buy OR sex OR sexy OR penis OR vagina OR luxury OR bigger OR games OR smith OR love OR « pour votre information » OR Abidjan OR Ivoire OR money OR boutique OR mode OR hésité OR « votre reponse » OR underreported OR hotel OR watches OR encheres OR luxurious OR hôtel OR medicine OR vicodin OR credit)

Cela peut sembler sans queue ni tête, mais cela résulte de ce que j’ai pu constater comme expressions qui revenaient souvent. Une fois tous les résultats de cette requête supprimés, il ne devrait plus rester qu’à peine 2 à 20% de messages dans votre boîte de spams. Normalement cela devrait sufir à éliminer les derniers mails passés à travers les mailles du filet, et découvrir facilement les éventuels faux-positifs.

Si malgré toutes ces opérations il vous reste plus de 50 messages, vous pouvez passer à l’étape 4. Il s’agît de filtrer les résultats dans votre langue. Voici un filtre plutôt sommaire mais efficace :
Y allerin:spam (lang:fr OR « Bonjour » OR « Salut » OR « Coucou » OR « Bonsoir » OR « A bientôt » OR « Bisous »)
Cela vous permettra de récupérer une liste d’e-mails que vous pourrez étudier plus en détails, ou pas, en fonction de leur sujet.

Pour finir, vous devrez regarder au cas par cas les derniers e-mails qui restent. Dans le meilleurs des cas, le sujet à lui seul vous permettra de séparer le bon grain de l’ivraie. Voila, après ces quelques étapes vous verrez s’afficher le message « Hooray, no spam here! » (traduit sans humour en « OK, aucun spam » en français).

Filtrer c’est bien, rapidement c’est mieux

Plutôt que de retaper chaque jour les requêtes précédentes, vous devriez les enregistrer. Pour cela, rien de plus simple avec l’extension « Liens rapides » (Quicklinks en version originale) présente dans Gmail Labs. Copiez-collez l’une des requêtes ci-dessus, testez la dans Gmail, puis cliquez sur le lien « Ajouter un lien rapide » à gauche. Une boîte de dialogue vous demandera un titre et il sera ajouté dans le module. Pratique !

Les problèmes qui subsistent malgré tout…

Vous pouvez faire circuler cet article autour de vous, même à ceux qui n’utilisent pas Gmail comme client de messagerie : cela les aidera sans doute à prendre conscience de l’importance de trier ses spams. Pour information, avec Gmail je découvre pas moins de deux à trois faux-positifs par semaine, les filtres anti-spams des autres fournisseurs en générèrent peut-être plus.

Toutefois, les techniques de tri citées tout au long de cet article ne sont applicables qu’avec l’interface en ligne de Gmail. Si vous utilisez Microsoft Outlook ou Mozilla Thunderbird pour rapatrier vos courriels de la messagerie de Google, vous ne récupérerez pas ceux classés comme spam. Il existe bien une technique pour les récupérer, mais cela mélange les messages légitimes aux indésirables… Le problème est le même quand vous transférez automatiquement tous vos messages d’un compte Google vers un autre compte mail.

Bref, comme toujours sur le web, restez vigilant !

Publié le 11 octobre 2009 à 17:58 par dans Actualité

8 commentaires

  1. TOMHTML a dit :

    Si vous avez d'autres astuces de ce type, n'hésitez pas à nous les communiquer !

  2. lhm a dit :

    et puis pour eviter de donner son adresse mail a tout bout de champ, il existe des services très efficaces comme :
    http://www.trashmail.net
    http://www.yopmail.com
    http://www.jetable.org
    http://www.link2mail.net
    http://www.brefmail.com
    http://10minutemail.com

    Inutile de dire que je ne les ai pas tous testés. Il existe même un addons firefox pour trashmail. Résulat : 0 spams par semaines après deux ans d'utilisation de ma boite… Oui, ca reste quand même étrange…

  3. TOMHTML a dit :

    @lhm Bien vu ;) Mais à noter que j'utilise régulièrement ces services (surtout Yopmail) mais ça ne change pas grand chose puisque mon adresse fait partie des nombreuses adresses "facilement devinables" (pseudo + @gmail). Et puis c'est pas pratique si on veut te joindre ;-)

    J'ai oublié de dire qu'on peut, quand les formulaires l'autorisent, utiliser votremail+spam@gmail.com pour filtrer plus facilement.

  4. ¥€$ a dit :

    Tu peux remplacer OR par |

  5. Seb a dit :

    Supprimer un mail parce qu'il y a "money" dans le corps du message et qu'il est dans le dossier spam, c'est pas un peu risqué ?

    Dans une vie antérieure, j'avais des clients qui faisaient ce genre de choses, on avait mis une duplication de leur mails dans une boite aux lettres secondaire pour qu'ils voient les mails légitimes qu'ils perdaient avec des règles antispam à deux balles dans leur 'tain d'Outlook, ils ont vite arrêté :-)

  6. TOMHTML a dit :

    @Y€$ J'ai pensé que certains lecteurs seraient incapables de reproduire ce caractère, ou même de le comprendre :-)

    @Seb : oui c'est risqué, mais si le ou les filtres de l'étape 1 pour récup les "vrais mails" sont bien faits normalement ça devrait aller.

  7. Betty a dit :

    Bonjour.
    Merci pour cet article plein de conseils pratiques !

    J'avais une question un peu inverse : je suis en train de mettre en place une Newsletter pour une amie qui est artiste peintre.
    Etant encore peu connue, c'est une liste de diffusion "faite maison" : les gens intéressés pour recevoir des nouvelles nous laissent (sur du papier, comme dans l'ancien temps ^^) leur adresse mail lors des expos, puis on complète notre liste de contact sur Gmail.

    Le problème est le suivant : pour les personnes ayant une adresse Gmail, notre mail d'info (qui n'est logiquement pas du spam) attérit dans la boîte courrier indésirable…

    Y a-t-il une astuce pour que de notre côté nous fassions en sorte que notre mail ne soit pas considéré comme un spam ?

  8. TOMHTML a dit :

    A mon grand regret je ne connais aucune technique pour ça. Peut-être faut-il changer les mots utilisés pour que cela ressemble moins à du spam ? Ça va être dur.
    Ou alors il faut que tout le monde ayant reçu ce message clique sur le bouton "Not a spam" pour signaler à Google que ce message n'est pas un spam, mais je doute que cela ait un impact sur les autres utilisateurs :-/