Moteurs de recherche, Google a-t-il atteint son niveau d’incompétence ? Décryptualité du 4 avril 2022

Luc : Décryptualité. Semaine 13 de l’année 2022. Salut Manu.

Manu : Salut Luc.

Luc : Au sommaire quatre articles que tu nous as trouvés.
Opinion Internationale, « Se désintoxiquer des GAFAM : la cure commence à l’école », un article de Michel Taube.

Manu : Article plutôt sympa. J’ai beaucoup aimé. Ils attaquent sur le fait qu’il faut apprendre à tout le monde, tôt, et pendant l’éducation c’est le bon endroit, le bon moment pour s’en occuper. Ils se sont aussi pris par la main, ils ont essayé, ils ont installé du Libre, ils ont lancé quelques logiciels pour voir comment ça marchait. Ils ont l’air d’être plutôt contents. C’est pas mal.

Luc : Avec une illustration absolument abominable, on voit une classe mal dessinée, un logo Microsoft dégueulasse et des gens avec une seringue Linux. Je ne suis pas sûr que ce soit extrêmement convaincant.

Manu : C’est du pixel art ou quelque chose comme ça.

Luc : En tout cas le sujet est tout à fait pertinent.
Rotek, « Hacktivisme : Anonymous, pirates et activistes », un article de Hugo Bernard.

Manu : C’est un nouveau site. J’ai toujours une hésitation, je ne sais pas si c’est un site qui est pertinent ou qui a passé mes bloqueurs et, en fait, que c’est juste, comment peut-on dire ?, une sorte de clickodrome où on clique et on voit la publicité qui est installée dessus. Probablement que Rotek est un vrai site et il parle d’un sujet qui est vraiment bien, bien écrit et tout. J’ai regardé, ce sont des étudiants qui font ça depuis 2017, mais je ne suis pas certain, je ne sais pas si cette personne existe vraiment, il faudrait que je la rencontre, je ne sais pas si c’est un article qui a été traduit ou pas ! C’est plutôt sympa, allez jeter un œil. Ça parle Anonymous, bien sûr, mais ça aborde aussi un petit peu les écrits de Richard Stallman sur le sujet, honnêtement c’est plutôt pas mal. J’ai juste ce point de doute qui m’énerve. On en reparlera quand ce site aura fait d’autres articles qu’on remontera dans la revue de presse, j’espère.

Luc : La Tribune, « L’Open Source est l’origine et l’avenir des technologies de l’information », un article d’Antoine Thomas, une tribune, une opinion.

Manu : Oui et c’est très orienté, c’est une entreprise qui vient parler. C’est intéressant, mais il ne faut pas oublier que ça vient d’un certain propos. À prendre avec des pincettes !

Luc : ZDNet France, « Atos met en avant son activité dans l’open source », un article de Thierry Noisette.

Manu : Là aussi ça ressemble un peu à de la pub, je suis désolé.

Luc : Thierry Noisette est là quasi toutes les semaines, on sait que c’est un journaliste, un vrai !

Manu : Oui, mais là il vient parler d’une boîte, d’une grosse boîte française qu’on aime bien taquiner ou qu’on aime bien ne pas aimer parfois parce qui des fois elle fait des choses qui ne nous plaisent pas. Là il revendique que cette grosse boîte gère le marché du support de l’open source en France, au niveau des institutions, des administrations, c’est quand même un gros truc et elle travaille en coordination avec d’autres sociétés et associations d’entreprises. C’est plutôt pas mal. Juste cet aspect qui est un petit peu pub, on va dire, qui me fait un petit peu bizarre, mais oui, il y a des marchés publics, il y a des entreprises qui répondent aux marchés publics et là c’est un marché public qui est pertinent.

Luc : Très bien. De quoi parle-t-on cette semaine ?

Manu : On peut peut-être parler de ce que les gens font en premier quand ils vont sur Internet.

Luc : Ils ouvrent le navigateur.

Manu : Oui, effectivement et que se passe-t-il quand ils ouvrent le navigateur ? Qu’est-ce qu’ils ont comme page souvent ?

Luc : Souvent ils ont le moteur de recherche qui arrive en premier et souvent, quand on leur dit d’ouvrir un navigateur, eh bien ils ne savent pas ce qu’on est en train de dire. Moi qui suis retourné travailler dans les transports publics où les gens ne sont pas toujours hyper à l’aise avec l’informatique, si je leur dis « ouvrez un navigateur » en général ils me disent « j’ouvre quoi ? J’ouvre Google ? ». Ils ouvrent Chrome avec la page de recherche Google par défaut et ils vont tout taper dans le moteur, même quand on leur donne une URL, ça passe toujours par Google.

Manu : Ce qui est assez drôle, je pense, c’est que beaucoup de gens vont taper dans le moteur de recherche le nom de leur banque, par exemple, pour aller sur le site de leur banque.

Luc : Oui, c’est hyper fréquent. J’ai aussi vu des gens taper « Google » dans Google pour avoir le moteur de recherche !

Manu : Non !

Luc : Si !

Manu : Ça c’est interdit, c’est même dangereux, attention !

Luc : Ça n’a pas cassé Internet. On s’est dit que c’était peut-être l’occasion de reparler un peu de moteur de recherche, ça fait longtemps qu’on ne l’a pas fait. On aime beaucoup taper sur Facebook qui est une horreur absolue, on aime bien parler de plein de choses. On peut dire que Google, qui s’appelle maintenant Alphabet, mène plutôt bien sa barque en termes de discrétion pour passer sous les radars même s’ils ont quand même un certain nombre de problèmes avec la CNIL et les institutions européennes équivalentes, mais on n’a pas de gros scandales bien dégueulasses et bien choquants comme Facebook et Amazon savent en offrir.

Manu : Oui. Facebook ! Il est quand même question qu’il y ait des morts en lien avec ses activités, par exemple Les Rohingyas. Il y a clairement des gens qui se sont concertés en utilisant l’outil pour attaquer ce peuple, cette population. Sûrement que Google est utilisé, mais il n’a pas l’air de centraliser comme ça autant de problèmes, pas physiques, pas humains, ce sont souvent d’autres problèmes. D’ailleurs c’est ce qui se passe avec l’Union européenne qui a tapé sur Google et qui a tapé en extrayant des milliards d’euros.

Luc : Oui. Ces dernières années, 2019/2020, des amendes ont été infligées à Google, essentiellement pour des questions de respect du RGPD [1] et du consentement pour mettre les cookies.

Manu : Et d’abus de position dominante, voyons !

Luc : Effectivement, abus de position dominante consistant à utiliser son poids pour forcer ses clients, non pas le cheptel qui utilise le moteur, mais pour forcer les clients à passer par sa régie publicitaire plutôt que de passer par une autre régie publicitaire en disant « on est Google, soit vous passez par chez nous, soit ça va vous coûter plus cher. »
Dans le même gendre d’idées, dans un domaine différent, Amazon a été récemment condamnée en Italie parce les institutions italiennes ont estimé qu’elle forçait les vendeurs tiers à passer par ses réseaux de distribution plutôt que de passer par un autre réseau de distribution et si ces vendeurs tiers passaient effectivement par un autre réseau de distribution, ils se faisaient pénaliser d’une façon ou d’une autre par Amazon.
Sur Google on a le même genre de problématique. C’est effectivement condamnable et condamné, mais on pourrait dire que ne pas respecter le RGPD, un paquet de sites le font, ils se font taper dessus, c’est légitime parce que ce sont les plus gros, donc très bien. Mais on pourrait dire qu’ils ne sont pas si méchants que ça, ça ne pose pas tant de problèmes, ils font mal comme la plupart des sociétés.
L’abus de position dominante c’est quand même tout de suite moins propre, mais on pourrait dire que c’est un truc entre entreprises, c’est du business, ça ne va pas toucher le grand public.

Manu : C’est la conséquence d’être les meilleurs sur cette branche-là.

Luc : C’est ça, ils sont victimes de leur succès, comme on dit.
Je suis en train de finir de lire un livre qui maintenant date un peu. C’est un livre d’Olivier Ertzscheid, j’en ai parlé ces dernières semaines, chercheur en sciences de l’information et de la communication, bien connu sur les réseaux sociaux, qui a un blog qui s’appelle affordance.info [2]. On en avait parlé, on avait repris un article récemment. Du coup je me suis dit qu’il était grand temps, parce que je ne l’avais jamais fait, d’aller lire ce qu’il a écrit. J’ai acheté un bouquin un peu ancien, avec des articles qui datent de 2014 à 2017 à peu près.

Manu : Et en informatique c’est la Préhistoire, mais quand même.

Luc : C’est vrai, ça change beaucoup. C’est hyper intéressant. Comme il parle de l’actualité de l’époque, c’est un peu un retour dans le passé qui est finalement vachement intéressant. Il remonte des choses qui restent pertinentes aujourd’hui.
À l’époque – je ne sais pas si c’est toujours le cas aujourd’hui, j’ai un peu regardé ce qu’il fait actuellement, il a l’air de moins parler de Google – il appelait à ce qu’il y ait un index qui soit un bien commun et qui soit public, qui soit une chose poussée par tout le monde.

Manu : Donc un index des sites web à priori.

Luc : C‘est ça. En gros le travail d’aller sur Internet pour fouiller à droite à gauche et dire « pour tel mot clé on va remonter tel et tel site ». Ça devrait être un bien public, quelque chose qui soit travaillé ensemble et qui ne devrait pas être dépendant de sociétés. Il avait remonté plusieurs cas. Il y a notamment cette idée que Google rend un service qui est fonction du pays dans lequel on est, qui va notamment s’aligner sur le pouvoir et la législation du pays où il se trouve. Si la Chine lui demande d’enlever certaines choses, il enlève.
Un exemple qu’il donnait aussi : quand on cherchait par exemple « nazi » en Allemagne, on tombait sur des articles historiques, sur l’article de Wikipédia avec l’histoire des nazis. Si on était aux États-Unis il disait qu’à l’époque on tombait sur le site du Parti nazi américain.

Manu : En même temps, ils ne font que suivre que les pratiques recommandées voire obligatoires.

Luc : Tout à fait.

Manu : On sait qu’à une époque ils faisaient des suggestions un peu antisémites. Vous savez, quand vous commenciez à taper votre recherche ils pouvaient vous aider à trouver quelque chose. Il y avait effectivement des choses un peu choquantes.

Luc : C’est l’autre chose très intéressante, en fonction de la façon dont on formule les choses, en fonction du champ sémantique. Il disait par exemple que si on cherchait « pourquoi il y a de l’antisémitisme », on arrivait sur des éléments plutôt historiques d’explications, etc. ; si on cherchait « y a-t-il trop de Juifs en France », on tombait direct sur les sites d’extrême droite, etc.
Je me suis amusé à refaire un peu l’expérience en trois minutes, ça ne vaut rien du tout, mais effectivement les résultats sont aujourd’hui beaucoup plus modérés et ça a l’air de mieux tourner. Je pense que c’est quelque chose qui marche bien sur YouTube. Si on se fait un compte tout vierge et qu’on commence à faire quelques recherches, je pense qu’on tombe dans ses bulles de filtres assez rapidement. Il y a des éléments moins structurés au niveau des gens qui éditent du contenu. Sur le moteur de recherche, on va tomber facilement sur de la presse qui est plus installée, etc., ils savent vers quel genre de sites orienter les recherches.

Manu : Ça reste compliqué. On aime taper sur Google. Ils ont des problématiques qui vont avec le service qu’ils fournissent, ce sont notamment des publicitaires et nous ne sommes pas, comme tu disais, leurs clients, nous sommes des utilisateurs, nous sommes un cheptel. Derrière ils vendent tous nos clics à des publicitaires qui eux ont préempté des mots, ont installé des publicités qu’ils vont remonter. C’est compliqué, ce sont des choses qui se mélangent mal.

Luc : Oui, effectivement. Une chose très rigolote qu’il y a dans le bouquin qu’il avait publié en 2016, c’est que, le 27 avril, une conférence a été menée par les deux fondateurs de Google, Sergey Brin et Larry Page, et à l’époque ils avaient renoncé définitivement à la régie publicitaire de leur moteur de recherche. Il cite l’article, je vous invite à aller le lire, cherchez sur le blog affordance.info, c’est un moteur Google intégré.

Manu : Un moteur de recherche.

Luc : Il utilise Google, article du 27 avril 2016, « Appendice A : le jour où Google a renoncé à sa régie publicitaire » [3]. Il cite l’intervention, dans la conférence, des deux fondateurs de Google qui expliquent qu’un moteur de recherche qui marche par la publicité, qui se finance par la publicité, ne peut pas être loyal, on ne peut pas lui faire confiance parce que nécessairement il ira pousser de la pub et il ira pousser des trucs qui font gagner de l’argent. C’est l’autre problématique. On a connu toutes les évolutions dans Google où ils ont d’abord mis les pubs sur le côté, après ils ont mises en haut de telle sorte que la plupart des gens ne comprennent pas que c’est de la publicité. Pour certains types d’articles, il donnait l’exemple des recherches sur les téléphones portables, si on sort l’article qui correspond le plus à une recherche sur les téléphones portables c’est un article qui parle du danger de téléphoner en conduisant et ce n’est pas très vendeur. Du coup, si ton objectif c’est vendre de la pub, mettre cet article en premier ce n’est pas très bon, donc tu vas être très rapidement tenté de mettre un article qui va plutôt donner envie d’acheter des téléphones.

Manu : Eh oui ! Donc tu te retrouves à faire de la vente. C’est ton site web qui permet de faire de moteur de recherche. Non ! Il va te diriger vers des sites de vente, il va t’inciter à aller par exemple sur des sites qui veulent te recruter, plutôt que de t’orienter vers des sites qui veulent ton bien.

Luc : Tout à fait. C’est quelque chose que j’avais en tête depuis quelque temps, Google ce n’est quasiment maintenant plus que de la publicité. Ça va dépendre quand même des mots clés, mais sur plein de mots clefs, dès que ça se vend, on se retrouve avec trois/quatre pages de sites commerciaux et ça commence à être difficile de trouver de l’information pertinente sur des sujets, parce que tout est spammé par de la pub.
Je me souviens qu’il y a quelques années, quand il y avait eu les grands drames autour de Qwant [4], Nicolas était encore là on avait discuté de l’opportunité d’utiliser d’autres moteurs de recherche que Google. J’avais fait des tests et j’étais arrivé à la conclusion que Google restait encore plus performant. Aujourd’hui je n’en suis plus convaincu.

Manu : Qwant, on rappelle, c’était et c’est d’ailleurs encore un moteur de recherche, en tout cas ça se veut comme tel. C’est une entreprise qui cible beaucoup les administrations françaises et la France d’une manière générale, qui avait beaucoup fait parler d’elle, d’une manière plutôt positive à une époque, avant qu’on se rende qu’il y avait des problèmes avec sa technologie qui était un peu mal foutue.

Luc : C’était un peu une coquille vide qui était en fait branchée sur Bing, le moteur de Microsoft.
Récemment, cette semaine, j’ai eu une expérience sur Mastodon où il y a des tas de gens très sympathiques et c’est bien fréquenté, qui a alimenté un peu cette idée de faire autre chose. Je me suis rappelé d’un petit texte que j’avais écrit il y a des années de ça en lisant l’article de quelqu’un. Du coup j’ai cherché dans Google mon article parce que je ne savais plus où il était, je l’avais mis sur InLibroVeritas, je ne savais pas si le site marche encore ou pas. Je me suis dit j’ai dû le mettre quelque part. Je mets le titre exact dans le moteur de recherche, j’ai fait sans et avec le pseudo, et au final rien n’est ressorti. La seule chose qui est ressortie c’est une discussion dans un forum de InLibroVeritas, dans ce site-là. Ça veut dire que Google n’est pas capable de ressortir un truc que j’ai écrit il y a dix ans. Voilà ! C’est un petit texte quelque part sur Internet, je ne suis pas ultra fâché comme quoi Google considère que je ne suis pas important, mais pour le meilleur moteur qui a le plus de milliards, etc., il n’y arrive pas ! J’ai essayé dans DuckDuckGo qui est l’alternative qui est souvent proposée parce que ça anonymise les recherches, eh bien l’article sort en première proposition.

Manu : J’encourage effectivement DuckDuckGo [5], c’est le moteur que je préfère utiliser. C’est un métamoteur, un moteur qui va demander à d’autres moteurs de recherche, donc lui-même n’indexe pas Internet.

Luc : Il indexe un peu, en fait c’est un moteur hybride. Il est considéré comme hybride.

Manu : Ah ! Il essaye un petit peu ?

Luc : Oui.

Manu : Je sais que je l’utilise beaucoup pour faire des recherches techniques et j’ai l’impression qu’il me remonte pas mal de bons forums et de bonnes solutions. C’est plutôt efficace. Il y aurait aussi Bing que je n‘ai pas trop utilisé, je sais qu’il est joli, il présente une belle page d’accueil, très vendeuse, avec une belle image. Mais c’est vrai que non, c’est Google que tout le monde utilise en grande majorité, les alternatives restent difficiles, même s’il y a des gens qui y pensent.

Luc : Pour moi qui ne fais pas de recherches techniques comme toi, il y a quelques années, il y a quelque temps, je n’étais pas convaincu par DuckDuckGo parce que dans mes essais ce n’était pas très satisfaisant. Aujourd’hui c’est de moins en moins le cas et, sur certains ordinateurs que j’utilise, il y a DuckDuckGo par défaut et, au final, je n’ai pas changé le moteur parce que je m’y retrouve maintenant avec DuckDuckGo. Je pense que ça vaut le coup, si vous êtes comme moi, que vous aviez eu une expérience pas tout à fait satisfaisante avec. Je pense que le monde change à la fois côté DuckDuckGo qui s’est amélioré, mais aussi du côté de Google qui, à mon sens, a empiré parce qu’il est là pour vendre de la pub comme les fondateurs de Google eux-mêmes l’ont expliqué : si on veut maximiser ses revenus on est obligé de dégrader encore et encore la qualité de son moteur de recherche.

Manu : Il faudra effectivement que je regarde un petit peu, que j’analyse, mais tu as raison ce n’est peut-être pas, ou plus, je ne sais pas, peut-être que simplement je me trompais ; c’est un métamoteur, il faudra que je regarde à nouveau. J’encourage les gens qui veulent chercher, faire des découvertes, des nouvelles créations, il y a peut-être moyen de faire un nouveau système de moteur de recherche libre, décentralisé, c’est le prochain Mastodon ou outil de vidéo. Il y en a qui ont déjà essayé, il y a déjà eu des moteurs qui ont été lancés, ça n’a jamais vraiment décollé, c’était très difficile à mettre en place. Aujourd’hui la recherche c’est indexer tout Internet, il faut des crawlers, des outils qui vont aller se promener un peu partout, ça reste lourd.

Luc : Très bien. On reste là-dessus. On interrogera Google pour voir de quoi on parlera la semaine prochaine. Petite recherche sur notre prochain sujet et on se retrouve dimanche prochain.

Manu : À la semaine prochaine.

Luc : Salut.