Récemment, nous avons appris par que Google a développé via Greg Corrado un système à base d’intelligence artificielle pour répondre à une partie des milliards de requêtes quotidiennes des internautes. Une information donnée via une interview vidéo sur Bloomberg business relayée par tous les ferus du référencement et pour cause : L’IA entre dans le cœur économique de Google, le search. S’en suivent de nombreuses spéculations sur le système qu’il est intéressant d’aborder dans ce sujet. Pour rappel, Rank Brain est un système dont la vocation est d’interpréter les mots et composés qu’il ne connaît pas encore. Greg Corrado rappelant dans la vidéo :
Rank Brain fonctionne quand les gens font des recherches ambiguës ou utilisent des termes familiers, pour tenter de résoudre les requêtes non comprises ou jamais vues auparavant.
Le système d’apprentissage évolutionnaire au cœur du moteur ?
Google nous a habitué à développer des stratégies SEO y compris dans le netlinking répondant aux besoins du web sémantique. Depuis le Knowledge graph en 2012, Hummingbird en 2013, Mountain view n’a de cesse de nous dire que l’analyse sémantique est complètement intégrée au point d’en faire une sorte de constante intangible dans l’algorithme.
Ma première réaction à l’annonce qui en a été faite en octobre fut simple: Google n’est pas en mesure de répondre à ses désirs au point de faire des effets d’annonces incitant encore plus les webmasters à livrer du contenu toujours plus riche.
Je dois dire que j’étais en partie influencé par les récentes déclarations officielles concernant les données structurées facteur de positionnement dans les SERP. Un élément qui ne vous a pas échappé je suppose et qui promet une année 2016 plus que jamais sous le soleil du schema.org.
J’étais également dubitatif concernant cette annonce, considérant que l’apprentissage de certaines fonctions du moteur n’avait pas conduit à de réels résultats. En cela, pas mal de filtres (il faut bien le dire) ont des conséquences assez limitées. Allez, pour ne fâcher personne, je ne cite que EMD par exemple.
Non, Rank Brain, dont le nom a des allures de concepts sortis de la littérature asimovienne, m’a tout de suite fait réagir en ces termes : « Quelle com sont-ils en train de nous sortir là ? » Et de me replonger dans les méandres des sorties tambour battant mais calamiteuses comme l’ordinateur qui parle de Apple ou bien plus récemment les Google glass.
Pourtant, il faut bien dire qu‘au delà de la communication qui en est faite, Google s’attache encore et toujours avec rank brain à robotiser son crawl pour essayer d’en extirper les plus parfaites données exploitables. D’une manière plus claire, on pourrait dire là qu’il s’agit d’une rustine à ce qui existe déjà.
Quid en effet de Hummingbird dont les mises à jour promises se font attendre ? Mais je donne crédit au géant américain de revoir sa copie quand c’est nécessaire.
Deap Mind pour développer l’intelligence artificielle
Ce qui est certain avec Google, c’est cette volonté de comprendre tout, vraiment tout. RankBrain ne se concentrerait que sur une fraction des 15% des requêtes que le moteur traite pour la première fois. Et la technologie issue de cela provient d’un achat de 2014, Google DeepMind.
On glose souvent sur l’incapacité de Google a comprendre tel ou tel mot dans le contexte, le web regorge de détails sur ces approximations qui décrédibilisent pour partie les travaux effectués par les chercheurs de la firme. L’achat de Google montre cette volonté extensive vers la compréhension la plus subtile des langues.
Loin d’être « un prix Nobel », l’algorithme de Google concentre des efforts qu’il est bon de prendre encore plus encore pour les référenceurs. Mais l’intelligence artificielle semble être encore qu’au début dans ce cas puisque Garry Illyes a pu déclarer que l’apprentissage ne se ferait pas en continu. La main de l’homme est donc toujours là…
L’approche personnelle du référenceur Gianluca Fiorelli
Je retiens la lecture du post de Gianluca Fiorelli sur Moz. Dans celui-ci, il nous est rappelé que la firme de Mountain View n’en est pas à ses premiers essais dans l’intelligence artificielle. Panda par exemple faisait déjà appel à l’IA durant sa sortie en 2011. Ce n’est pas non plus un système parfait mais qui complète selon lui Hummingbird :
RankBrain semble être un « patch » nécessaire à la mise à jour générale de Hummingbird. En fait, nous devons nous rappeler que Colibri lui-même était destiné à aider Google à comprendre « requêtes verbales. »
Plus loin, Gianluca Fiorelli explique qu’à la manière du petit oiseau, RankBrain tente de formaliser également l’intention derrière la requête de l’internaute. En suivant donc ces étapes sur des documents jusqu’à les classer, on peut donc sans difficulté dire que RankBrain est un facteur de positionnement sur les résultats de recherche.
Pourtant il précise aussi que RankBrain est à séparer du Knowledge graph. Et revenant sur l’étude de Slawski, il en déduit qu’il s’agit bien d’un procédé qui permet d’effectuer un classement fonction de la requête, du document en réponse à la requête, la session de recherche durant laquelle la requête est formulée, le moment où la requête est formulée, les annonces présentées en réponse à la requête, l’ancre de texte du document et le nom de domaine associé au document.
Les mots du futurologue Raymond Kurzweil
Gianluca Fiorelli revient sur une déclaration de Raymond Kurzweil dans le Guardian et nous explique que la finalité des robots de Google est bien plus que d’analyser une série de mots, il s’agit de les comprendre et d’être en mesure de littéralement les lire. Lire, c’est également être en mesure d’interpréter et c’est là qu’il s’agit de rester vigilent. Pour Fiorelli, DeepMind n’est pas encore mature, et on ne saurait lui donner tord.
Quel degré de maturité faut-il donc aux dirigeants de Google pour répondre à leurs souhaits ? Donner enfin du vrai sens aux langues parlées qui se trouvent sur le Web.
Comment peut-on anticiper ces évolutions futures ?
Plutôt que de dire qu’il n’y a rien à faire (Rankbrain comme cela est précisé dans l’article de Moz concerne les inconnues), j’aurais tendance personnellement à dire de continuer à travailler les requêtes dans une démarche intellectuelle similaire à celle actuelle, en respectant les techniques SEO adaptées, c’est bien en fait sur ce sujet Google qui court après les langues, pas l’inverse. Pour l’instant…