Les arbres de la nouvelle connaissance

Le site drunkmenworkhere.org fête le premier anniversaire d'une très intéressante expérience.

Ces gentlemen ont construit un site de 2.147.483.647 pages web arrangé selon une arborescence binaire : la page principale est liée à 2 pages secondaires, lesquelles sont à leur tour chacune liée à 2 pages etc. Un peu comme l'arbre généalogique d'une bactérie vous voyez...

Ensuite, ils ont observé le cheminement des petits robots lancés par Google, msn et Yahoo, cheminement représenté sous forme de trois arbres. Quelle interprétation peut-on en tirer?

Tout d'abord, la plupart des pages restent inconnues des trois engins de recherche, ce qui est prévisible vu la taille du site mais néanmoins rassurant : il existe toujours une masse de chemins de traverses, des sites sauvages non catalogués où la main du bot n'a jamais mis le pied.

Autre point étonnant, Yahoo est de loin le plus actif, tant en profondeur que dans la durée. Son arborescence est la plus touffue.

Google est lui le plus systématique avec une arborescence d'une belle symétrie, tandis que msn semble manquer quelque peu d'engrais.

Aussi, diverses bizarreries se produisent auprès de certains noeuds qui, sans que l'on comprenne bien pourquoi, bootsent littéralement l'énergie de Google ou de msn.

Enfin, je ne me lasse pas de visualiser les animation montrant la croissance de ces arbres, et de m'émerveiller que des robots virtuels circulant selon des chemins que même leurs concepteurs ne peuvent prévoir, au travers de réseaux informatiques en mutations constante afin de référencer des masses d'octets structurés sous le vocables de pages web... que ces robots suivent un chemin visuellement comparable à celui d'êtres vivants sauvages et libres

avk

Comments are closed.