Netsensei

Much Ado About Nothing

Zoekmachine

Een tijdelijk theme, een experiment

Na 4 jaar heb ik mijn op maat gemaakte theme ingeruild voor een het standaard Twenty Twenty theme dat mee met WordPress wordt geleverd. De directe aanleiding? Een experiment rond optimalisatie voor zoekmachines. En in tweede instantie ook een aanzet om even na te denken hoe ik verder wil met mijn blog.

Alles begon dit voorjaar. Ik merkte toen al enige tijd dat dit artikel zowat alle verkeer naar mijn blog trok. Blijkt dat ik het derde zoekresultaat ben als je zoekt op “van proximus naar telenet“. Mooi, maar wat me echt opviel was dat de rest van mijn blog niet terug te vinden was in de zoekresultaten op andere trefwoorden. En een zoekactie op ‘site:netsensei.be’ leerde mij dat hoofdzakelijk de ‘tag’ overzichtspagina’s nog aanwezig waren.

Arthub Flanders

In november lanceerden we op het werk Arthub Flanders. Sinds 2015 heb ik gestaag, en met de hulp van vele anderen, aan deze zoekmachine gebouwd. Je kan netjes zoeken in de gegevens van de kunst- en erfgoedcollecties van de Vlaamse musea voor visuele kunsten. Meer zelfs, die gegevens zijn vrij bruikbaar als Open Data. Momenteel ontsluit de catalogus een kleine 16.000 werken.

Arthub Flanders
Arthub Flanders

De catalogus zelf is gebouwd met Project Blacklight, een Ruby on Rails toepassing ontwikkeld door Stanford University Libraries. Onder de motorkap gaat een hele architectuur schuil van API’s en ETL pipelines. We jongleren tussen een aantal formaten en datamodellen. Catmandu, gebouwd door de Universiteitsbibliotheek Gent, is ons werkpaard. Tenslotte bouwden we met Symfony ook een tussenlaag waar we data persistent in bewaren. Dat is de Datahub.

Google bot?

Het is leuk te weten dat je site wordt gevonden. Meer zelfs, het is leuk te weten dat je site wordt gevonden door mensen die je oprecht willen lezen: medebloggers, sympathisanten, en-ga-zo-maar-door. Via google bijvoorbeeld. En daar gaat het soms mis.

Zoekmachines zoals Google werken met nogal domme programma’s die dagelijks het web afluisteren, pagina’s verzamelen, daar dan informatie extraheren en op basis daarvan je website via ingewikkelde algoritmes zoals pagerank je website tonen in zoekresultaten wanneer die relevant is voor het ingegeven trefwoord. Het grote probleem is dat je dus een pak geluk moet hebben dat je website opduikt waar je hem graag zou willen hebben. In werkelijkheid worden website vaak gewoon “verkeerd geklasseerd”. En dat leidt dan weer tot een hoop frustratie. Enerzijds omdat je website vaker dan niet geen relevant zoekresultaat (signal to noise) vormt, anderzijds omdat jij een hoop mensen over de vloer krijgt die geen fluit geven om wat je schrijft. En in het slechtste geval van de gelegenheid gebruik maken om ook nog eens wat keet te schoppen.

« Vorige blogpostsPagina 1 van 1 pagina's