<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Zoekmachine on Netsensei</title>
    <link>https://www.netsensei.be/tags/zoekmachine/</link>
    <description>Recent content in Zoekmachine on Netsensei</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>nl-NL</language>
    <managingEditor>matthias@netsensei.nl (Matthias Vandermaesen)</managingEditor>
    <webMaster>matthias@netsensei.nl (Matthias Vandermaesen)</webMaster>
    <lastBuildDate>Tue, 03 Nov 2020 19:54:53 +0000</lastBuildDate><atom:link href="https://www.netsensei.be/tags/zoekmachine/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Een tijdelijk theme, een experiment</title>
      <link>https://www.netsensei.be/2020/11/03/een-tijdelijk-theme-een-experiment/</link>
      <pubDate>Tue, 03 Nov 2020 19:54:53 +0000</pubDate>
      <author>matthias@netsensei.nl (Matthias Vandermaesen)</author>
      <guid>https://www.netsensei.be/2020/11/03/een-tijdelijk-theme-een-experiment/</guid>
      <description>&lt;p&gt;Na 4 jaar heb ik mijn op maat gemaakte theme ingeruild voor een het standaard
&lt;a href=&#34;https://wordpress.com/theme/twentytwenty&#34;&gt;Twenty Twenty theme&lt;/a&gt; dat mee met &lt;a href=&#34;https://wordpress.org&#34;&gt;WordPress&lt;/a&gt; wordt geleverd. De directe
aanleiding? Een experiment rond optimalisatie voor zoekmachines. En in tweede
instantie ook een aanzet om even na te denken hoe ik verder wil met mijn blog.&lt;/p&gt;
&lt;p&gt;Alles begon dit voorjaar. Ik merkte toen al enige tijd dat &lt;a href=&#34;https://www.netsensei.be/2018/07/12/van-proximus-naar-telenet/&#34;&gt;dit artikel&lt;/a&gt;
zowat alle verkeer naar mijn blog trok. Blijkt dat ik het derde zoekresultaat
ben als je zoekt op “&lt;em&gt;van proximus naar telenet&lt;/em&gt;“. Mooi, maar wat me
echt opviel was dat de rest van mijn blog niet terug te vinden was in de
zoekresultaten op andere trefwoorden. En een zoekactie op
‘site:netsensei.be’ leerde mij dat hoofdzakelijk de
‘tag’ overzichtspagina’s nog aanwezig waren.&lt;/p&gt;
&lt;p&gt;En dus ben ik de laatste maanden af en aan wat aan het sleutelen geweest terwijl
ik met de &lt;a href=&#34;https://search.google.com/search-console/about&#34;&gt;Google Search Console&lt;/a&gt; oog probeerde te houden op hoe de Google
Bot reageerde. Ik heb onder de motorkap wat verbeteringen aangebracht qua
performantie. Ik heb de sitemap liefde gegeven. En ik heb wat tweaks aangebracht
in de meta tags om de zoekrobots ter wille te zijn. Helaas, niks lijkt echt te
helpen.&lt;/p&gt;
&lt;p&gt;Een groter probleem is dat de Google Search Console noch andere tools zoals
&lt;a href=&#34;https://developers.google.com/web/tools/lighthouse/&#34;&gt;Google Lighthouse&lt;/a&gt; je vlak af zullen zeggen wat het probleem precies is.
Ergens is dat ook wel logisch. Google wil immers niet dat handigaards het
systeem uitbuiten en zo overal de eerste plaats in de zoekresultaten inpalmen.
Alleen, daardoor is het lastig voor bonafide website beheerders om ervoor te
zorgen dat hun website beantwoordt aan Google’s vage eisen.&lt;/p&gt;
&lt;p&gt;En dus, na eliminatie, vermoed ik dat een en ander te maken heeft met de HTML en
CSS van mijn eigen theme.
&lt;a href=&#34;https://www.netsensei.be/2016/11/26/een-nieuwe-blog/&#34;&gt;Die is ondertussen ook al weer een dikke 4 jaar oud&lt;/a&gt;. Een kleine eeuwigheid
is dat in de wereld van de technologie. Bij wijze van experiment schakel ik
tijdelijk over op het standaard theme van WordPress om dan na te gaan welke
impact dat heeft op Google’s zoekresultaten. Het is een beetje de botte
bijl, maar op dit punt is dat wel gerechtvaardigd denk ik.&lt;/p&gt;
&lt;p&gt;De andere reden is de aanzet om even na te denken over waar ik naartoe wil. Een
website bouwen en technisch onderhouden is leuk, maar ergens hoor je die wel
regelmatig van updates en inhoud te voorzien. Anders houdt het ook wel op een
gegeven moment op. Ten andere gaat deze blog mee sinds 2005. Het is leuk om mijn
jongere zelf terug te lezen. Maar ik tegelijk ben ik nu in een ander hoofdstuk
in mijn leven aanbeland. Ik worstel wat met de vraag in welke richting ik met
mijn blog heen wil. Het is ook een vraag die ik onbeantwoord voor mij uit heb
geschoven. En dus is deze back to basics ook voor mij even het moment om even na
te denken over de toekomst van dit journaal.&lt;/p&gt;
</description>
    </item>
    
    <item>
      <title>Arthub Flanders</title>
      <link>https://www.netsensei.be/2018/12/27/arthub-flanders/</link>
      <pubDate>Thu, 27 Dec 2018 13:26:46 +0000</pubDate>
      <author>matthias@netsensei.nl (Matthias Vandermaesen)</author>
      <guid>https://www.netsensei.be/2018/12/27/arthub-flanders/</guid>
      <description>&lt;p&gt;In november lanceerden we op het werk &lt;a href=&#34;https://arthub.vlaamsekunstcollectie.be/nl&#34;&gt;Arthub Flanders&lt;/a&gt;. Sinds 2015 heb ik
gestaag, en met de hulp van vele anderen, aan deze zoekmachine gebouwd. Je kan
netjes zoeken in de gegevens van de kunst- en erfgoedcollecties van de Vlaamse
musea voor visuele kunsten. Meer zelfs, die gegevens zijn vrij bruikbaar als
&lt;a href=&#34;https://arthub.vlaamsekunstcollectie.be/nl/open-gegevens&#34;&gt;Open Data&lt;/a&gt;. Momenteel ontsluit de catalogus een kleine 16.000 werken.&lt;/p&gt;

&lt;figure &gt;
  &lt;img
    src=&#34;https://www.netsensei.be/2018/12/27/arthub-flanders/arthub.png&#34;
    alt=&#34;Arthub Flanders&#34;
    class=&#34;center&#34;
    loading=&#34;lazy&#34;
    &gt;
  &lt;figcaption class=&#34;center&#34;&gt;Arthub Flanders&lt;/figcaption&gt;
&lt;/figure&gt;

&lt;p&gt;De catalogus zelf is gebouwd met &lt;a href=&#34;http://projectblacklight.org&#34;&gt;Project Blacklight&lt;/a&gt;, een Ruby on Rails
toepassing ontwikkeld door Stanford University Libraries. Onder de motorkap gaat
een hele architectuur schuil van API’s en &lt;a href=&#34;https://en.wikipedia.org/wiki/Extract,_transform,_load&#34;&gt;ETL&lt;/a&gt; pipelines. We jongleren
tussen een aantal formaten en datamodellen. &lt;a href=&#34;http://librecat.org/&#34;&gt;Catmandu&lt;/a&gt;, gebouwd door de
Universiteitsbibliotheek Gent, is ons werkpaard. Tenslotte bouwden we met
&lt;a href=&#34;http://symfony.com&#34;&gt;Symfony&lt;/a&gt; ook een tussenlaag waar we data persistent in bewaren. Dat is de
&lt;a href=&#34;https://github.com/thedatahub/datahub&#34;&gt;Datahub&lt;/a&gt;.&lt;/p&gt;
&lt;p&gt;Bijna vier jaar hard werken aan een project, daar leer je ongelofelijk veel uit.
Meer nog dan over technologie, leer je vooral jezelf kennen. Succes is niet
alleen doorzetten tot het je iets oplevert, succes definieert zich ook door hoe
je de dingen uitvoert. Positivisme, vergevingsgezindheid, relativering,
empathie, sympathie, geduld,… tegenover jezelf en anderen zijn zo enorm
belangrijk. Maar ook vasthoudendheid en onverzetbaar jezelf verdedigen op het
juiste moment, zijn broodnodig. Als kapitein moet je je schip ten allen tijde op
koers houden. Anders geraak je nergens.&lt;/p&gt;
</description>
    </item>
    
    <item>
      <title>Google bot?</title>
      <link>https://www.netsensei.be/2005/12/19/google-bot/</link>
      <pubDate>Sun, 18 Dec 2005 22:48:10 +0000</pubDate>
      <author>matthias@netsensei.nl (Matthias Vandermaesen)</author>
      <guid>https://www.netsensei.be/2005/12/19/google-bot/</guid>
      <description>&lt;p&gt;Het is leuk te weten dat je site wordt gevonden. Meer zelfs, het is leuk te
weten dat je site wordt gevonden door mensen die je oprecht willen lezen:
medebloggers, sympathisanten, en-ga-zo-maar-door. Via google bijvoorbeeld. En
daar gaat het soms mis.&lt;/p&gt;
&lt;p&gt;Zoekmachines zoals Google werken met nogal domme programma’s die dagelijks
het web afluisteren, pagina’s verzamelen, daar dan informatie extraheren
en op basis daarvan je website via ingewikkelde algoritmes zoals &lt;a href=&#34;http://en.wikipedia.org/wiki/Pagerank&#34; title=&#34;&#34;&gt;pagerank&lt;/a&gt;
je website tonen in zoekresultaten wanneer die relevant is voor het ingegeven
trefwoord. Het grote probleem is dat je dus een pak geluk moet hebben dat je
website opduikt waar je hem graag zou willen hebben. In werkelijkheid worden
website vaak gewoon “verkeerd geklasseerd”. En dat leidt dan weer
tot een hoop frustratie. Enerzijds omdat je website vaker dan niet geen relevant
zoekresultaat (&lt;em&gt;signal to noise&lt;/em&gt;) vormt, anderzijds omdat jij een hoop mensen
over de vloer krijgt die geen fluit geven om wat je schrijft. En in het
slechtste geval van de gelegenheid gebruik maken om ook nog eens wat keet te
schoppen.&lt;/p&gt;
&lt;p&gt;Persoonlijke ervaring: een tijd geleden &lt;a href=&#34;https://www.netsensei.be/archives/paradise-hotel-bis/&#34; title=&#34;&#34;&gt;berichtte&lt;/a&gt; ik over de top 10
zoektermen waarmee men mij vond. Het resultaat was op zijn minst ontnuchterend
te noemen: ongeveer alle mogelijke constellaties bestaande uit de trefwoorden
&lt;em&gt;paradise, hotel&lt;/em&gt; en &lt;em&gt;erik&lt;/em&gt; of &lt;em&gt;vt4&lt;/em&gt;. Een onderwerp waar ik een tijd geleden
welgeteld 1 item aan had gewijd. De googlebot kende het potsje een hoge pagerank
score toe waardoor het direct zeer hoog eindigde in elk zoekresultaat op die
termen. Gevolg: een stroom mensen op zoek naar meer info over de TV show die
hier belandden en niet noodzakelijk vonden waar ze naar op zoek waren. Sommigen
gingen er zelfs vrij hard tegen aan in de commentaren. Om nog maar te zwijgen
van de verbruikte – of verspilde zo u wil – bandbreedte!&lt;/p&gt;
&lt;p&gt;Ten lange leste heb ik dan maar de hulp van een &lt;a href=&#34;http://www.robotstxt.org/wc/robots.html&#34; title=&#34;&#34;&gt;robots.txt&lt;/a&gt; bestand
ingeroepen om de googlebot volledig buiten te houden. Mijn site wordt dus niet
langer meer geïndexeerd door Google. En dat valt op zijn beurt weer op in de
statistieken:&lt;/p&gt;
&lt;p&gt;&lt;img src=&#34;http://static.flickr.com/9/74919282_10dbbb2ec8.jpg?v=0&#34; alt=&#34;&#34;&gt;&lt;/p&gt;
&lt;p&gt;Maar is dit nu de juiste weg? Uiteindelijk ontloop ik het probleem alleen maar.
Niemand vindt mijn site nu nog. Tenzij via links op andere blogs. Zou het gewoon
niet mogelijk zijn om de robots te verhinderen om te indexeren op bepaalde
trefwoorden? Zou het niet mogelijk zijn om dergelijk gedrag bij te sturen? Het
omgekeerde bestaat immers: de &lt;a href=&#34;http://www.w3.org/TR/REC-html40/struct/global.html#h-7.4.4.2&#34; title=&#34;&#34;&gt;metatag&lt;/a&gt; laat immers toe om een aantal
trefwoorden te specifiëren. Jammer genoeg geraakt de metatag langzaam in onbruik
en werd zelfs al &lt;a href=&#34;http://searchenginewatch.com/sereport/article.php/2165061&#34; title=&#34;&#34;&gt;dood&lt;/a&gt; verklaard!&lt;/p&gt;
&lt;p&gt;Het zou anders wel mooi zijn moest er een gemakkelijkere wijze zijn om Google
een handje te helpen. Alleen zie ik het technisch zo niet snel gebeuren. Om nog
maar te zwijgen over bepaalde ethische kwesties.&lt;/p&gt;
</description>
    </item>
    
  </channel>
</rss>