<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>User Agent String on Netsensei</title>
    <link>https://www.netsensei.be/tags/user-agent-string/</link>
    <description>Recent content in User Agent String on Netsensei</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>nl-NL</language>
    <managingEditor>matthias@netsensei.nl (Matthias Vandermaesen)</managingEditor>
    <webMaster>matthias@netsensei.nl (Matthias Vandermaesen)</webMaster>
    <lastBuildDate>Tue, 18 Jul 2006 18:26:18 +0000</lastBuildDate><atom:link href="https://www.netsensei.be/tags/user-agent-string/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Referer spam</title>
      <link>https://www.netsensei.be/2006/07/18/referer-spam/</link>
      <pubDate>Tue, 18 Jul 2006 18:26:18 +0000</pubDate>
      <author>matthias@netsensei.nl (Matthias Vandermaesen)</author>
      <guid>https://www.netsensei.be/2006/07/18/referer-spam/</guid>
      <description>&lt;p&gt;Ik heb daarjuist de &lt;a href=&#34;http://en.wikipedia.org/wiki/Htaccess&#34;&gt;.htaccess&lt;/a&gt; file dichtgetimmerd tegen spammers. Ik heb
willen merken dat er in de afgelopen 18 dagen 1Gb aan data is versluisd.
Webalizer toonde dat het gros naar allerlei bots gaat. Bovendien zitten de
logfiles vol spam.&lt;/p&gt;
&lt;p&gt;Via de .htaccess file kan je mensen op basis van een aantal variabelen toegang
ontzeggen tot je website. Ik heb een beetje rondgespeurd op het Net en het beste
van verschillende praktijken gecombineerd:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Er zit een vrij indrukwekkende blacklist op bepaalde woorden in de referer&lt;/li&gt;
&lt;li&gt;Er is een lijst met ip’s van gekende spammers. Niet dat die zo hulpzaam
is want spammers muizen er sowieso vanonder door regelmatig met een andere ip
te opereren.&lt;/li&gt;
&lt;li&gt;Tenslotte wordt er ook gediscrimineerd op basis van de &lt;a href=&#34;http://en.wikipedia.org/wiki/User_agent&#34;&gt;user agent string&lt;/a&gt;
van een referer hit. Hoewel die gemakkelijk te maskeren valt, is het toch
nuttig om een aantal commerciële bots zoals larbin, turnitin, aipbot die géén
direct nut hebben buiten te sluiten, Ook hits zonder een user agent string
worden geweerd: het is nogal lomp om de &lt;a href=&#34;http://en.wikipedia.org/wiki/Robots_Exclusion_Standard&#34;&gt;robots.txt standaard&lt;/a&gt; niet te
volgen.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Voor zover ik via de logfiles kan volgen heb ik willen merken dat leukers met
een referer waarin “texas-holdem” en zo, lekker worden afgeblokt. Ik
kan het zo ver drijven door spammers zo ver te drijven dat alle traffiek die
deze kant opkomt, gewoon terug richting afzender wordt gestuurd. Alleen weet ik
dat dat spammers niet tegenhoudt en ik het dubbel zo hard terug zou krijgen. Ik
ben nu al blij dat het zo ook al vrij goed lijkt te werken.&lt;/p&gt;
&lt;p&gt;Moesten er nu mensen opeens niet meer op mijn blog geraken: geef me een seintje!
Het kan zijn dat je afgeblokt wordt door de strikte filter!&lt;/p&gt;
&lt;p&gt;Ter referentie: dit is de &lt;a href=&#34;http://www.aaronlogan.com/downloads/htaccess.php&#34;&gt;.htaccess file&lt;/a&gt; die ik als basis heb gebruikt.&lt;/p&gt;
</description>
    </item>
    
  </channel>
</rss>