Hotlinking Analyse in den Apache-Logs

Hotlinking Analyse in den Apache-Logs

Nachdem ich heute durch einen Zufall auf einen besonders dreisten Fall von Contentklau und Hotlinking meines geistigen Eigentums „gestolpert“ bin wollte ich heraus finden, wie ich dies maschinell analysieren kann. Im Grunde ist es (mal wieder) recht einfach. Meine Suche brachte mich zunächst zu Netz 10 und (da der dort vorgestellte Code nicht funktionierte) weiter zu The Art of Web.

Die dort vorhandenen Beispiele habe ich nun für meine Zwecke angepasst und nutze Sie nun, um meine Logdateien zu durchsuchen:

Dieser Code listet alle Domains auf, die jpg oder .gif – Dateien hotlinken.

Die „grep -v“ Anweisungen, ein logisches „und nicht“ sorgt dafür, dass Suchmaschinen, wie Google oder Bing, sowie eventuelle Domain-Aliase heraus gefiltert werden.

Eine allgemeine Variante sieht dann so aus:

 

Leave A Comment