Nö, t-info, so nicht.
Nachdem der Remote-User de-crawler1-ext.tinfo.odn.de einige tausend Mal mit dem User-Agent gonzo1[P] mailto:crawleradmin.t-info@telekom.de auf meine Seiten zugegriffen hatte, habe ich mich bei der angegebenen E-Mail-Adresse erkundigt, für welche Zwecke der Crawler diese Unmengen von Daten sammelt. Im übrigen sei es ja eigentlich auch gute Sitte, im User-Agent String einen URL zu einer Info-Seite o. ä. mitzuliefern. Einen Tag später bekam ich Antwort von der t-info GmbH:
Wir sind gerade dabei, eine neue Spezialsuchmaschine zu erproben, die in einigen Monaten live gehen wird – dann können wir Ihnen auch gerne nähere Informationen dazu geben.
Nö, so nicht. Wenn überhaupt, dann andersherum: t-info gibt mir vorher Informationen über ihre rege Datensammelei, und anschließend überlege ich mir, ob ich das eventuell gut finde. Geheimniskrämerei finde ich aber gar nicht gut, deshalb bleibt dieser t-info Crawler ab sofort draußen.
Ähnliche Beiträge:
Diana Krall - Christmas Songs Bücherschubladen
Kommentare:
Bei den Kommentaren handelt es sich um fremde Inhalte, die sich „esse est percipi“ nicht zueigen macht. Verantwortlich für den Inhalt eines Kommentars ist der jeweilige Verfasser.
Was ich da nicht ganz verstehe: odn.de?! Was haben die mit der Telekom zu tun?
Ja, das kam mir auch seltsam vor. Die Telekom sollte doch eigentlich selbst über geeignete Infrastruktur verfügen …
Meiner Meinung nach soll mit dem Hinweis auf „Telekom“ Seriösität vorgegaukelt werden, die ich unter den gegebenen Verhältnissen nicht zu erkennen vermag.
Ein seriöses Unternehmen verfügt für Testzwecke über eine Testumgebung – es riecht nach Content- und/oder Kozeptklau.
Meine Empfehlung: Bot via .htaccess.Datei aussperren!
LG
Leider stören die sich nicht an der robots.txt und die .htaccess sperrt sie auch nicht.
Ich hab jetzt die IP per .htaccess ausgeschlossen – die kommen immer über dieselbe :-(
LG
Sandra
Ich habe die auch per htaccess gesperrt, als ich gemerkt habe, dass sich der Crawler nicht an die robots.txt hält. Dabei wurde mir von matthias.waltenberger [at] telekom.de ausdrücklich das Gegenteil versichert:
Der Crawler arbeitet nach den Regeln, die in der robots.txt festgelegt sind.
Ich hatte ursprünglich den User Agent ^gonzo1 gesperrt, allerdings musste ich neulich feststellen, dass die mittlerweise auch mit einem gonzo2 unterwegs sind – ziemlich dreist, wie ich finde.
So funktioniert es in der .htaccess:
RewriteCond %{HTTP_USER_AGENT} gonzo [OR,NC]
LG
Sandra
Ich musste gerade feststellen, dass dieses „Ding“ Unwesen auf meiner Website treibt. ;) Hab dann mal gegoogelt und bin hierher gekommen.
Was ist das denn nun eigentlich?
Und mit IP ausschließen wird wohl schwer, bis jetzt habe ich 6 verschiedene gezählt…
Gruß,
MPj
Ich musste gerade feststellen, dass dieses „Ding“ Unwesen auf meiner Website treibt. ;) Hab dann mal gegoogelt und bin hierher gekommen.
Was ist das denn nun eigentlich?
Und mit IP ausschließen wird wohl schwer, bis jetzt habe ich 6 verschiedene gezählt…
Gruß,
MPj
Ich streite mich auch schon seit Tagen mit de Teil rum.
Ich habe ne Mail an odn.de gesendet.. also ehr gesagt 2 aber noch keine Antwort bekommen.
Für alle die Problem mit sowas haben den wegzubekommen, einfach mal auf http://www.bot-trap.de/blog/ schauen und sich den PageRestrictor Holen.. super sache das ganze und man kann sich als Webmaster wieder um wichtigere Sachen kümmern.
Gruss Musel
gonzo1[P] mailto:crawleradmin.t-info@telekom.de
ob woll ich den blockiert habe die ip un seine e-mail adrersse kommt der immer wieder was mache ich mit ihn
der ist geblockt von mit und ist immer noch im meinen forum kommt aber an nichts mehr rann hoffe ich
Kommentar schreiben:
FAQ (Häufig gestellte Fragen)
Kommentare:
- Michael Preidel zu Harbor – Sicherer Hafen [Testflight]
- Henning zu Harbor – Sicherer Hafen [Testflight]
- Michael Preidel zu Harbor – Sicherer Hafen [Testflight]
- Michael Preidel zu Harbor – Sicherer Hafen [Testflight]
- Mesrop zu Harbor – Sicherer Hafen [Testflight]
- Michael Preidel zu Hopper 1.0b7 (Update: 1.0b9)
Schlagwörter


