InternetArchiveBot/FAQ für Sysadmins
Diese Seite beinhaltet eine Liste von Fragen, die häufig von Server-Administratoren zum InternetArchiveBot gestellt werden.
Q: Warum stellt der Bot Anfragen an meine Seite?
- A: In der Wikipedia wird sich massiv auf den InternetArchiveBot verlassen. Der Bot überprüft regelmäßig Artikel auf Wikidata und repariert, ersetzt und entfernt defekte Links. Um das zu erledigen, muss er die URL anpingen, um so zu überprüfen, ob sie überhaupt erreichbar ist. Das macht er normalerweise, indem er HEAD-Anfragen stellt, was den Aufwand für den server minimiert. In manchen Fällen, zum Beispiel wenn die HEAD-Anfrage fehlschlägt, probiert er eine vollständige GET-Anfrage durchzuführen.
Q: Ich habe eine robots.txt auf meiner Seite, aber der InternetArchiveBot ignoriert sie. Warum respektiert er meine robots.txt nicht?
- A: Der InternetArchiveBot macht das, weil er nicht den Inhalt deiner Seite abfragt. Der Seiteninhalt wird auch nirgendswo anders gespeichert. Was der Bot macht, ist herauszufinden, ob eine URL tatsächlich funktioniert und erfolgreich zum Inhalt führt. Es überprüft die URL nur, weil sie als Quelle in der Wikipedia genutzt wird. Du wirst sehen, dass der IABot in den meisten Fällen HEAD-Anfragen durchführt. Sobald eine Quelle aus der Wikipedia entfernt wird oder festgestellt wird, dass sie defekt ist, stoppt der IABot mit seinen Anfragen dazu.
Q: Warum macht der Bot so viele Anfragen gleichzeitig?
- A: Der InternetArchiveBot testet Links auf Grundlage von Artikeln. Das bedeutet, er geht einen Artikel nach dem anderen durch und testet dort alle Links die er dabei findet. Sollte deine Seite sehr häufig in einem spezifischen Artikel genutzt werden, macht der InternetArchiveBot viele Anfragen zu den jeweiligen URLs. Allerdings wartet er immer 1 Sekunde zwischen Anfragen an die selbe Seite.
Q: Gibt es eine Wartezeit zwischen den Tests?
- A: Ja, wenn eine URL als lebendig eingestuft wird, wartet der Bot mindestens 1 Woche, bevor er genau diese URL wieder testet. Falls festgestellt wird, dass die URL tot ist, wird er sie noch 2 Mal testen, bei denen er jeweils mindestens 3 Tage zwischen jedem Test wartet, bevor er sie dann endgültig als defekt markiert. Wenn der Bot in einem der 2 Tests bemerkt, dass die URL aktiv ist, geht er wieder in die einwöchige Wartezeit. Sobald der Bot einen Link als defekt deklariert hat, führt er keine weiteren Tests an der URL mehr durch.
Q: Kann ich den Bot blockiern?
- A: Das ist möglich, aber nicht empfehlenswert. Das Blockieren des Bots kann dazu führen, dass der Bot die gesamte Seite als defekt markiert. Das führt dazu, dass sie in der Wikipedia auch als defekt behandelt wird. Wir empfehlen, dass du User talk:InternetArchiveBot kontaktierst und deine Domain auf die Whitelist setzen lässt. Sobald sie auf der Whitelist steht, stoppt der Bot mit seinen Anfragen an deine Domain.
Q: Was passiert, wenn ich den Bot blockiere?
- A: Der InternetArchiveBot gibt sein Bestes, um herauszufinden, ob deine Seite offline ist oder ob er von ihr blockiert wurde. Wenn er feststellt, dass er geblockt wurde, setzt er deine Domain auf die Whitelist und stellt dann seine Anfragen daran ein. Sollte er nicht herausfinden können, ob er blockiert wurde, wird der IABot zwangsläufig alle URLs in deiner Domain als defekt deklarieren und sie dann entweder von der Wikipedia entfernen oder ersetzen.
Q: Was passiert, wenn eine URL oder eine Webseite als nicht-funktional eingestuft wurde?
- A: Wenn der InternetArchiveBot feststellt, dass eine URL defekt ist, stoppt er seine Anfragen daran und ersetzt oder entfernt sie aus der Wikipedia. Wenn die URL ersetzt wird, wird sie meist von einer archivierten Version der Seite ersetzt, die durch die Wayback Machine erstellt wurde.
Q: Wir haben vor kurzem unsere Website umstrukturiert, aber der InternetArchiveBot macht immer noch Anfragen an die alten URLs. Wie können wir das ändern?
- A: Es gibt zwei Optionen. Die einfachste Option ist, alle alten URLs mit einem 302 Code (temporäre Weiterleitung) auf die neuen und korrekten URLs weiterzuleiten. Der IABot folgt den Weiterleitungen und testet die neuen URLs automatisch. Die zweite Option ist, User talk:InternetArchiveBot zu kontaktieren und zu erklären, dass es eine neue URL-Struktur gibt und wie diese korrekt umgewandelt werden kann.
Q: Was kann ich tun, wenn ich weiter Fragen habe?
- A: Wir empfehlen dir, User talk:InternetArchiveBot zu kontaktieren und eine Nachricht auf der Diskussionsseite zu hinterlassen. Um das zu tun, klicke auf den Tab „Neuer Abschnitt“, den du oben rechts auf der Seite findest.