Jump to content

IP Editing: Privacy Enhancement and Abuse Mitigation/Research and tools/de

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page IP Editing: Privacy Enhancement and Abuse Mitigation/Research and tools and the translation is 79% complete.
Outdated translations are marked like this.

Daten zur portugiesischen Wikipedia, die IP-Bearbeitungen deaktiviert

Portuguese Wikipedia’s metrics following restriction

30 August 2021 Update

Hallo. Dies ist ein kurzes Update zu den Metriken der portugiesischen Wikipedia, seit sie eine Registrierung zum Bearbeiten erfordern. Wir stellen einen umfassenden Bericht auf der Seite Impact report bereit. Dieser Bericht enthält Metriken, die durch Daten erfasst wurden, sowie eine Umfrage, die unter aktiven portugiesischen Wikipedia-Mitwirkenden durchgeführt wurde.

Insgesamt stellt der Bericht den Wandel positiv dar. Wir haben in dem Zeitraum, in dem diese Metriken erfasst wurden, keine nennenswerten Störungen festgestellt. Vor diesem Hintergrund werden wir jetzt ermutigt, ein Experiment mit zwei weiteren Projekten durchzuführen, um zu sehen, ob wir ähnliche Auswirkungen beobachten. Alle Projekte sind auf ihre Weise einzigartig und was für die portugiesische Wikipedia gilt, gilt möglicherweise nicht für ein anderes Projekt. Wir möchten ein zeitlich begrenztes Experiment mit zwei Projekten durchführen, bei denen eine Registrierung zum Bearbeiten erforderlich ist. Wir schätzen, dass es ungefähr 8 Monate dauern wird, bis wir genügend Daten gesammelt haben, um signifikante Änderungen zu erkennen. Nach Ablauf dieses Zeitraums werden wir für die Bearbeitung der Daten während der Datenanalyse keine Registrierung mehr verlangen. Nach der Veröffentlichung der Daten kann die Community selbst entscheiden, ob sie die unregistrierte Bearbeitung des Projekts weiterhin verbieten möchte.

Wir nennen dies das Login Required Experiment (Experiment das eine Anmeldung erfordert). Auf dieser Seite findest Du weitere Details sowie eine Zeitleiste. Bitte verwende diese Seite und die zugehörige Diskussionsseite, um dies weiter zu besprechen.

Portuguese Wikipedia IP editing restriction

Die portugiesische Wikipedia banned unregistered editors hat nicht registrierte Autoren letztes Jahr daran gehindert, zu editieren. In den letzten Monaten hat unser Team Daten über die Auswirkungen dieses Schritts auf den allgemeinen Zustand des Projekts gesammelt. Wir haben auch mit mehreren Community-Mitgliedern über ihre Erfahrungen gesprochen. Wir arbeiten an den letzten Kleinigkeiten, um alle Daten zusammenzustellen, die ein genaues Bild des Status des Projekts vermitteln. Wir hoffen, in naher Zukunft ein Update dazu zu liefern.

Werkzeuge

Tool development

As you might already know, we are working on building some new tools, partly to soften the effect of introducing temporary accounts, but also just to build better anti-vandalism tools for everyone. It is not a secret that the state of moderation tools on our projects doesn’t give the communities the tools they deserve. There is a lot of scope for improvement. We want to build tools that make it easier for anti-vandalism fighters to work effectively. We also want to reduce the barrier to entry into these roles for non-technical contributors.

Wir haben bereits über Ideen für diese Tools gesprochen, und ich werde im Folgenden ein kurzes Update dazu geben. Beachte, dass bei diesen Tools in den letzten Monaten nur langsam Fortschritte erzielt wurden, da unser Team working on overhauling SecurePoll (an der Überarbeitung von SecurePoll) arbeitet, um die Anforderungen an die bevorstehenden WMF-Vorstandswahlen zu erfüllen.

IP-Info-Funktion

Mockup für IP Info

Wir bauen ein Tool, das wichtige Informationen zu einer IP-Adresse anzeigt, die häufig bei Ermittlungen gesucht wird. Normalerweise verlassen sich Sichter, Admins und Checkuser auf externe Webseiten, um diese Informationen zu erhalten. Wir hoffen, Dir diesen Prozess zu erleichtern, indem wir Informationen von zuverlässigen IP-Anbietern in unsere Webseiten integrieren. Wir haben vor kurzem einen Prototyp gebaut und eine Runde von Benutzertests durchgeführt, um unseren Ansatz zu validieren. Wir haben festgestellt, dass eine Mehrheit der Autoren im Interview-Set das Tool hilfreich fand und angab, es in Zukunft verwenden zu wollen. Es gibt ein update on the project page (Update auf der Projektseite), auf das ich Dich aufmerksam machen möchte. Wichtige Fragen, zu denen wir gerne Dein Feedback auf feedback on the project talk page (Diskussionsseite) hätten:

  • Wenn Du nach Informationen über eine IP suchst, nach welchen genauen Informationen suchst Du? Auf welcher Seite suchst Du meistens nach diesen Informationen?
  • Welche IP-Informationen findest Du am nützlichsten?
  • Welche Art von IP-Informationen könnten Deiner Meinung nach unsere anonymen Autoren gefährden, wenn sie weitergegeben würden?

Editor-Matching-Funktion

Dieses Projekt wurde in früheren Gesprächen auch als "Sockenpuppen-Erkennung" bezeichnet. Wir versuchen einen passenden Namen dafür zu finden, der auch für Leute verständlich ist, die das Wort Sockenpuppen nicht verstehen.

Wir befinden uns in der Anfangsphase dieses Projekts. Wikimedia Foundation Research has a project, das bei der Erkennung helfen könnte, wenn zwei Autoren ein ähnliches Bearbeitungsverhalten zeigen. Dies wird dazu beitragen, verschiedene nicht registrierte Editoren zu verbinden, wenn sie unter verschiedenen automatisch generierten Konto-Benutzernamen bearbeiten. Wir haben viel Unterstützung für dieses Projekt erfahren, als wir vor einem Jahr anfingen, darüber zu diskutieren. Wir haben auch von den Risiken gehört, eine solche Funktion zu entwickeln. Wir planen, in naher Zukunft einen Prototyp zu bauen und mit der Community zu teilen. Es gibt eine wenig genutzte project page für dieses Projekt. Wir hoffen, bald ein Update dafür zu haben. Deine Gedanken zu diesem Projekt sind auf der project talk page sehr willkommen.

Wie bereits erwähnt, ist unser oberstes Ziel, unseren Communities bessere Werkzeuge zur Vandalismusbekämpfung zur Verfügung zu stellen, und gleichzeitig darauf hinarbeiten, die IP-Adresse für sie weniger wichtig zu machen. Ein weiterer wichtiger Grund dafür ist, dass IP-Adressen schwer zu verstehen sind und nur für technisch versierte Benutzer tatsächlich nützlich sind. Dies schafft eine Barriere für neue Benutzer ohne technischen Hintergrund, in funktionale Rollen einzusteigen, da sie eine höhere Lernkurve für den Umgang mit IP-Adressen haben. Wir hoffen, dass wir bald über Moderationstools verfügen, die jeder ohne große Vorkenntnisse verwenden kann.

Wir haben uns entschieden, uns zuerst darauf zu fokussieren, das CheckUser-Tool flexibler, mächtiger und einfacher bedienbar zu machen. Es ist ein wichtiges Werkzeug, dass dazu dient, in vielen unserer Projekte böswillige Akteure aufzuspüren und zu sperren (insbesondere Langzeittäter). Das CheckUser-Tool wurde viele Jahre schlecht verwaltet. Es wirkt darum veraltet und es fehlen notwendige Funktionen.

We also anticipated an uptick in the number of users who opt-in to the role of becoming a CheckUser on our projects once temporary accounts are introduced. This reinforced the need for a better, easier CheckUser experience for our users. With that in mind, the Anti-Harassment Tools team spent the past year working on improving the CheckUser tool – making it much more efficient and user-friendly. This work has also taken into account a lot of outstanding feature requests by the community. We have continually consulted with CheckUsers and stewards over the course of this project and have tried our best to deliver on their expectations. The new feature is set to go live on all projects in October 2020.

Das nächste Feature, an dem wir arbeiten, ist IP-Info. Wir haben uns für dieses Projekt nach einer Beratungsrunde zu sechs Wikis entschieden, die uns geholfen hat, die Anwendungsfälle für IP-Adressen in unseren Projekten einzugrenzen. Schon früh wurde deutlich, dass IP-Adressen einige kritische Informationen enthalten, die zur Verfügung gestellt werden müssen, damit sie ihre Aufgaben effektiv erfüllen können. Das Ziel von IP Info ist es daher, schnell und einfach wichtige Informationen über eine IP-Adresse aufzudecken. IP-Adressen liefern wichtige Informationen wie Standort, Organisation, Möglichkeit, ein Tor/VPN-Knoten zu sein, rDNS, aufgeführte Reichweite, um nur einige Beispiele zu nennen. Indem wir dies schnell und einfach zeigen können, ohne dass externe Tools benötigt werden, die nicht jeder verwenden kann, hoffen wir, dass wir Patrouillen ihre Arbeit erleichtern können. Die bereitgestellten Informationen sind auf einem so hohen Level, dass wir sie anzeigen können, ohne den anonymen Benutzer zu gefährden. Gleichzeitig sind es genug Informationen, damit Patrouillen Qualitätsurteile über eine IP-Adresse fällen können.

Nach IP Info werden wir uns auf die Funktion finding similar editors feature (Ähnliche Autoren finden) konzentrieren. Wir werden ein Maschinenlernmodell verwenden, dass mit CheckUsern zusammenarbeitet und mit historischen CheckUser-Daten trainiert wird, um das Nutzerverhalten zu vergleichen und zu markieren, wenn zwei oder mehr Nutzer sich allzu ähnlich zu verhalten scheinen. Das Modell wird berücksichtigen, auf welchen Seiten Nutzer aktiv sind, ihre Schreibstile, Bearbeitungszeiten etc. um Vorhersagen zur Ähnlichkeit zweier Nutzer zu treffen. Wir kommen unserer Sorgfaltspflicht nach, indem wir sicherstellen, dass das Modell so akkurat wie möglich ist.

Wenn es fertig ist, gibt es vieles, was so ein Modell tun kann. In einem ersten Schritt werden wir es verwenden, damit CheckUser Sockenpuppen einfach und ohne viel händischer Arbeit auffinden können. Für die Zukunft können wir darüber nachdenken, wie wir dieses Werkzeug mehr Leuten zur Verfügung stellen können und es verwenden können, um bösartige Sockenpuppenringe und Falschinformationskampagnen aufzuspüren.

Du kannst auf unserer Projektseite für Werkzeuge mehr erfahren und Kommentare hinterlassen.

Forschung

IP masking impact report

IP-Adressen sind wertvoll als halbverlässliche Identifizierungsmerkmale, die von den damit verbundenen Nutzenden nicht so einfach manipuliert werden können. Abhängig vom Provider und der Gerätekonfiguration sind die Informationen aus der IP-Adresse nicht immer akkurat oder präzise. Zudem sind tiefe technische Kenntnis und Erfahrung notwendig, um die IP-Adressen bestmöglich zu nutzen. Trotzdem müssen Administratoren derzeit keine solche Erfahrung nachweisen, um Zugriff zu haben. Diese technische Information wird verwendet, um, wenn möglich, zusätzliche Informationen zu stützen (genannt “Verhaltenswissen”, engl. “behavioural knowledge”). Die aus der IP-Adresse gewonnenen Informationen haben einen wesentlichen Einfluss auf die Richtung der administrativen Handlungen.

A Wikimedia Foundation-supported report on the impact that IP masking will have on our community.

Auf der sozialen Seite stand die Frage zur Diskussion, ob nicht-registrierte Nutzer Bearbeitungen vornehmen dürfen. Derzeit ist die Tendenz, nicht-registrierten Nutzern das Bearbeiten zu erlauben. Die Diskussion dreht sich einerseits um das Bedürfnis Vandalismus Einhalt zu gebieten und andererseits die Möglichkeit des pseudo-anonymen Editierend zu schaffen und die diesbezügliche Hemmschwelle abzubauen. Man geht von einer Voreingenommenheit gegenüber nicht-registrierten Nutzern aus, da sie mit Vandalismus in Verbindung gebracht werden. Das spiegelt sich auch als algorithmische Voreingenommenheit in Werkzeugen wir ORES wider. Zusätzlich gibt es wesentliche Kommunikationsprobleme, wenn man sich an nicht-registrierte Nutzende wenden will. Dies ergibt sich vor allem daraus, dass sie keine Nachrichten erhalten können und es nicht sichergestellt ist, dass auch die richtige Person die Nachrichten liest, die man auf der Diskussionsseite eines IP-Accounts hinterlässt.

Was die potenziellen Auswirkungen der IP-Maskierung betrifft, so wird sie erheblichen Einfluss auf die Arbeitsabläufe der Administratoren haben und kann die Arbeitsbelastung für CheckUser vorübergehend erhöhen. In diesem Fall oder wenn IP-Adressen maskiert werden, müssen wir uns darauf einstellen, dass die Fähigkeit unserer Admins, Vandalismus zu bearbeiten, stark beeinträchtigt wird. Dies kann durch die Bereitstellung von Werkzeugen mit gleichwertiger oder größerer Funktionalität gemildert werden, aber wir sollten mit einer Übergangszeit rechnen, die durch eine reduzierte Effizienz der Admins gekennzeichnet ist. Um die Arbeit unserer Administratoren angemessen zu unterstützen, müssen wir darauf achten, die folgenden Funktionen, die derzeit Informationen über IPs ergeben, beizubehalten oder Alternativen dazu bereitzustellen:

  • Effektivität und Sicherheitenabschätzung blockieren
  • Möglichkeiten schaffen, Ähnlichkeiten oder Muster unter unregistrierten Benutzern zu erkennen, wie z. B. geografische Ähnlichkeit, bestimmte Institutionen (z. B. wenn von einer Schule oder Universität aus editiert wird)
  • Möglichkeiten schaffen, bestimmte Gruppen nicht-registrierter Nutzer anzusprechen, z. B. Vandalen, die wechselnde IPs innerhalb eines bestimmten Bereichs verwenden
  • Orts- oder institutionsspezifische Aktionen (nicht unbedingt Sperren); z. B. die Möglichkeit, festzustellen, ob Bearbeitungen von einem offenen Proxy oder einem öffentlichen Ort wie einer Schule oder öffentlichen Bibliothek vorgenommen werden.

Je nachdem, wie wir mit temporären Konten oder Identifikatoren von nicht-registrierte Nutzern umgehen, können wir die Kommunikation mit nicht-registrierten Nutzern verbessern. Die zugrundeliegenden Diskussionen und Bedenken bezüglich des unregistrierten Editierens, des anonymen Vandalismus und der Voreingenommenheit gegenüber nicht-registrierten Nutzenden werden sich wahrscheinlich nicht wesentlich ändern, wenn wir IPs maskieren, vorausgesetzt, wir behalten die Möglichkeit bei, Projekte zu bearbeiten, während sie abgemeldet sind.

CheckUser workflow

Während des Entwicklungpprozesses der neuen Spezialanwendung, nämlich des Werkzeugs zur Ermittlung, haben wir CheckUser zu mehreren Projekten befragt. Basierend auf Interviews und Durcharbeiten von realen Fällen haben wir den allgemeinen CheckUser-Arbeitsablauf in fünf Abschnitte unterteilt:

  • Triaging: Bewertung der Fälle auf Machbarkeit und Komplexität.
  • Profiling: Erstellen eines Verhaltensmusters, das die nutzende Person hinter mehreren Konten identifiziert.
  • Checking: Untersuchung von IPs und Benutzern mit dem CheckUser-Werkzeug.
  • Beurteilung: Abgleich dieser technischen Informationen mit den im Schritt Profiling ermittelten Verhaltensinformationen, um eine endgültige Entscheidung über die zu ergreifenden administrativen Maßnahmen zu treffen.
  • Ergebnis: Berichterstattung über das Ergebnis der Untersuchung auf öffentlichen und privaten Plattformen, falls erforderlich, und angemessene Archivierung der Informationen für die zukünftige Verwendung.

Wir haben auch mit Mitarbeitern von Trust and Safety zusammengearbeitet, um ein Gefühl dafür zu bekommen, wie das CheckUser-Werkzeug in die Untersuchungen der Wikimedia Foundation und die Fälle, die an T&S weitergereicht werden, einfließt.

Die häufigsten und offensichtlichen Schwachstellen drehten sich alle um die nicht-intuitive Informationsdarstellung des CheckUser-Tools und die Notwendigkeit, jeden einzelnen Link in einem neuen Tab zu öffnen. Dies führte zu erheblicher Verwirrung, da die Masse der Tabs schnell außer Kontrolle geriet.

Dies führte zu massiver Verwirrung, da die Verbreitung von Tabs schnell außer Kontrolle geriet. Erschwerend kommt hinzu, dass die Informationen, die einem CheckUser angezeigt werden, sehr technisch und auf den ersten Blick nicht leicht zu verstehen sind, was die Nachverfolgung der Registerkarten erschwert. Alle unsere Befragten gaben an, dass sie auf separate Software oder physischen Stift und Papier zurückgegriffen haben, um den Überblick über die Informationen zu behalten.

Wir haben auch einige grundlegende Analysen der Sockenpuppenuntersuchungen der englischsprachigen Wikipedia-Seite durchgeführt, um einige grundlegende Metriken zu erhalten, wie viele Fälle sie bearbeiten, wie viele abgelehnt werden und wie viele Sockenpuppen ein bestimmter Bericht enthält.

Patroller use of IP addresses

Frühere Untersuchungen über das Patrolling in unseren Projekten haben sich im Allgemeinen auf die Arbeitsbelastung oder den Arbeitsablauf von Patrouillierenden konzentriert. Die jüngste Studie Patrolling on Wikipedia konzentriert sich auf die Arbeitsabläufe der Patrouillierenden und die Identifizierung potenzieller Bedrohungen für die aktuellen Anti-Vandalismus-Verfahren. Ältere Studien, wie die New Page Patrol survey und die Patroller work load study, konzentrieren sich auf die englischsprachige Wikipedia. Sie befassen sich ebenfalls ausschließlich mit der Arbeitsbelastung der Patrouillierenden und insbesondere damit, wie sich die Bot-Patrolling-Werkzeuge auf die Arbeitsbelastung der Patrouillierenden ausgewirkt haben.

In unserer Studie wurde versucht, aus folgenden fünf Wikis Schlüsse zu ziehen:

  • Japanischsprachige Wikipedia
  • Niederländischsprachige Wikipedia
  • Deutschsprachige Wikipedia
  • Chinesischsprachige Wikipedia
  • Englischsprachiges Wikiquote

Sie wurden wegen der der bekannten Einstellungen zu IP-Bearbeitungen, dem Prozentsatz der monatlichen Bearbeitungen, die von IPs vorgenommen wurden, und anderen einzigartigen oder ungewöhnlichen Umständen ausgewählt, mit denen IP-Bearbeitende konfrontiert sind, nämlich die Verwendung der Funktion "Pending Changes" (eine Art "ungesichtete Versionen") und die weit verbreitete Verwendung von Proxies. Die Teilnehmer wurden über offene Aufrufe auf Village Pumps oder dem lokalen Äquivalent rekrutiert. Wo möglich, haben wir auch auf Wiki-Botschaftsseiten gepostet. Leider hatten wir zwar Dolmetscherunterstützung für die Interviews selbst, aber keine Übersetzungsunterstützung für die Botschaften, was möglicherweise für die niedrigen Antwortraten verantwortlich war. Alle Interviews wurden über Zoom durchgeführt, wobei eine protokollierende Person anwesend war.

Die Ergebnisse früherer Studien bestätigend, fanden wir keine systematische oder einheitliche Verwendung von IP-Informationen. Außerdem wurden diese Informationen erst ab einer bestimmten Verdachtschwelle gesucht. Die meisten weiteren Untersuchungen verdächtiger Nutzeraktivitäten beginnen mit öffentlich zugänglichen On-Wiki-Informationen, wie z. B. der Überprüfung früherer lokaler Bearbeitungen, globaler Beiträge oder der Suche nach früheren Sperren.

Präzision und Genauigkeit waren weniger wichtige Eigenschaften für IP-Informationen: Als wir sahen, dass eine ausgewählte IP-Informationsseite drei verschiedene Ergebnisse für den geografischen Standort derselben IP-Adresse lieferte, erwähnte einer unserer Interviewpartner, dass die Präzision des Standorts nicht so wichtig sei wie die Konsistenz. Das heißt, solange eine IP-Adresse konsistent als aus einem Land stammend angezeigt wurde, spielte es weniger eine Rolle, ob sie korrekt oder präzise war. Dies deckt sich mit unserem Verständnis davon, wie IP-Adressinformationen verwendet werden: als eine halbwegs eindeutige Information, die mit einem einzelnen Gerät oder einer einzelnen Person assoziiert wird und die für den Durchschnittsbürger relativ schwer zu fälschen ist. Die Genauigkeit oder Präzision der dem Benutzer zugeordneten Informationen ist weniger wichtig als die Tatsache, dass sie zugeordnet und schwer zu ändern sind.

Unsere Ergebnisse heben einige wichtige Designaspekte für das IP-Info-Werkzeug hervor:

  • Liefere auf einen Blick Schlussfolgerungen über Rohdaten
  • Decke die wichtigsten Aspekte von IP-Informationen ab:
    • Geolokalisierung (wenn möglich auf Stadt- oder Bezirksebene)
    • Registrierte Organisation
    • Verbindungstyp (hoher Datenverkehr, wie von einem Rechenzentrum oder Mobilfunknetz, gegenüber niedrigem Datenverkehr, wie bei privatem Breitband)
    • Proxy-Status als binäres Ja oder Nein

AUs ethischer Sicht wird es wichtig sein, nachweisen zu können, wie alle Maßnahmen zu Stande kamen, und die Ungenauigkeit oder mangelnde Präzision erklären zu können, die mit dem Abrufen von IP-Informationen einhergeht. Obwohl dies für die Patrouilleure, mit denen wir gesprochen haben, kein größeres Problem darstellte, sollten wir bei der Erstellung eines Werkzeugs, das als Grundlage für Administratorentscheidungen dient, darauf achten, dass wir die Grenzen unseres Tools deutlich machen.

––
Best regards,
Trust and Safety Product

Please use the project talk page for discussions on the matter. For any issues concerning this release, please don't hesitate to leave a message on the project talk page or contact Szymon Grabarczuk.