IP Editing: Privacy Enhancement and Abuse Mitigation/Research and tools/fr
Données sur Wikipédia portugais désactivant les modifications IP
Portuguese Wikipedia’s metrics following restriction
30 August 2021 Update
Hello. This is a brief update about Portuguese Wikipedia’s metrics since they started requiring registration to edit. We have a comprehensive report on the Impact report page. This report includes metrics captured through data as well as a survey that was conducted among active Portuguese Wikipedia contributors.
All in all, the report presents the change in a positive light. We have not seen any significant disruption over the time period these metrics have been captured. In light of this, we are now encouraged to run an experiment on two more projects to see if we observe similar impact. All projects are unique in their own ways and what holds true for Portuguese Wikipedia might not hold true for another project. We want to run a limited-time experiment on two projects where registration will be required in order to edit. We estimate that it will take approximately 8 months for us to collect enough data to see significant changes. After that time period, we will return to not requiring registration to edit while we analyse the data. Once the data is published, the community will be able to decide for themselves whether or not they want to continue to disallow unregistered editing on the project.
We are calling this the Login Required Experiment. You will find more detail as well as a timeline on that page. Please use that page and its talk page to discuss this further.
Portuguese Wikipedia IP editing restriction
Wikipédia en portugais a interdit aux éditeurs non enregistrés d'apporter des modifications au projet l'année dernière. Au cours des derniers mois, notre équipe a collecté des données sur les répercussions de ce bouleversement sur la santé générale du projet. Nous avons également parlé à plusieurs membres de la communauté sur leur expérience. Nous travaillons sur les derniers détails pour compiler toutes les données qui présentent une image précise de l'état du projet. Nous espérons avoir une mise à jour à ce sujet dans un proche avenir.
Outils
Tool development
As you might already know, we are working on building some new tools, partly to soften the effect of introducing temporary accounts, but also just to build better anti-vandalism tools for everyone. It is not a secret that the state of moderation tools on our projects doesn’t give the communities the tools they deserve. There is a lot of scope for improvement. We want to build tools that make it easier for anti-vandalism fighters to work effectively. We also want to reduce the barrier to entry into these roles for non-technical contributors.
Nous avons déjà parlé d'idées pour ces outils et je vais vous fournir une brève mise à jour ci-dessous. Notez que les progrès sur ces outils ont été lents au cours des derniers mois, car notre équipe travaille sur la refonte de SecurePoll pour répondre aux besoins des prochaines élections du conseil d'administration du WMF.
Fonction d'informations IP
Nous construisons un outil qui affichera des informations importantes sur une adresse IP qui est couramment recherchée dans les enquêtes. Généralement, les patrouilleurs, les administrateurs et les checkusers s'appuient sur des sites Web externes pour fournir ces informations. Nous espérons leur faciliter ce processus en intégrant des informations provenant de fournisseurs IP fiables sur nos sites Web. Nous avons récemment construit un prototype et mené une série de tests utilisateurs pour valider notre approche. Nous avons constaté que la majorité des rédacteurs interrogés ont trouvé l'outil utile et ont indiqué qu'ils aimeraient l'utiliser à l'avenir. Il y a une mise à jour sur la page du projet sur laquelle j'aimerais attirer votre attention. Questions clés sur lesquelles nous aimerions avoir vos commentaires sur la page de discussion du projet :
- Lorsque vous enquêtez sur une IP, quels types d'informations recherchez-vous ? Sur quelle page êtes-vous probablement lorsque vous recherchez ces informations ?
- Quels types d'informations IP trouvez-vous les plus utiles ?
- Quels types d'informations IP, lorsqu'elles sont partagées, pourraient selon vous mettre nos éditeurs anonymes en danger ?
Fonctionnalité de correspondance de l'éditeur
Ce projet a également été appelé « Éditeurs à proximité » et « Détection de faux-nez » dans des conversations antérieures. Nous essayons de lui trouver un nom approprié qui soit compréhensible même pour les personnes qui ne comprennent pas le mot sockpuppetry (faux-nez).
Nous sommes aux premiers stades du projet de détection des faux-nez dans les projets Wikimédia qui pourrait aider à détecter quand deux éditeurs présentent des comportements d'édition similaires. Cela aidera à connecter différents éditeurs non enregistrés lorsqu'ils éditent sous différents noms d'utilisateur de compte générés automatiquement. Nous avons eu beaucoup de soutien pour ce projet lorsque nous avons commencé à en parler il y a un an, et également des risques à développer une telle fonctionnalité. Nous prévoyons de construire un prototype à court terme et de le partager avec la communauté. Il y a une page du projet peu développée pour ce projet pour laquelle nous espérons avoir bientôt de nouveaux éléments. Vos réflexions sur ce projet sont les bienvenues sur la page de discussion du projet.
Comme nous l'avons mentionné précédemment, notre objectif premier est de fournir de meilleurs outils anti-vandalisme à nos communautés, ce qui permettra une meilleure expérience de modération pour nos combattants du vandalisme tout en s'efforçant de rendre la chaîne d'adresses IP moins précieuse pour eux. Une autre raison importante de procéder ainsi est que les adresses IP sont difficiles à comprendre et ne sont vraiment utiles qu'aux utilisateurs avertis. Cela crée un obstacle pour les nouveaux utilisateurs qui n'ont pas de connaissances techniques pour entrer dans des rôles fonctionnels, car il y a une courbe d'apprentissage plus élevée pour eux de travailler avec des adresses IP. Nous espérons arriver à un point où nous pourrons disposer d'outils de modération que tout le monde pourra utiliser sans grandes connaissances préalables.
La première des choses auxquelles nous nous sommes attachés a été de rendre l'outil des check-users (CheckUser tool) plus flexible, puissant et facile à utiliser. C'est un outil important qui répond au besoin de détecter et bloquer des utilisateurs indésirables (en particulier ceux responsables d'abus de longue durée) sur nombre de nos projets. L'outil CU n'est plus correctement maintenu depuis de nombreuses années, et par conséquent, il est atteint d'obsolescence et manque des fonctionnalités nécessaires.
We also anticipated an uptick in the number of users who opt-in to the role of becoming a CheckUser on our projects once temporary accounts are introduced. This reinforced the need for a better, easier CheckUser experience for our users. With that in mind, the Anti-Harassment Tools team spent the past year working on improving the CheckUser tool – making it much more efficient and user-friendly. This work has also taken into account a lot of outstanding feature requests by the community. We have continually consulted with CheckUsers and stewards over the course of this project and have tried our best to deliver on their expectations. The new feature is set to go live on all projects in October 2020.
The next feature that we are working on is IP info. We decided on this project after a round of consultation on six wikis which helped us narrow down the use cases for IP addresses on our projects. It became apparent early on that there are some critical pieces of information that IP addresses provide which need to be made available for patrollers to be able to do their roles effectively. The goal for IP Info, thus, is to quickly and easily surface significant information about an IP address. IP addresses provide important information such as location, organization, possibility of being a Tor/VPN node, rDNS, listed range, to mention a few examples. By being able to show this, quickly and easily without the need for external tools everyone can’t use, we hope to be able to make it easier for patrollers to do their job. The information provided is high-level enough that we can show it without endangering the anonymous user. At the same time, it is enough information for patrollers to be able to make quality judgements about an IP address.
After IP Info we will be focusing on a finding similar editors feature. We’ll be using a machine learning model, built in collaboration with CheckUsers and trained on historical CheckUser data to compare user behavior and flag when two or more users appear to be behaving very similarly. The model will take into account which pages users are active on, their writing styles, editing times etc. to make predictions about how similar two users are. We are doing our due diligence in making sure the model is as accurate as possible.
Once it’s ready, there is a lot of scope for what such a model can do. As a first step we will be launching it to help CheckUsers detect socks easily without having to perform a lot of manual labor. In the future, we can think about how we can expose this tool to more people and apply it to detect malicious sockpuppeting rings and disinformation campaigns.
You can read more and leave comments on our project page for tools.
Recherche
IP masking impact report
Les adresses IP constituent un identifiant partiel semi-fiable, que son utilisateur ne manipule pas facilement. Selon le fournisseur et la configuration de l'appareil, les informations d'adresse IP ne sont pas toujours exactes ni précises. De plus, une connaissance technique approfondie et une certaine aisance sont nécessaires pour utiliser au mieux les informations d'adresse IP, bien que les administrateurs ne soient pas obligés de démontrer ces aptitudes pour pouvoir y accéder. Ces informations techniques sont utilisées pour appréhender, dans la mesure du possible, des informations supplémentaires (appelées « connaissances comportementales ») et ces données extraites des adresses IP ont un impact significatif sur le cours des décisions administratives.
Sur le volet social, la question de savoir s'il fallait autoriser les utilisateurs non enregistrés à publier a fait l'objet de débats approfondis. Jusqu'ici, le débat a porté sur la possibilité de modifier pour les utilisateurs non enregistrés. Le débat oppose généralement volonté de limiter le vandalisme et désir de réduire les barrières à la contribution en laissant les utilisateurs non enregistrés modifier. Il existe un biais de perception à l'égard des utilisateurs non enregistrés en raison de leur association au vandalisme, laquelle fait également l'objet d'un biais algorithmique dans les outils tels qu'ORES. En outre, des problèmes majeurs en matière de communication sont observés lorsque l'on essaie de s'adresser à un utilisateur non enregistré, essentiellement en raison de l'absence de notifications et parce qu'il n'y a aucune assurance que c'est bien la personne visée qui lira le message déposé sur la page de discussion de l'IP.
Concernant l'impact potentiel du masquage des adresses IP, il se fera ressentir de manière significative sur le travail des administrateurs et pourrait accroître la charge de travail des vérificateurs d'adresses IP à court terme. Si/quand les adresses IP étaient/seront masquées, nous devons nous attendre à ce que la capacité des administrateurs à lutter contre le vandalisme soit fortement entravée. Cela peut être atténué en fournissant des outils avec des fonctionnalités équivalentes voire meilleures, mais nous devons anticiper une période de transition caractérisée par une moindre efficacité des administrateurs. Dans l'objectif de fournir des outils appropriés au travail des administrateurs, nous devons nous attacher à préserver ou à fournir des alternatives pour les fonctions suivantes, actuellement assurées par la publication des adresses IP :
- Efficacité des blocages et estimation des effets collatéraux ;
- Une manière de faire ressortir des similitudes ou des motifs (pattern) parmi les utilisateurs non enregistrés, tels que des similitudes géographiques ou l'appartenance à des institutions (par exemple si les modifications proviennent d'un établissement scolaire ou du supérieur) ;
- La possibilité de viser certains groupes spécifiques d'utilisateurs non enregistrés tels que des vandales utilisant plusieurs IP au sein d'une plage d'adresses IP déterminée ;
- La faculté d'opérer des actions (pas nécessairement des blocages) liées à la localisation géographique ou l'institution rattachée à l'adresse IP, par exemple la capacité à déterminer si des modifications sont effectuées par un proxy ouvert, ou bien à identifier qu'il s'agit d'un lieu public tel qu'une école ou une bibliothèque.
Selon la manière dont nous traitons les comptes temporaires ou identifiants dédiés aux utilisateurs non enregistrés, nous pourrions être en mesure d'améliorer la communication avec ces derniers. Il est peu probable que les débats et inquiétudes relatifs aux modifications par des utilisateurs non enregistrés, au vandalisme sous adresse IP et aux préjugés sur les utilisateurs non enregistrés changent significativement si nous masquons les adresses IP et que nous maintenons la capacité de modifier les projets sans être connecté.
CheckUser workflow
We interviewed CheckUsers on multiple projects throughout our process for designing the new Special:Investigate tool. Based on interviews and walkthroughs of real-life cases, we broke down the general CheckUser workflow into five sections:
- Triaging: assessing cases for feasibility and complexity.
- Profiling: creating a pattern of behaviour which will identify the user behind multiple accounts.
- Checking: examining IPs and useragents using the CheckUser tool.
- Judgement: matching this technical information against the behavioural information established in the Profiling step, in order to make a final decision about what kind of administrative action to take.
- Closing: reporting the outcome of the investigation on public and private platforms where necessary, and appropriately archiving information for future use.
We also worked with staff from Trust and Safety to get a sense for how the CheckUser tool factors into Wikimedia Foundation investigations and cases that are escalated to T&S.
The most common and obvious pain points all revolved around the CheckUser tool's unintuitive information presentation, and the need to open up every single link in a new tab. This caused massive confusion as tab proliferation quickly got out of hand. To make matters worse, the information that CheckUser surfaces is highly technical and not easy to understand at first glance, making the tabs difficult to track. All of our interviewees said that they resorted to separate software or physical pen and paper in order to keep track of information.
We also ran some basic analyses of English Wikipedia's Sockpuppet Investigations page to get some baseline metrics on how many cases they process, how many are rejected, and how many sockpuppets a given report contains.
Patroller use of IP addresses
Previous research on patrolling on our projects has generally focused on the workload or workflow of patrollers. Most recently, the Patrolling on Wikipedia study focuses on the workflows of patrollers and identifying potential threats to current anti-vandal practices. Older studies, such as the New Page Patrol survey and the Patroller work load study, focused on English Wikipedia. They also look solely at the workload of patrollers, and more specifically on how bot patrolling tools have affected patroller workloads.
Notre étude a tenté de recruter à partir de cinq wikis cibles, qui étaient :
- Wikipédia en japonais
- Wikipédia en néerlandais
- Wikipédia en allemand
- Wikipédia en chinois
- Wikiquote en anglais
Ils ont été sélectionnés pour leurs attitudes connues à l'égard des modifications IP, le pourcentage de modifications mensuelles effectuées par les IP et toute autre circonstance unique ou inhabituelle rencontrée par les éditeurs IP (à savoir, l'utilisation de la fonction Modifications en attente et l'utilisation répandue des proxys). Les participants ont été recrutés via des appels ouverts sur les bistrots ou l'équivalent local. Dans la mesure du possible, nous avons également publié sur les pages ambassadrices Wiki. Malheureusement, alors que nous disposions du support d'interpréteurs pour les entretiens eux-mêmes, nous n'avons pas étendu le support de traduction aux messages, ce qui peut expliquer les faibles taux de réponse. Tous les entretiens ont été menés via Zoom, en présence d'un preneur de notes.
Supporting the findings from previous studies, we did not find a systematic or unified use of IP information. Additionally, this information was only sought out after a certain threshold of suspicion. Most further investigation of suspicious user activity begins with publicly available on-wiki information, such as checking previous local edits, Global Contributions, or looking for previous bans.
Precision and accuracy were less important qualities for IP information: upon seeing that one chosen IP information site returned three different results for the geographical location of the same IP address, one of our interviewees mentioned that precision in location was not as important as consistency. That is to say, so long as an IP address was consistently exposed as being from one country, it mattered less if it was correct or precise. This fits with our understanding of how IP address information is used: as a semi-unique piece of information associated with a single device or person, that is relatively hard to spoof for the average person. The accuracy or precision of the information attached to the user is less important than the fact that it is attached and difficult to change.
Our findings highlight a few key design aspects for the IP info tool:
- Provide at-a-glance conclusions over raw data
- Cover key aspects of IP information:
- Geolocation (to a city or district level where possible)
- Registered organization
- Connection type (high-traffic, such as data center or mobile network versus low-traffic, such as residential broadband)
- Proxy status as binary yes or no
D'un point de vue éthique, il sera important de pouvoir expliquer comment les conclusions sont tirées et les inexactitudes ou les imprécisions inhérentes à l'extraction des informations IP. Bien que ce n'était pas une préoccupation majeure pour les patrouilleurs à qui nous avons parlé, si nous voulons créer un outil qui servira à justifier une action administrative, nous devons prendre soin de préciser quelles sont les limites de nos outils.
––
Best regards,
Trust and Safety Product
Please use the project talk page for discussions on the matter. For any issues concerning this release, please don't hesitate to leave a message on the project talk page or contact Szymon Grabarczuk.