IP Editing: Privacy Enhancement and Abuse Mitigation/Research and tools/pt-br

This page is a translated version of the page IP Editing: Privacy Enhancement and Abuse Mitigation/Research and tools and the translation is 60% complete.

Outdated translations are marked like this.

Dados sobre a Wikipédia em português desativando edições IP

Métricas da Wikipédia em português seguindo restrição

Atualização de 30 de agosto de 2021

Olá. Esta é uma breve atualização sobre as métricas da Wikipédia portuguesa desde que elas começaram a exigir registro para edição. Temos um relatório abrangente na página Relatório de impacto. Este relatório inclui métricas capturadas através de dados, bem como uma pesquisa realizada entre colaboradores portugueses ativos da Wikipédia.

All in all, the report presents the change in a positive light. We have not seen any significant disruption over the time period these metrics have been captured. In light of this, we are now encouraged to run an experiment on two more projects to see if we observe similar impact. All projects are unique in their own ways and what holds true for Portuguese Wikipedia might not hold true for another project. We want to run a limited-time experiment on two projects where registration will be required in order to edit. We estimate that it will take approximately 8 months for us to collect enough data to see significant changes. After that time period, we will return to not requiring registration to edit while we analyse the data. Once the data is published, the community will be able to decide for themselves whether or not they want to continue to disallow unregistered editing on the project.

Chamamos isso de Experiência de login obrigatório. Você encontrará mais detalhes, bem como um cronograma nessa página. Por favor, use a página de discussão para discutir isso mais detalhadamente.

Restrição de edição de IP da Wikipédia em português

A Wikipédia em português proibiu editores não registrados de fazer edições no projeto no ano passado. Nos últimos meses, nossa equipe vem coletando dados sobre as repercussões dessa mudança na saúde geral do projeto. Também conversamos com vários membros da comunidade sobre sua experiência. Estamos trabalhando nas partes finais para compilar todos os dados que apresentem uma imagem precisa do estado do projeto. Esperamos ter uma atualização sobre isso em um futuro próximo.

Ferramentas

Desenvolvimento de ferramentas

As you might already know, we are working on building some new tools, partly to soften the effect of introducing temporary accounts, but also just to build better anti-vandalism tools for everyone. It is not a secret that the state of moderation tools on our projects doesn’t give the communities the tools they deserve. There is a lot of scope for improvement. We want to build tools that make it easier for anti-vandalism fighters to work effectively. We also want to reduce the barrier to entry into these roles for non-technical contributors.

Já falamos sobre ideias para essas ferramentas antes e fornecerei uma breve atualização sobre estas abaixo. Observe que o progresso nessas ferramentas tem sido lento nos últimos meses, pois nossa equipe está trabalho na revisão do SecurePoll para atender às necessidades das próximas eleições do Conselho da WMF.

Recurso de informações de IP

Estamos construindo uma ferramenta que exibirá informações importantes sobre um endereço IP. Normalmente, patrulheiros, administradores e usuários de verificação dependem de sites externos para fornecer essas informações. Esperamos tornar este processo mais fácil para eles, integrando informações de IP confiáveis em nossos projetos. Recentemente, construímos um protótipo e conduzimos uma rodada de testes com usuários para validar nossa abordagem. Descobrimos que a maioria dos editores no conjunto de entrevistas considerou a ferramenta útil e indicou que gostaria de usá-la no futuro. Há uma atualização na página do projeto para a qual gostaria de chamar sua atenção. Perguntas-chave que gostaríamos de receber de seu feedback na página de discussão do projeto:

Ao investigar um IP, que tipo de informação você procura? Em qual página você provavelmente estará ao procurar essas informações?
Que tipos de informações de IP você acha mais úteis?
Que tipos de informações de IP, quando compartilhadas, você acha que poderiam colocar nossos editores anônimos em risco?

Recurso de correspondência do editor

Este projeto também foi referido como “Editores próximos” e “Detecção de fantoches” em conversas anteriores. Estamos tentando encontrar um nome adequado que seja compreensível até para pessoas que não entendem a palavra "fantoche".

Estamos nos estágios iniciais deste projeto. A Wikimedia Foundation Research tem um projeto que pode ajudar a detectar quando dois editores exibem comportamentos de edição semelhantes. Isso ajudará a conectar diferentes editores quando eles editarem com diferentes nomes de usuários. Ouvimos muito apoio a este projeto quando começamos a falar sobre ele, há um ano. Também ouvimos sobre os riscos de desenvolver tal recurso. Estamos planejando construir um protótipo no curto prazo e compartilhá-lo com a comunidade. Há uma página para este projeto. Esperamos ter uma atualização em breve. Suas opiniões sobre este projeto são muito bem-vindas na página de discussão do projeto.

Como mencionado anteriormente, nosso principal objetivo é fornecer melhores ferramentas antivandalismo para nossas comunidades, o que proporcionará uma melhor experiência de moderação para nossos combatentes de vândalos, ao mesmo tempo que trabalharemos para tornar a sequência de endereços IP menos valiosa para eles. Outra razão importante para fazer isso é que os endereços IP são difíceis de entender e são realmente muito úteis apenas para usuários com experiência em tecnologia. Isso cria uma barreira para que novos usuários sem qualquer formação técnica, pois há uma curva de aprendizado mais alta para eles trabalharem com endereços IP. Esperamos chegar a um lugar onde possamos ter ferramentas de moderação que qualquer pessoa possa usar sem muito conhecimento prévio.

A primeira coisa que decidimos focar foi tornar a ferramenta CheckUser mais flexível, poderosa e fácil de usar. É uma ferramenta importante que atende à necessidade de detectar e bloquear maus usuários (especialmente abusadores de longo prazo) em muitos dos nossos projetos. A ferramenta CheckUser não foi muito bem mantida por muitos anos e, como resultado, parecia bastante desatualizada e sem os recursos necessários.

We also anticipated an uptick in the number of users who opt-in to the role of becoming a CheckUser on our projects once temporary accounts are introduced. This reinforced the need for a better, easier CheckUser experience for our users. With that in mind, the Anti-Harassment Tools team spent the past year working on improving the CheckUser tool – making it much more efficient and user-friendly. This work has also taken into account a lot of outstanding feature requests by the community. We have continually consulted with CheckUsers and stewards over the course of this project and have tried our best to deliver on their expectations. The new feature is set to go live on all projects in October 2020.

The next feature that we are working on is IP info. We decided on this project after a round of consultation on six wikis which helped us narrow down the use cases for IP addresses on our projects. It became apparent early on that there are some critical pieces of information that IP addresses provide which need to be made available for patrollers to be able to do their roles effectively. The goal for IP Info, thus, is to quickly and easily surface significant information about an IP address. IP addresses provide important information such as location, organization, possibility of being a Tor/VPN node, rDNS, listed range, to mention a few examples. By being able to show this, quickly and easily without the need for external tools everyone can’t use, we hope to be able to make it easier for patrollers to do their job. The information provided is high-level enough that we can show it without endangering the anonymous user. At the same time, it is enough information for patrollers to be able to make quality judgements about an IP address.

After IP Info we will be focusing on a finding similar editors feature. We’ll be using a machine learning model, built in collaboration with CheckUsers and trained on historical CheckUser data to compare user behavior and flag when two or more users appear to be behaving very similarly. The model will take into account which pages users are active on, their writing styles, editing times etc. to make predictions about how similar two users are. We are doing our due diligence in making sure the model is as accurate as possible.

Once it’s ready, there is a lot of scope for what such a model can do. As a first step we will be launching it to help CheckUsers detect socks easily without having to perform a lot of manual labor. In the future, we can think about how we can expose this tool to more people and apply it to detect malicious sockpuppeting rings and disinformation campaigns.

Você pode ler mais e deixar comentários em nossa página de projeto para ferramentas.

Pesquisa

Relatório de impacto do mascaramento de IP

Os endereços IP são valiosos como identificadores parciais semiconfiáveis, que não são facilmente manipulados pelo usuário associado. Dependendo da configuração do provedor e do dispositivo, as informações de endereço IP nem sempre são precisas, e é necessário profundo conhecimento técnico para fazer o melhor uso das informações de endereço IP, embora atualmente os administradores não sejam obrigados a demonstrar tal fluência para ter acesso. Estas informações técnicas são utilizadas para apoiar informações adicionais (referidas como “conhecimento comportamental”) sempre que possível, e as informações extraídas dos endereços IP têm um impacto significativo no curso das medidas administrativas tomadas.

No lado social, a questão de permitir ou não a edição de usuários não registrados tem sido objeto de amplo debate. Até agora, ele errou ao permitir que usuários não registrados editassem. O debate é geralmente enquadrado em torno do desejo de deter o vandalismo, em vez de preservar a capacidade de edição pseudo-anônima e reduzir a barreira à edição. Existe uma percepção de preconceito contra usuários não cadastrados devido à sua associação com vandalismo, que também aparece como preconceito algorítmico em ferramentas como o ORES. Além disso, existem grandes problemas de comunicação ao tentar falar com usuários não registrados, em grande parte devido à falta de notificações e porque não há garantia de que a mesma pessoa lerá as mensagens enviadas para aquela página de discussão IP.

Em termos do impacto potencial do mascaramento de IP, ele terá um impacto significativo nos fluxos de trabalho dos administradores e poderá aumentar a carga sobre os CheckUsers no curto prazo. Se ou quando os endereços IP forem mascarados, devemos esperar que a capacidade dos nossos administradores de gerir o vandalismo seja bastante prejudicada. Isto pode ser mitigado fornecendo ferramentas com funcionalidade equivalente ou superior, mas devemos esperar um período de transição marcado pela redução das exigências ao administrador. Para fornecer ferramentas de suporte adequadas ao trabalho de nossos administradores, devemos ter o cuidado de preservar ou fornecer alternativas às seguintes funções atualmente desempenhadas pelas informações de IP:

Block efficacy and collateral estimation
Alguma forma de revelar semelhanças ou padrões entre usuários não registrados, como semelhança geográfica, determinadas instituições (por exemplo, se as edições vierem de uma escola secundária ou universidade)
A capacidade de atingir grupos específicos de usuários não registrados, como vândalos que saltam IPs dentro de um intervalo específico
Location or institution-specific actions (not necessarily blocks); for example, the ability to determine if edits are made from an open proxy, or public location like a school or public library.

Dependendo de como lidamos com contas temporárias ou identificadores de usuários não registrados, poderemos melhorar a comunicação com usuários não registrados. As discussões e preocupações subjacentes sobre edição não registrada, vandalismo anônimo e preconceito contra usuários não registrados provavelmente não mudarão significativamente se mascararmos IPs, desde que mantenhamos a capacidade de editar projetos enquanto estiver desconectado.

CheckUser workflow

Entrevistamos CheckUsers em vários projetos ao longo de nosso processo de criação da nova ferramenta Special:Investigate. Com base em entrevistas e análises de casos reais, dividimos o fluxo de trabalho geral do CheckUser em cinco seções:

Triagem: avaliação de casos quanto à viabilidade e complexidade.
Profiling: creating a pattern of behaviour which will identify the user behind multiple accounts.
Checking: examining IPs and useragents using the CheckUser tool.
Judgement: matching this technical information against the behavioural information established in the Profiling step, in order to make a final decision about what kind of administrative action to take.
Closing: reporting the outcome of the investigation on public and private platforms where necessary, and appropriately archiving information for future use.

Também trabalhamos com a equipe de Confiança e Segurança para entender como a ferramenta CheckUser influencia as investigações e casos da Wikimedia Foundation que são encaminhados para T&S.

Os pontos problemáticos mais comuns e óbvios giravam em torno da apresentação não intuitiva de informações da ferramenta CheckUser e da necessidade de abrir cada link em uma nova guia. Isso causou enorme confusão, pois a proliferação de guias rapidamente saiu do controle. Para piorar a situação, as informações que o CheckUser apresenta são altamente técnicas e difíceis de entender à primeira vista, tornando as guias difíceis. Todos os nossos entrevistados afirmaram que recorreram a softwares separados ou caneta e papel físicos para acompanhar as informações.

Também executamos algumas análises básicas da Wikipédia em inglês para obter algumas métricas básicas sobre quantos casos eles processam, quantos são rejeitados e quantos fantoches um determinado relatório contém.

Patroller use of IP addresses

Previous research on patrolling on our projects has generally focused on the workload or workflow of patrollers. Most recently, the Patrolling on Wikipedia study focuses on the workflows of patrollers and identifying potential threats to current anti-vandal practices. Older studies, such as the New Page Patrol survey and the Patroller work load study, focused on English Wikipedia. They also look solely at the workload of patrollers, and more specifically on how bot patrolling tools have affected patroller workloads.

Nosso estudo tentou recrutar cinco wikis alvo, eram:

Wikipédia em japonês
Wikipédia em holandês
Wikipédia em alemão
Wikipédia em chinês
Wikiquote em inglês

They were selected for known attitudes towards IP edits, percentage of monthly edits made by IPs, and any other unique or unusual circumstances faced by IP editors (namely, use of the Pending Changes feature and widespread use of proxies). Participants were recruited via open calls on Village Pumps or the local equivalent. Where possible, we also posted on Wiki Embassy pages. Unfortunately, while we had interpretation support for the interviews themselves, we did not extend translation support to the messages, which may have accounted for low response rates. All interviews were conducted via Zoom, with a note-taker in attendance.

Supporting the findings from previous studies, we did not find a systematic or unified use of IP information. Additionally, this information was only sought out after a certain threshold of suspicion. Most further investigation of suspicious user activity begins with publicly available on-wiki information, such as checking previous local edits, Global Contributions, or looking for previous bans.

Precision and accuracy were less important qualities for IP information: upon seeing that one chosen IP information site returned three different results for the geographical location of the same IP address, one of our interviewees mentioned that precision in location was not as important as consistency. That is to say, so long as an IP address was consistently exposed as being from one country, it mattered less if it was correct or precise. This fits with our understanding of how IP address information is used: as a semi-unique piece of information associated with a single device or person, that is relatively hard to spoof for the average person. The accuracy or precision of the information attached to the user is less important than the fact that it is attached and difficult to change.

Our findings highlight a few key design aspects for the IP info tool:

Provide at-a-glance conclusions over raw data
Cover key aspects of IP information:
- Geolocation (to a city or district level where possible)
- Registered organization
- Connection type (high-traffic, such as data center or mobile network versus low-traffic, such as residential broadband)
- Proxy status as binary yes or no

As an ethical point, it will be important to be able to explain how any conclusions are reached, and the inaccuracy or imprecisions inherent in pulling IP information. While this was not a major concern for the patrollers we talked to, if we are to create a tool that will be used to provide justifications for administrative action, we should be careful to make it clear what the limitations of our tools are.

––
Best regards,
Trust and Safety Product

Please use the project talk page for discussions on the matter. For any issues concerning this release, please don't hesitate to leave a message on the project talk page or contact Szymon Grabarczuk.