Jump to content

IP Editing: Privacy Enhancement and Abuse Mitigation/Research and tools/fi

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page IP Editing: Privacy Enhancement and Abuse Mitigation/Research and tools and the translation is 96% complete.
Outdated translations are marked like this.

Data koskien IP-muokkausten estämistä portugalinkielisessä Wikipediassa

Tilastotietoja portugalinkielisen Wikipedian IP-muokkaamisen rajoittamisesta

Päivitys 30. elokuuta 2021 =

Hei. Tämä on lyhyt päivitys portugalinkielisen Wikipedian tilastoista sen jälkeen, kun siellä päätettiin edellyttää rekisteröitymistä kaikilta muokkaajilta. Tarkemman raportin löydät täältä. Raportti sisältää datan perusteella tehdyt tilastot ja portugalinkielisessä Wikipediassa aktiivisten muokkaajien keskuudessa tehdyn kyselyn.

Kaiken kaikkiaan muutos oli raportin mukaan positiivinen. Me emme ole havainneet tiedonkeräyksen aikana merkittäviä haittavaikutuksia. Siksi me haluaisimme suorittaa kokeilun kahdessa muussa projektissa, jotta näemme onko vaikutus niissä samanlainen. Kaikki projektit ovat ainutlaatuisia omalla tavallaan, ja se mikä pätee portugalinkieliseen Wikipediaan, ei välttämättä päde muihin projekteihin. Me haluamme tehdä rajatunpituisen kokeilun kahdessa projektissa, joissa muokkaamista varten täytyy siis ensin rekisteröityä. Arvioimme riittävän datan keräämiseen menevän kahdeksan kuukautta, jotta voimme nähdä merkittävät muutokset. Sen jälkeen rekisteröitymispakko poistetaan, ja me analysoimme datan. Datan julkaisemisen jälkeen projektin yhteisö voi itse päättää, haluaako se jatkaa rekisteröitymispakkoa.

Kokeilun nimi on Login Required Experiment (sisäänkirjautuminen edellytetään -kokeilu). Linkin takaa löydät lisätietoja ja aikajanan, ja voit keskustella kokeilusta sen keskustelusivulla.

IP-muokkaamisen rajoittaminen portugalinkielisessä Wikipediassa

Viime vuonna portugalinkielinen Wikipedia poisti rekisteröitymättömiltä käyttäjiltä mahdollisuuden tehdä muokkauksia. Viime kuukausien aikana tiimimme on kerännyt dataa sen vaikutuksista. Olemme myös keskustelleet yhteisön jäsenten kanssa heidän kokemuksistaan. Viimeistelemme datan kokoamista, jotta saamme täsmällisen tiedon projektin tilasta. Pyrimme julkaisemaan siitä päivityksen lähitulevaisuudessa.

Työkalut

Työkalujen kehittäminen

Kuten saatat jo tietää, me olemme kehittämässä uusia toimintoja: osittain ne tehdään lieventämään IP-naamioimisen vaikutuksia, mutta myös siksi, että kaikilla olisi paremmat työkalut torjua vandalismia. Ei ole mikään salaisuus, että yhteisöt ansaitsisivat paremmat työkalut kuin niillä nyt on. Parantamisen varaa on paljon. Haluamme tehdä työkaluja, jotka mahdollistavat tehokkaan työskentelyn vandalismia vastaan. Haluamme myös madaltaa kynnystä, jotta myös teknisesti vähemmän taitavat käyttäjät pystyvät osallistumaan siihen.

Olemme aiemmin keskustelleet ideoista näitä työkaluja varten, ja alla annan siitä lyhyen päivityksen. Viime kuukausina näihin toimintoihin liittyvä kehitys on ollut hidasta, koska tiimimme on on työskennellyt SecurePoll-toiminnon uudistuksen kanssa, jotta se täyttäisi tulevien WMF-säätiön johtokunnan vaalien vaatimukset.

IP-info -toiminto

IP-infon hahmotelma

Me kehitämme työkalua, joka antaa IP-osoitteesta sellaista tietoa, jota yleensä käytetään häiriköinnin tutkimisessa. Muutosten tarkistajat, ylläpitäjät ja osoitepaljastajat ovat yleensä käyttäneet ulkoisia sivuja saadakseen nämä tiedot. Me pyrimme tekemään prosessista heille helpomman sisällyttämällä luotettavien IP-tarjoajien informaatiota omilla sivuillamme. Teimme hiljattain prototyypin, jota käyttäjät testasivat. Suurin osa haastatelluista muokkaajista piti työkalua hyödyllisenä ja ilmaisi halukkuutensa käyttää sitä jatkossa. Voit lukea lisää projektisivulta. Avainkysymyksiä, joihin haluaisimme teiltä palautetta projektin keskustelusivulla:

  • Kun tarkastelet IP-osoitetta, minkälaista informaatiota etsit? Millä sivulla todennäköisesti olet etsiessäsi kyseistä tietoa?
  • Minkälaisia tietoja IP-osoitteesta pidät hyödyllisimpinä?
  • Minkälaiset tiedot IP-osoitteesta voivat mielestäsi saattaa anonyymit käyttäjät alttiiksi riskeille?

Muokkaajien vertailu -toiminto

Aiemmissa keskusteluissa tätä projektia on kutsuttu myös nimillä "Nearby editors (Läheiset muokkaajat)" ja "Sockpuppet detection (Sukkanukkien havaitseminen)". Me yritämme keksiä sille sopivan nimen, jonka ymmärtävät myös he, joille sukkanukkeilu ei ole tuttu termi.

Tämä projekti on alkuvaiheissaan. Wikimedia Foundation Research -tiimillä on projekti, joka saattaisi auttaa havaitsemaan, kun kaksi muokkaajaa käyttäytyy samantyyppisesti. Tämä auttaa yhdistämään rekisteröitymättömiä käyttäjiä, kun he muokkaavat erillisten automattisesti generoitujen käyttäjänimien alla. Saimme paljon positiivista palautetta, kun aloimme puhua projektista vuosi sitten. Olemme kuulleet palautetta myös tällaisen toiminnon riskeistä. Suunnitelmissamme on tehdä prototyyppi lähiaikoina ja kertoa siitä yhteisössä. Projektille on keskeneräinen projektisivu. Toivomme pystyvämme päivittämään sitä pian. Voit mielellään kertoa ajatuksiasi projektista sen keskustelusivulla.

Kuten aiemmin jo mainittiin, päällimmäinen tavoitteemme on tarjota yhteisöillemme parempia työkaluja vandalismin torjuntaan, jotta vandalismintorjujien on helpompi työskennellä, ja samalla me pyrimme tekemään IP-osoitteista heille vähemmän tarpeellisen ominaisuuden. IP-osoitteet ovat myös vaikeita ymmärtää, ja ne ovat siksi hyödyllisiä vain teknisesti taitaville käyttäjille, mikä on toinen tärkeä syy tälle uudistukselle. Sellaisten uusien käyttäjien, joilla ei ole teknistä taustaa, on vaikeampi päästä rajoitettujen oikeuksien käyttäjiksi, koska heille IP-osoitteiden kanssa toimiminen on hankalampaa opetella. Me toivomme pääsevämme siihen pisteeseen, että kuka tahansa voi käyttää kyseisiä työkaluja, vaikkei hänellä olisikaan paljoa aiempaa teknistä tietämystä.

Ensimmäinen työvaiheemme oli tehdä osoitepaljastimesta joustavampi, tehokkaampi ja helpompi käyttää. Se on tärkeä työkalu, joka auttaa negatiivisten toimijoiden (etenkin pitkäaikaisten häiriköiden) havaitsemisessa ja estämisessä useassa projektissa. Osoitepaljastin-työkalua ei ole kehitetty moneen vuoteen, ja siksi se oli toimintona vanhentunut, ja siitä puuttui tarpeellisia ominaisuuksia.

Me ennakoimme IP-osoitteiden naamiomisen lisäävän käyttäjien halukkuutta ryhtyä osoitepaljastajiksi, mikä vahvisti tarpeen uudelle ja helpommalle osoitepaljastimen käyttökokemukselle. Siksi Anti-Harassment Tools -tiimi on viime vuonna kehittänyt osoitepaljastinta tehdäkseen sen paljon aikaisempaa tehokkaammaksi ja käyttäjäystävällisemmäksi. Myös monet yhteisömme esittämät kehittämispyynnöt on otettu huomioon. Projektin aikana olemme konsultoineet jatkuvasti osoitepaljastimen käyttäjien ja ylivalvojien kanssa ja pyrkineet täyttämään heidän odotuksensa. Tämän uuden toiminnon on tarkoitus tulla käyttöön kaikissa projekteissa lokakuussa 2020.

Seuraavaksi työstämämme toiminto on IP-info. Päätimme aloittaa tämän projektin konsultoituamme kuutta wikiä, mikä auttoi meitä rajaamaan IP-osoitteiden käyttötarpeita projekteissamme. Heti alussa kävi ilmeiseksi, että IP-osoitteet tarjoavat sellaista kriittistä informaatiota, jota muutostentarkistajat tarvitsevat pystyäkseen toimimaan tehokkaasti. IP-infon tarkoitus on siis antaa IP-osoitteesta olennaista tietoa nopeasti ja helposti. IP-osoitteet antavat tärkeää tietoa, kuten sijainnin, organisaation, tiedon onko osoite Tor/VPN-solmu, rDNS, osoiteavaruuden jne. Näyttämällä nämä tiedot nopeasti ja helposti ilman tarvetta ulkoisille työkaluille, joita kaikki eivät voi käyttää, me toivomme muutostentarkistajien pystyvän tekemään työnsä helpommin. Tiedot ovat tarpeeksi yleisiä, että ne voidaan näyttää vaarantamatta yksittäistä käyttäjää. Samalla informaatiota on tarpeeksi, jotta muutostentarkistajat pystyvät tekemään arvionsa kyseisestä IP-osoitteesta.

IP-infon jälkeen me työstämme työkalua, jolla löytää samantapaisia muokkaajia. Me käytämme koneoppimismallia, joka tehdään yhteistyössä osoitepaljastajien kanssa, ja joka oppii aikaisemman osoitepaljastindatan avulla vertaamaan käyttäjien toimintaa ja ilmoittamaan, kun kaksi tai useampi käyttäjä näyttää toimivan hyvin samalla tavalla. Malli ottaa huomioon käyttäjän muokkaamat sivut, kirjoitustyylin, muokkausajat jne. ja arvioi, kuinka samanlaisia käyttäjät ovat. Pyrimme tekemään mallista mahdollisimman tarkan.

Valmistuttuaan mallin käytöllä on iso skaala. Ensiksi se otetaan käyttöön auttamaan osoitepaljastajia havaitsemaan sukkanuket helposti ilman, että heidän täytyy tehdä paljon manuaalista työtä. Tulevaisuudessa me voimme pohtia, miten työkalun voisi antaa käyttöön useammalle käyttäjälle ja hyödyntää sitä pahantahtoisten sukkanukkerinkien ja väärän tiedon levittäjien löytämiseksi.

Voit lukea lisää ja osallistua keskusteluun näistä työkaluista.

Selvitystyö

Raportti IP-naamioinnin vaikutuksista

IP-osoitteet antavat arvokasta tietoa, koska ne ovat kohtuullisen luotettavia osittaistunnisteita, joita käyttäjä ei pysty helposti manipuloimaan. Yhteydentarjoajasta ja konfiguraatiosta riippuen IP-osoitteen antama informaatio ei aina ole tarkkaa tai paikkansapitävää, ja sen optimaalinen käyttö vaatii syvällistä teknistä tietoa ja taitoa. Ylläpitäjiltä ei tosin nykyisellään vaadita sellaisen osoittamista. Teknisen informaation lisäksi käytetään lisäinformaatiota (tietoa muokkaajan käyttäytymisestä) jos mahdollista, ja IP-osoitteista saatava informaatio vaikuttaa merkittävästi siihen, minkälaisia ylläpitotoimenpiteitä toteutetaan.

Wikimedia-säätiön tukema raportti IP-osoitteiden naamioimisen vaikutuksista yhteisöihimme.

Rekisteröitymättömien käyttäjien tekemien muokkamusten sallimisesta on keskusteltu paljon. Toistaiseksi keskustelu on ollut sen puolella, että sellaiset muokkaukset sallitaan. Keskustelua käydään yleensä kahdesta näkökulmasta: yhtäällä vandalismin estäminen ja toisaalla pseudoanonyymin muokkaamisen salliminen ja muokkaamiskynnyksen alentaminen. Koska IP-osoitteista vandalisoidaan paljon, on niitä kohtaan olemassa negatiivinen ennakkoasenne, joka ilmenee myös alogritmeissa kuten ORES-toiminnossa. Lisäksi rekisteröitymättömien käyttäjien kanssa on hyvin vaikea kommunikoida. Se johtuu pitkälti siitä, etteivät he saa ilmoituksia viesteistä, ja koskaan ei myöskään voi olla varma siitä, että viestit lukee se henkilö, jolle ne on tarkoitettu.

IP-osoitteiden naamiointi tulee vaikuttamaan merkittävästi ylläpitäjien toimintatapoihin, ja lyhyellä aikavälillä se saattaa lisätä osoitepaljastajien työtaakkaa. Jos ja kun IP-osoitteet naamioidaan, me oletamme ylläpitäjien mahdollisuuksien torjua vandalismia vaikeutuvan selvästi. Tätä voidaan lieventää tarjoamalla työkaluja, jotka ovat yhtä hyviä tai parempia kuin aiemmat, mutta me odotamme näkevämme siirtymäkauden, jolloin ylläpitäjien tehokkuus laskee. Voidaksemme tarjota ylläpitäjillemme asianmukaiset työkalut meidän täytyy joko säilyttää tai tarjota vaihtoehtoja alla luetelluille toiminnoille, jotka nykyään hyödyntävät IP-osoitteista saatavaa informaatiota:

  • Estojen tehokkuus ja niiden vaikutus syyttömiin hyväntahtoisiin muokkaajiin
  • Jokin tapa havaita samankaltaisuuksia rekisteröitymättömien käyttäjien välillä, kuten maantieteellinen sijainti tai tietty organisaatio (esim. jos muokkaukset tehdään lukiosta tai yliopistosta)
  • Kyky kohdistaa toimenpiteet tiettyihin käyttäjäjoukkoihin, kuten vandaaleihin, jotka vaihtavat IP-osoitettaan tietyn osoiteavaruuden sisällä
  • Sijaintiin tai organisaatioihin kohdistuvat toimenpiteet (ei välttämättä estot): esimerkiksi mahdollisuus selvittää, onko muokkaukset tehty avoimen välityspalvelimen kautta tai julkisesta paikasta kuten koulusta tai kirjastosta.

Riippuen siitä, kuinka väliaikaiset käyttäjätilit tai tunnisteet rekisteröitymättömille käyttäjille toteutetaan, me saatamme pystyä parantamaan kommunikaatioita rekisteröitymättömien käyttäjien kanssa. Taustalla vaikuttavat rekisteröitymättömien käyttäjien muokkaamista ja vandalismia koskevat huolet ja keskustelun aiheet, sekä rekisteröitymättömiin muokkaajiin kohdistuvat ennakkoasenteet tuskin muuttuvat merkittävästi, jos IP-osoitteet naamioidaan, olettaen että me säilytämme mahdollisuuden muokata projekteissamme ilman sisäänkirjautumista.

Osoitepaljastajien työtavat

Me haastattelimme osoitepaljastajia useissa projekteissa kehittäessämme uutta Special:Investigate-työkalua. Haastattelujen ja todellisten tapausten analysoinnin perusteella me jaoimme osoitepaljastajien toimintatavat viiteen osaan:

  • Lajittelu: tapausten monimutkaisuuden ja toteuttamiskelpoisuuden arvioiminen.
  • Profilointi: sellaisen käyttäytymiskaavan luominen, jolla voidaan tunnistaa useita tunnuksia hallitseva käyttäjä.
  • Osoitepaljastaminen: IP-osoitteiden ja käyttäjäagenttien tutkiminen osoitepaljastin-työkalulla.
  • Päätös: teknisen informaation arviointi Profilointi-vaiheessa saadun käyttäytymiskaavan suhteen, jotta niistä voidaan tehdä päätös tarvittavista ylläpidollisista toimenpiteistä.
  • Sulkeminen: tutkinnan lopputuloksen raportointi tarvittaessa julkisilla ja yksityisillä alustoilla ja tiedon tarkoituksenmukainen arkistointi tulevaisuutta varten.

Olemme myös tehneet yhteistyötä Trust and Safety (T & S) -tiimin jäsenten kanssa saadaksemme käsityksen siitä, miten osoitepaljastinta käytetään Wikimedia-säätiön suorittamissa tutkinnoissa ja niissä tapauksissa, jotka annetaan yhteisöistä T & S -tiimin käsiteltäviksi.

Yleisimmät ja ilmeisimmät hankaluudet liittyivät kaikki osoitepaljastimen epäintuitiiviseen tiedon esittämistapaan ja siihen, että jokainen linkki piti avata uudessa välilehdessä. Tämä aiheutti paljon hämminkiä, kun isoa määrää välilehtiä ei enää pystynyt pitämään järjestyksessä. Lisäksi osoitepaljastaminen löytämä tieto on erittäin teknistä, eikä sitä ei ole helppo ymmärtää yhdellä silmäyksellä, mikä tekee välilehtien hallitsemisesta vaikeaa. Kaikki haastattelemamme henkilöt sanoivat käyttävänsä erillistä ohjelmistoa tai fyysistä kynää ja paperia pitääkseen informaation järjestyksessä.

Me teimme myös joitakin analyysejä englanninkielisen Wikipedian sukkanukkeilututkimuksista saadaksemme tilastotietoja siitä, kuinka paljon tapauksia siellä käsitellään, kuinka moni niistä hylätään ja kuinka monta sukkanukkea yksi tapaus sisältää.

Miten muutosten tarkastajat käyttävät IP-osoitteita

Aikaisemmat tutkimukset muutostentarkastamiseen liittyen ovat keskittyneet muutostentarkastajien työmäärään ja työskentelytapoihin. Patrolling on Wikipedia -tutkimus käsittelee muutostentarkastajien työtapoja ja niitä mahdollisia uhkia, jotka koskevat nykyisiä vandalismintorjuntamenetelmiä. Vanhemmat tutkimukset, kuten New Page Patrol survey ja Patroller work load study käsittelivät englanninkielistä Wikipediaa. Nekin käsittelivät pelkästään muutostentarkastajien työmäärää ja erityisesti sitä, minkälainen vaikutus bottityökaluilla on siihen.

Tutkimukseemme pyrittiin ottamaan osallistujia viidestä wikistä, jotka olivat

  • Japaninkielinen Wikipedia
  • Hollanninkielinen Wikipedia
  • Saksankielinen Wikipedia
  • Kiinankielinen Wikipedia
  • Englanninkielinen Wikisitaatit

Kyseisten projektien valintaan vaikuttivat asenteet IP-muokkaamista kohtaan, IP-muokkausten osuus kaikista muokkauksista ja muut erityiset olosuhteet, jotka vaikuttavat IP-muokkaajiin (etenkin Pending Changes -toiminnon (seulonta) käyttö ja laajamittainen välityspalvelinten käyttö). Osallistujia haettiin avoimilla kutsuilla projektien kahvihuoneissa tai vastaavissa paikoissa. Kirjoitimme kutsut myös wikien Lähetystö-sivuille, jos se oli olemassa. Vaikka meillä oli apua itse haastattelujen kääntämisessä, me emme käyttäneet käännösapua kommentteihin, mikä saattoi alentaa vastausprosenttia. Kaikki haastattelut tehtiin Zoomissa, ja läsnä oli muistiinpanoja tekevä henkilö.

Aikaisempien tutkimusten tavoin me emme havainneet systemaattista tai yhtenäistä tapaa käyttää IP-informaatiota. Lisäksi tätä informaatiota haettiin vain sitten, kun tietty epäilykynnys oli ylittynyt. Useimmiten jatkotutkinnat epäilyttävästä käytöksestä alkavat wikissä olevalla julkisella informaatiolla, kuten tutkimalla käyttäjän aikasempia paikallisia muokkauksia, globaaleja muokkauksia tai estoja.

Tarkkuus ja virheettömyys olivat IP-informaation vähemmän tärkeitä ominaisuuksia: kun yksi IP-informaatiota antava sivu näytti samalle IP-osoitteelle kolme erilaista maantieteellistä sijaintia, yksi haastattelluista henkilöistä mainitsi, että sijainnin tarkkuus ei ole yhtä tärkeää kuin johdonmukaisuus. Toisin sanoen, kunhan IP-osoitteen kerrotaan johdonmukaisesti olevan samasta valtiosta, ei ole niin tärkeää onko se oikein tai tarkka. Tämä sopii siihen, miten me olemme ymmärtäneet IP-osoitteiden informaatiota käytettävän: osittain yksilöllisenä tietona, joka liittyy yhteen laitteeseen tai henkilöön, ja jota keskivertohenkilön on kohtuullisen vaikea väärentää. Käyttäjään liitetyn tiedon oikeellisuus tai tarkkuus on vähemmän tärkeää kuin se, että tieto on liitetty käyttäjään ja sitä on vaikeaa muuttaa.

Löysimme joitakin pääkohtia IP-info-työkalun suunnittelussa:

  • Tarjota raakadatasta nopeasti silmäiltävät johtopäätökset
  • Kattaa avainominaisuudet IP-informaatiosta:
    • Sijainti (kaupungin tai seudun tasolla, jos mahdollista)
    • Osoitteen rekisteröinyt organisaatio
    • Liittymätyyppi (paljon liikennettä, kuten datakeskus tai mobiiliverkko versus vähäinen liikenne, kuten asunnon laajakaista)
    • Onko osoite välityspalvelin vai ei

Eettisestä näkökulmasta katsoen on tärkeää pystyä selittämään johtopäätösten perusteet ja IP-informaation epätarkkuudet. Vaikka tämä ei ollutkaan iso huolenaihe niiden muutostentarkastajien keskuudessa, joiden kanssa keskustelimme, niin jos teemme ylläpitotoimenpiteitä avustavan työkalun, täytyy meidän ilmaista selvästi työkalun rajoitukset.

––
Ystävällisin terveisin,
Trust and Safety -tiimi

Voit keskustella tästä projektin keskustelusivulla. Jos sinulla on mitä tahansa kysyttävää tai asiaa aiheesta, voit jättää viestin keskustelusivulle tai ottaa yhteyttä henkilöön Szymon Grabarczuk.