GDJ 2009/Ocena jakości
Ocena jakości
[edit]Temat oceny jakości artykułów przewija się już od dłuższego czasu, ale jakoś końca nie widać. Na stronie pl:Wikipedia:Ocena jakości jest sześć propozycji, o których nikt nic nie mówi. Jest jeszcze moja propozycja (pl:Wikipedysta:Leafnode/Ocena jakości), aczkolwiek pokrywa się ona z propozycją szóstą z listy - zaproponowałem system znany z en.wiki, jako sprawdzony i funkcjonujący. Próbowałem zagaić temat w kawiarence, ale odpowiedzi brak. Przygotowałem ogólny opis stopni (pl:Szablon:Stopnie oceny jakości), szablony pomocnicze dla projektów (pl:Szablon:Wikiprojekt Astronautyka), podobnie dla oceny istotności (tutaj się zdublowaliśmy z Novą, ale o tym później), i nawet jest wykorzystywane w kilku projektach. Chciałbym jednak, żeby jakieś decyzje w tej kwestii zostały podjęte - albo w jedną, albo w drugą, bo tak jak wspomniałem, strona 'ocena jakości' straszy propozycjami od 2006 roku.
Co chciałbym osiągnąć:
- przyjęcie konkretnego schematu oceny artykułów
- ustalenie standardów wizualnych (np. szablonów oceny wstawianych do dyskusji - już teraz wygląda to różnie)
- wystosowanie prośby do wikiprojektów o stosowanie (wiadomo, że narzucić się nic nie da), czy przygotowanie jakiejkolwiek informacji
- zaplanowanie prac nad elementami technicznymi - np. javascript ułatwiający ocenę (dwa kliknięcia do oceny)
- przygotowanie tekstu wyjaśniającego po co to w ogóle (a jeśli ktoś czytając ten tekst też nie wie, to chętnym wytłumaczę na GDJ :) )
--Leafnode 09:00, 18 May 2009 (UTC)
Porównanie PL i EN
[edit]Podobnie jak dwa lata temu [1] - porównałem wynik losowania 100 artykułów z Wikipedii pl i en. Tym razem jako kryterium oceny przyjąłem system zaproponowany przez Leafnoda, pl:Wikipedysta:Leafnode/Ocena jakości - dodając jeszcze do niego dodatkową kategorię - artów bezwartościowych (mniej niż stub lub "niesformatowany bohomaz"). Skala ocen była taka: 1 - bezwartościowy, 2 - stub, 3 - start (coś więcej niż stub, ale jeszcze nie kompletny art), 4 - 4 w skali Leafnoda (czyli prawie DA - art kompletny ale bez znaczka), 5 (DA), 6 (więcej niż DA, ale jeszcze nie medal, czyli 5 w skali Leafnoda), 7 (medal). Oprócz tego liczyłem też liczbę linków, źródeł, długość tekstu (samego bez upiększeń), liczbę ilustracji i szablonów. Dane źródłowe w formie arkusza google: [2]
Wyniki sumaryczne:
Wartość | PL | EN |
---|---|---|
Średnia ocena | 2.64 | 2.5 |
Średnia długość (znaki) | 1800 | 3800 |
Liczba linków (na art) | 21 | 21 |
Ilustracje | 0.88 | 0.7 |
Bez ilustracji | 59% | 68% |
Szablony | 0.9 | 0.8 |
Źródła | 1.5 | 3 |
Bez źródeł | 55% | 23% |
Listy | 3 | 2 |
Disambigi[1] | 5 | 4 |
Botowe[2] | 26 | 19 |
Biografie | 12 | 30 |
POP[3] | 18 | 24 |
GEO[4] | 20 | 20 |
Czwórki | 11 | 15 |
Jedynki | 6 | 15 |
Jak widać jakość Wikipedii pl w porównaniu z poprzednim badaniem zbliżyła się nieco do jakości en. Z negatywów rzuca się wciąż mniejsza niemal o połowę średnia długość artykułów i znacznie gorsze uźródłowienie - w pl ponad 50% artów wciąż nie ma źródeł, podczas gdy w en tylko 23%. Jest tu jednak spory postęp, bo w 2007 tylko 15% artów miało jakiekolwiek źródła. Podobnie bardzo wzrósł stopień zilustrowania artykułów - w obu Wikipediach - w 2007 tylko 23% artów w en i 17% w PL miało choć jedną grafikę, obecnie te liczby to 68% i 59% - wciąż nieco lepiej w en. - ale w niewielkim już stopniu. Zrównoważeniu uległa proporcja w dziedzinach - nawet z lekką korzyścią dla PL - gdzie liczba artykułów z dziedziny "kultury popularnej" nie jest już tak nienaturalnie duża jak wciąż w en. Procent ubotowienia, czyli liczby artykułów stworzonych przez boty w stosunku do artykułów edytowanych "ręcznie" jest wciąż większy niż w en, ale już nie tak drastycznie - w poprzednim badania w pl było 36% artykułów czysto-botowych, teraz już tylko 26% Ciekawostką jest, że w en jest dużo więcej biografii niż u nas. Czy gorzej to czy lepiej - trudno ocenić. Ciekawe też, że średnia sumaryczna ocena obu Wikipedii wypada niemal identycznie - w okolicach 2.5 - czyli większość artykułów jest w obu przypadkach jakości między "stub" i "start" - a inne to raczej niezbyt często spotykane "rodzynki". Anglojęzyczna Wikipedia ma więcej artykułów na 4, ale też ma więcej na 1, co obniża jej średni wynik. W Pl art. typu "1" są chyba szybciej sprzątane.
Nt samego systemu Leafnoda: W losowanej próbce nie natrafiłem na żaden artykuł powyżej oceny "4" - w obu Wikipediach odsetek DA i medalowych jest po prostu tak znikomy, że prawdopodobieństwo wylosowania jednego w próbce 100 jest pomijalnie małe :-) Bardzo trudno jest czasem zdecydować, czy art jest już 3 czy jest może wciąż tylko 2. Podobne kłopoty są też przy ustaleniu granicy 3 i 4, które są mocno uznaniowe. Podobny problem będzie też pewnie z "5" - które DA uznać, za "5" a które nie? Kto by miał o tym decydować?
Polimerek 11:52, 26 August 2009 (UTC)
Zobacz też
[edit]To jeszcze dodam na wszelki wypadek :) Przykuta 12:36, 18 May 2009 (UTC)
- GDJ/Polska Wikipedia na tle innych wersji językowych. Ilość i jakość artykułów (stare)
- Wikiquality (chyba też stare)
- w:pl:Wikiprojekt:Ocena i poprawa jakości (ze stroną dyskusji - świeższe :))
Głosy w dyskusji (wybór)
[edit]- Tilia: O (brakach w) poprawności językowej Wikipedii i o jej roli edukacyjnej w tym zakresie - konieczność stosowania standardowej literackiej polszczyzny i stanowienia wzorca językowego dla użytkowników. Może jakaś burza mózgów - jak skutecznie działać w tej dziedzinie. Co autorzy i użytkownicy widzieliby jako sensowne działania w tym zakresie. Inicjatywy edukacyjno-prewencyjne itp.
- Julo: Przerost formy nad treścią: Inny przejaw tego przerostu, przejawiający się czasem w absurdalnym szpikowaniu haseł szablonami {{s:źródła}} i {{s:fakt}}. To jest kwestia generalnej strategii Wikipedii: czy chcemy udawać, że treści w Wikipedii - jeśli nie oznaczone takim szablonem - mają zawsze podparcie w wiarygodnych źródłach, czy nie, i czy poprawia naszą ogólną wiarygodność fakt, iż przybywa oznaczonych takimi szablonami haseł?
- Krzysiumed: Sięganie, zamiast do źródeł, do książek (lub stron internetowych, jakiegokolwiek innego źródła informacji), które napisano na podstawie innej książki, napisanej korzystając z innej książki, ..., i dopiero po kilku takich ogniwach mamy książkę napisaną na podstawie źródeł. To sprzyja powielaniu stereotypów, fałszowania historii - wystarczy, że chociaż w jednej książce z przedstawionego łańcuszka pojawiła się jakaś fałszywa informacja. Często też korzysta się ze stron internetowych, w których nie ma żadnego podpisu - to są w praktyce anonimowe źródła. Często też są to strony darmowych portali/gazet (onet, Metro). Moim zdaniem encyklopedia powinna korzystać z "prawdziwych" źródeł.