Ocena jakości

Temat oceny jakości artykułów przewija się już od dłuższego czasu, ale jakoś końca nie widać. Na stronie pl:Wikipedia:Ocena jakości jest sześć propozycji, o których nikt nic nie mówi. Jest jeszcze moja propozycja (pl:Wikipedysta:Leafnode/Ocena jakości), aczkolwiek pokrywa się ona z propozycją szóstą z listy - zaproponowałem system znany z en.wiki, jako sprawdzony i funkcjonujący. Próbowałem zagaić temat w kawiarence, ale odpowiedzi brak. Przygotowałem ogólny opis stopni (pl:Szablon:Stopnie oceny jakości), szablony pomocnicze dla projektów (pl:Szablon:Wikiprojekt Astronautyka), podobnie dla oceny istotności (tutaj się zdublowaliśmy z Novą, ale o tym później), i nawet jest wykorzystywane w kilku projektach. Chciałbym jednak, żeby jakieś decyzje w tej kwestii zostały podjęte - albo w jedną, albo w drugą, bo tak jak wspomniałem, strona 'ocena jakości' straszy propozycjami od 2006 roku.

Co chciałbym osiągnąć:

przyjęcie konkretnego schematu oceny artykułów
ustalenie standardów wizualnych (np. szablonów oceny wstawianych do dyskusji - już teraz wygląda to różnie)
wystosowanie prośby do wikiprojektów o stosowanie (wiadomo, że narzucić się nic nie da), czy przygotowanie jakiejkolwiek informacji
zaplanowanie prac nad elementami technicznymi - np. javascript ułatwiający ocenę (dwa kliknięcia do oceny)
przygotowanie tekstu wyjaśniającego po co to w ogóle (a jeśli ktoś czytając ten tekst też nie wie, to chętnym wytłumaczę na GDJ :) )

--Leafnode 09:00, 18 May 2009 (UTC)[reply]

Porównanie PL i EN

Podobnie jak dwa lata temu [1] - porównałem wynik losowania 100 artykułów z Wikipedii pl i en. Tym razem jako kryterium oceny przyjąłem system zaproponowany przez Leafnoda, pl:Wikipedysta:Leafnode/Ocena jakości - dodając jeszcze do niego dodatkową kategorię - artów bezwartościowych (mniej niż stub lub "niesformatowany bohomaz"). Skala ocen była taka: 1 - bezwartościowy, 2 - stub, 3 - start (coś więcej niż stub, ale jeszcze nie kompletny art), 4 - 4 w skali Leafnoda (czyli prawie DA - art kompletny ale bez znaczka), 5 (DA), 6 (więcej niż DA, ale jeszcze nie medal, czyli 5 w skali Leafnoda), 7 (medal). Oprócz tego liczyłem też liczbę linków, źródeł, długość tekstu (samego bez upiększeń), liczbę ilustracji i szablonów. Dane źródłowe w formie arkusza google: [2]

Wyniki sumaryczne:

Wartość	PL	EN
Średnia ocena	2.64	2.5
Średnia długość (znaki)	1800	3800
Liczba linków (na art)	21	21
Ilustracje	0.88	0.7
Bez ilustracji	59%	68%
Szablony	0.9	0.8
Źródła	1.5	3
Bez źródeł	55%	23%
Listy	3	2
Disambigi^[1]	5	4
Botowe^[2]	26	19
Biografie	12	30
POP^[3]	18	24
GEO^[4]	20	20
Czwórki	11	15
Jedynki	6	15

↑ Gdy natrafiłem na disambig, losowałem jeden z artykułów z niego
↑ Utworzone przez bota i nie tknięte "ludzką ręką"
↑ Artykuły dotyczące tzw. kultury popularnej - od gwiazdek porno - po gry komputerowe
↑ Artykuły geograficzne

Jak widać jakość Wikipedii pl w porównaniu z poprzednim badaniem zbliżyła się nieco do jakości en. Z negatywów rzuca się wciąż mniejsza niemal o połowę średnia długość artykułów i znacznie gorsze uźródłowienie - w pl ponad 50% artów wciąż nie ma źródeł, podczas gdy w en tylko 23%. Jest tu jednak spory postęp, bo w 2007 tylko 15% artów miało jakiekolwiek źródła. Podobnie bardzo wzrósł stopień zilustrowania artykułów - w obu Wikipediach - w 2007 tylko 23% artów w en i 17% w PL miało choć jedną grafikę, obecnie te liczby to 68% i 59% - wciąż nieco lepiej w en. - ale w niewielkim już stopniu. Zrównoważeniu uległa proporcja w dziedzinach - nawet z lekką korzyścią dla PL - gdzie liczba artykułów z dziedziny "kultury popularnej" nie jest już tak nienaturalnie duża jak wciąż w en. Procent ubotowienia, czyli liczby artykułów stworzonych przez boty w stosunku do artykułów edytowanych "ręcznie" jest wciąż większy niż w en, ale już nie tak drastycznie - w poprzednim badania w pl było 36% artykułów czysto-botowych, teraz już tylko 26% Ciekawostką jest, że w en jest dużo więcej biografii niż u nas. Czy gorzej to czy lepiej - trudno ocenić. Ciekawe też, że średnia sumaryczna ocena obu Wikipedii wypada niemal identycznie - w okolicach 2.5 - czyli większość artykułów jest w obu przypadkach jakości między "stub" i "start" - a inne to raczej niezbyt często spotykane "rodzynki". Anglojęzyczna Wikipedia ma więcej artykułów na 4, ale też ma więcej na 1, co obniża jej średni wynik. W Pl art. typu "1" są chyba szybciej sprzątane.

Nt samego systemu Leafnoda: W losowanej próbce nie natrafiłem na żaden artykuł powyżej oceny "4" - w obu Wikipediach odsetek DA i medalowych jest po prostu tak znikomy, że prawdopodobieństwo wylosowania jednego w próbce 100 jest pomijalnie małe :-) Bardzo trudno jest czasem zdecydować, czy art jest już 3 czy jest może wciąż tylko 2. Podobne kłopoty są też przy ustaleniu granicy 3 i 4, które są mocno uznaniowe. Podobny problem będzie też pewnie z "5" - które DA uznać, za "5" a które nie? Kto by miał o tym decydować?

Polimerek 11:52, 26 August 2009 (UTC)[reply]

Zobacz też

To jeszcze dodam na wszelki wypadek :) Przykuta 12:36, 18 May 2009 (UTC)[reply]

GDJ/Polska Wikipedia na tle innych wersji językowych. Ilość i jakość artykułów (stare)
Wikiquality (chyba też stare)
w:pl:Wikiprojekt:Ocena i poprawa jakości (ze stroną dyskusji - świeższe :))

Głosy w dyskusji (wybór)

Tilia: O (brakach w) poprawności językowej Wikipedii i o jej roli edukacyjnej w tym zakresie - konieczność stosowania standardowej literackiej polszczyzny i stanowienia wzorca językowego dla użytkowników. Może jakaś burza mózgów - jak skutecznie działać w tej dziedzinie. Co autorzy i użytkownicy widzieliby jako sensowne działania w tym zakresie. Inicjatywy edukacyjno-prewencyjne itp.

Julo: Przerost formy nad treścią: Inny przejaw tego przerostu, przejawiający się czasem w absurdalnym szpikowaniu haseł szablonami {{s:źródła}} i {{s:fakt}}. To jest kwestia generalnej strategii Wikipedii: czy chcemy udawać, że treści w Wikipedii - jeśli nie oznaczone takim szablonem - mają zawsze podparcie w wiarygodnych źródłach, czy nie, i czy poprawia naszą ogólną wiarygodność fakt, iż przybywa oznaczonych takimi szablonami haseł?

Krzysiumed: Sięganie, zamiast do źródeł, do książek (lub stron internetowych, jakiegokolwiek innego źródła informacji), które napisano na podstawie innej książki, napisanej korzystając z innej książki, ..., i dopiero po kilku takich ogniwach mamy książkę napisaną na podstawie źródeł. To sprzyja powielaniu stereotypów, fałszowania historii - wystarczy, że chociaż w jednej książce z przedstawionego łańcuszka pojawiła się jakaś fałszywa informacja. Często też korzysta się ze stron internetowych, w których nie ma żadnego podpisu - to są w praktyce anonimowe źródła. Często też są to strony darmowych portali/gazet (onet, Metro). Moim zdaniem encyklopedia powinna korzystać z "prawdziwych" źródeł.

[1] Gdy natrafiłem na disambig, losowałem jeden z artykułów z niego

[2] Utworzone przez bota i nie tknięte "ludzką ręką"

[3] Artykuły dotyczące tzw. kultury popularnej - od gwiazdek porno - po gry komputerowe

[4] Artykuły geograficzne

[1]

[2]

[3]

[4]