Jump to content

Research:Revision scoring as a service/Engagement with Azerbaijani community

From Meta, a Wikimedia project coordination wiki

Overview of the introduction discussion

[edit]
  • ORES Project was briefly introduced to the community.
    • Explanation of the objective and scope of ORES.
    • Brief explanation of the technical aspects of ORES.
    • Explanation of the intended long term goals of ORES to include more languages through a generalised approach.
    • Explanation on why ORES would have improved results by utilising the resources of existing tools (ClueBot NG, Huggle & STiki).
  • Community suggestions, requests and consensus
    • We were asked what kind of assistance we need.
      • Need of data annotation (to create a training corpus) was explained.
      • Need of a stemmer was explained. Suggested the use of a Turkish stemmer as a template for the community to work on.

Hörmətli dostlar,

Vikipedi’nin en kuvvetli araçları değişiklik kalitesini belirlemek için makine sınıflandırmasından (tr:Makine öğrenimi) faydalanırlar. Maalesef bunların çok azı oluşturdukları değerlendirmelerinin kullanılmasını sağlayacak kamuya açık bir UPA/API yayınlamaktalar – ve genellikle bunlar genelde sadece İngilizce Vikipedi’de çalıştırılıyor. Bu projede biz değişilşikler için makine sınıflandırma değerlendirmelerini sağlayacak kamuca sorgulanabilir bir UPA geliştireceğiz. Bizim inancımız bu gibi bir servisin sağlamakla güçlü yeni araçların yaratılmasını ve olan araçların geliştirilmesini kolaylaştıracağız.

Bunun için Wikimedia sponsorluğunda Meta:servis olarak değişiklik değerlendirme başlığında bir araştırma yürütmekteyiz. Projemizin önemli hedeflerinden birisi İngilizce Vikipedide çalışan User:ClueBot NG, Huggle ve STiki gibi araçların değerlendirmelerini kendi geliştirdiğimiz sistemde birleştirmek ve kendi makine sınıflandırma ile vardığımız değerlerlendirmeler ile bu araçların değerlendirmelerinin bileşkesi ile daha doğru sonuçlara ulaşmak. Geliştirdiğimiz bu sonucun öncelikle Azerice, Portekizce ve Türkçe Vikipedilerde uygulamayı ve kullanıma açmayı hedeflemekteyiz. Daha ilerisinde geliştirdiğimiz sistemi diğer dillere de uygulamayı ve kullanıma açmayı hedefliyoruz.

Biz makine sınıflandırılasında gözetimli öğrenme (en:Supervised learning) kullanıyoruz ve bunun için sistemin belli miktar verinin insanlarca/elle tasnifi gerekiyor. Sistemimizi Azerice Vikipedi’ye uyarlayabilmemiz için yardımınıza ihtiyacımız var. Soru ve görüşlerinize açığız.

-- とある白い猫 chi? 18:09, 23 dekabr 2014 (UTC)

Merhaba. Ne gibi yardıma ihtiyacınız var? Elle tasnifine ihtiyaç olan veriler hangisidir? Daha detaylı anlatırsanız, belki yardım etmek isteyenlerde çok olur.--Wertuose (talk) 19:31, 26 dekabr 2014 (UTC)
İki konuda yardıma ihtiyacımız var.
  • Birincisi, projede toollabs:wikidata-game gibi bir oyunlaştırma (en:Gamification) düşünüyoruz. Bütün katılımcılardan toplamda 1000-1500 adet elle girdi bize önemli bir aşama kat ettiriş olacak. Girdi sayısı arttıkça oyunu kendi kendini geliştiren bir döngü ile daha anlamlı öneriler sunmaya başlayacak.
  • İkincisi, Azerice için bir :en:Stemmer ihtiyacımız var. Kullanıma uygun stemmer biliyor musunuz? Yoksa Azeri Vikipediya topluluğu bir stemmer oluşturabilir mi? Biz teknik destek sağlasakta Azerice anadili olanların yardımına ihtiyacımız var. Türkçe Stemmer (kod) bir başlangıç olarak düşünülebilir fakat Türkçe stemmer ile Azerice stemmer arasında önemli farklar olacaktır.
-- とある白い猫 chi? 14:39, 31 dekabr 2014 (UTC)