Jump to content

Template:Model card ORES article quality/tr

From Meta, a Wikimedia project coordination wiki
Model card
This page is an on-wiki machine learning model card.
A diagram of a neural network
A model card is a document about a machine learning model that seeks to answer basic questions about the model.
Model Information Hub
Model creator(s)Aaron Halfaker (User:EpochFail) and Amir Sarabadani
Model owner(s)WMF Machine Learning Team (ml@wikimediafoundation.org)
Model interfaceOres homepage
CodeORES Github, ORES training data, and ORES model binaries
Uses PIINo
In production?Yes
Which projects?{{{language}}} {{{project}}}
Bu model, bir inceleme hakkında veriler kullanarak sözün belirli bir değerlendirme olasılığını tahmin eder


Motivasyon

[edit]

Bu model kartı, Wikipedia makalelerinin kalitesini tahmin etmek için bir model tanımlar. Bu, makaleden çıkarılan yapısal özellikleri kullanarak her makale kalitesinin bir olasılık puanı ile Wikipedia makaleleri etiketlemektedir.

Wikipedia makaleleri, kalitesiyle zengin, iyi resimli, tamamen referanslı makalelere kadar, konuları tamamen kapsar ve makale konusunu tanımlayan ama daha fazla bilgi sunmayan tek cümlelik birimlere kadar kolay okunabilir. Bu aşırılıkları ve bu spektrum boyunca kalite aşamaları arasında güvenilir bir şekilde ayırt edebilmek çok yararlıdır. Wikipedia editörleri, Wikipedia makalelerinin kalitesini nasıl değerlendirecekleri için zengin rubrikalar geliştirdiler ve wikis üzerinde çalışmaları koordine etmede yardımcı olmak için sürekli olarak makale kalitesini değerlendiriyorlar. Editörler bu kalite puanlarını çalışmalarını değerlendirmek ve önceliklendirmek için kullanırlar. Araştırmacılar bu kalite puanları içeriğin dinamiklerini anlamak için kullanırlar . Geliştiriciler bu kalite puanlarınızı filtre olarak kullanırlar.

Wikipedia her zaman değişiyor, bu da editörlerin bu kalite değerlendirmelerini tamamlı ve güncel tutmasını zaman alıcı (ve büyük ölçüde imkansız) hale getirir. Otomatik bir kalite modeli, son değerlendirilmesinden bu yana değerlendirilmemiş veya önemli ölçüde değişen makalelerin kalitesini değerlendirerek bu boşlukları doldurmaya yardımcı olabilir. Bunu yaparken, araştırmacılara ve araç geliştiricilerine daha tutarlı veriler sağlayabilir ve hatta editörlere insan değerlendirmesinden yararlanacak makaleleri tanımlamasına yardımcı olabilir.

Kullanıcılar ve kullanımlar

[edit]
Use this model for
  • ürün kalitesi eğilimlerinin yüksek düzeyde analizleri
  • araçlarda yazıları filtreleme / sıralama - örneğin sadece aşağı kalitede yazıları bir tavsiye sistemi gösterir
  • makaleleri geliştirmenin olası yollarını belirlemek - örneğin modelden en düşük değerli özelliği önerme olarak kullanmak
Don't use this model for
  • Türk Wikipedia dışında projeler
  • Wikipedia:Namespace
Current uses

Bu model ORES'in bir parçasıdır ve API üzerinden genel olarak erişilebilir.

Example API call:
{{{model_input}}}

Etik değerlendirmeler, uyarılar ve öneriler

[edit]
  • Bu model için kaynak verileri birkaç yıl eski - veriler sürüklenmesi mevcut verileri eğitim verilerine göre çarpıtır.
  • Modeldeki yazının kalitesi şu anda dikkate alınmıyor, bu nedenle birçok sahte kelimeyle uzun bir makale yüksek kaliteli olarak kaydedilebilir.
  • Farklı wiki'ler farklı etiketleme sistemlerine sahiptir - bu modeli diğer modellerle birlikte wiki araları analizi yapmak için kullanmayın.

Model

[edit]

Performans

[edit]

Test data confusion matrix: {{{confusion_matrix}}}

Test data sample rates: {{{sample_rates}}}

Test data performance: {{{performance}}}

Uygulama

[edit]
Model architecture
{{{model_architecture}}}
Output schema
{{{model_output_schema}}}
Example input and output
Input:
{{{model_input}}}

Output:

{{{model_output}}}

Veriler

[edit]
Data pipeline
Etiketler, makale kalitesinin on-wiki değerlendirmelerinden toplandı ve ardından kaynak veriler kümesi oluşturmak için gözden geçirme özellikleriyle birleştirildi.
Training data
Tren verileri, revscoring deposu fonksiyonunu kullanarak otomatik olarak test verilerinden ayrıldı.
Test data
Test verileri, tren verilerinden otomatik ve rastgele olarak, revscoring deposu işlevselliği kullanarak ayrıldı ve eğitim süreci boyunca tutuldu.

Lisanslar

[edit]

İfadeler

[edit]

Cite this model card as:

@misc{
  Triedman_Bazira_2023_{{{language}}}_{{{project}}}_article_quality,
  title={ {{{language}}} {{{project}}} article quality model card },
  author={ Triedman, Harold and Bazira, Kevin },
  year={ 2023 },
  url={ https://meta.wikimedia.org/wiki/Model_card_ORES_article_quality/tr }
}