Jump to content

Template:Model card ORES article quality/gl

From Meta, a Wikimedia project coordination wiki
Model card
This page is an on-wiki machine learning model card.
A diagram of a neural network
A model card is a document about a machine learning model that seeks to answer basic questions about the model.
Model Information Hub
Model creator(s)Aaron Halfaker (User:EpochFail) and Amir Sarabadani
Model owner(s)WMF Machine Learning Team (ml@wikimediafoundation.org)
Model interfaceOres homepage
CodeORES Github, ORES training data, and ORES model binaries
Uses PIINo
In production?Yes
Which projects?{{{language}}} {{{project}}}
Este modelo usa datos sobre unha revisión para predecir a probabilidade de que o artigo sexa dunha certa pt:WP:Content assessment


Motivación

[edit]

Esta tarxeta modelo describe un modelo para predicir a calidade dos artigos da Wikipedia.

Os artigos da Wikipedia van desde artigos ricos, ben ilustrados, con referencias completas que cubren completamente o seu tema e son fáciles de ler ata estampas de frase única que definen o tema do artigo, pero non ofrecen moita máis información. É moi útil poder distinguir con fiabilidade entre estes extremos e as diversas etapas de calidade ao longo deste espectro. Os editores da Wikipedia desenvolveron rúbricas ricas para avaliar a calidade dos artigos da Wikipedia e están constantemente avaliando a calidade do artigo para axudar a coordinar o traballo nas wikis. Os editors usan estas puntuacións de calidade para avaliar e priorizar o seu traballo. Os investigadores usan estas puntuares de calidade para comprender a dinámica do contido. Os desenvolvedores utilizan estas puntuación de calidade como filtros ao crear sistemas de recomendación ou outras ferramentas.

Wikipedia está sempre cambiando, o que fai que sexa lento (e en gran parte imposible) para os editores manter estas avaliacións de calidade completas e actualizadas. Un modelo de calidade automático pode axudar a coller estes vacíos avaliando a calidade de artigos que non se avaliaron ou que cambiaron substancialmente desde a última vez que se avaliaron.

Utilizadores e usos

[edit]
Use this model for
  • Análises de alto nivel das tendencias da calidade dos artigos
  • filtración / clasificación de artigos en ferramentas - por exemplo, só mostrar artigos de baixa calidade nun sistema de recomendación
  • identificar posibles formas de mellorar os artigos - por exemplo, utilizando como recomendación a característica de menor valor do modelo
Don't use this model for
  • proxectos fóra da Wikipedia galega
en:Wikipedia:Namespace
Current uses

Este modelo é parte de ORES e é xeralmente accesible a través da API.

Example API call:
{{{model_input}}}

Consideracións éticas, advertencias e recomendacións

[edit]
  • Os datos de orixe deste modelo teñen varios anos de idade - a deriva de datos pode distorsionar os resultados actuais en relación cos datos de formación.

O modelo non ten actualmente en conta a calidade da escrita específica, polo que un artigo longo con moitas palabras falsas rexistraría unha alta calidade.

  • Diferentes wikis teñen diferentes esquemas de etiquetado - non use este modelo en conxunto con outros modelos para realizar un análisis interwiki.

Modelo

[edit]

Performance

[edit]

Test data confusion matrix: {{{confusion_matrix}}}

Test data sample rates: {{{sample_rates}}}

Test data performance: {{{performance}}}

Implementación

[edit]
Model architecture
{{{model_architecture}}}
Output schema
{{{model_output_schema}}}
Example input and output
Input:
{{{model_input}}}

Output:

{{{model_output}}}

Datos

[edit]
Data pipeline
As etiquetas foron recollidas a partir de xuízos sobre a calidade do artigo en wiki, e despois unidas a características de revisión para crear un conxunto de datos fonte.
Training data
Os datos do tren separáronse automaticamente dos datos de ensaio utilizando a funcionalidade do repositorio de revscoring.
Test data
Os datos de proba foron automaticamente e aleatoriamente separados dos datos do tren usando a funcionalidade do repositorio de revscoring e mantidos durante o proceso de adestramento.

Licencias

[edit]

Citado

[edit]

Cite this model card as:

@misc{
  Triedman_Bazira_2023_{{{language}}}_{{{project}}}_article_quality,
  title={ {{{language}}} {{{project}}} article quality model card },
  author={ Triedman, Harold and Bazira, Kevin },
  year={ 2023 },
  url={ https://meta.wikimedia.org/wiki/Model_card_ORES_article_quality/gl }
}