Jump to content

Template:Model card ORES article quality/uk

From Meta, a Wikimedia project coordination wiki
Model card
This page is an on-wiki machine learning model card.
A diagram of a neural network
A model card is a document about a machine learning model that seeks to answer basic questions about the model.
Model Information Hub
Model creator(s)Aaron Halfaker (User:EpochFail) and Amir Sarabadani
Model owner(s)WMF Machine Learning Team (ml@wikimediafoundation.org)
Model interfaceOres homepage
CodeORES Github, ORES training data, and ORES model binaries
Uses PIINo
In production?Yes
Which projects?{{{language}}} {{{project}}}
Ця модель використовує 'дані про перегляд' для прогнозування 'переклодібності того, що стаття є певною en:WP:Content assessment


Мотивація

[edit]

Ця модель-карта описує модель для прогнозування якості статей Вікіпедії. Вона використовує структуріальні особливості, виведені з статті, щоб позначити стаття Вікіпедій з баллом ймовірності для кожного класу якості статті.

Статті Вікіпедії мають якість від багатих, добре ілюстрованих, повністю посиланених статей, які повністю охоплюють свою тему і легко читаються до однозначних речення, які визначають тему статті, але не пропонують набагато більше інформації. Це дуже корисно, щоб бути в змозі надійно розрізняти між цими екстремальними і різними етапами якості вдоль цього спектру. Редатори Вікіпедій розробили багаті рубрики для того, як оцінити якість статей Вікіпедії і постійно оцінають якість статті, щоб допомогти координувати роботу над вики. Редакти використовують ці якісні оцінки для оцінки і приоритетування своєї роботи. Дослідники використовують ці якісті оцінки для розуміння динаміки контенту. Розробники використовують ці якісничі оцінки як фільтри для створення систем рекомендацій або інших інструментів.

Вікіпедія постійно змінюється, що робить редакторам дуже важким (і в основному неможливим) для того, щоб зберігати ці оцінки якості повними і оновлені. Автоматична модель якості може допомогти заповнити ці пробеги шляхом оцінки якості статей, які не оцінюються або істотно змінилися з моменту їх останнього оцінювання.

Користувачі та використання

[edit]

{{Model card uses |model_uses= * аналізи на високому рівні тенденцій якості виробів

  • фільтрація / рангування статей в інструментах - наприклад, показують лише низьку якість статей в системі рекомендаторів
  • визначення потенційних шляхів поліпшення статей - наприклад, використання функції з найменшої вартості з моделі як рекомендації

|model_nonuses= * проекти за межами української Вікіпедії [[:en:Викіпедія:Назвапростора |model_current_uses= Ця модель є частиною ORES і загалом доступна через API. Вона використовується для аналізу високої рівня Вікіпедії, дослідження платформи та інших завдань на вики.

Example API call:

{{{model_input}}}

}}

Етичні міркування, попередження та рекомендації

[edit]
  • Витоки даних для цієї моделі є кілька років - дрейф даних може похилити поточні виходи відносно даних про навчання.
  • У даний час модель не враховує якості конкретного написання, тому довгий статтю з багатьма фальшивими словами буде зареєстровано як високої якості.
  • Різні вики мають різні схеми маркування - не використовуйте цю модель разом з іншими моделями для проведення аналізу міжвики.

Модель

[edit]

Виконавність

[edit]

Test data confusion matrix: {{{confusion_matrix}}}

Test data sample rates: {{{sample_rates}}}

Test data performance: {{{performance}}}

Виконання

[edit]
Model architecture
{{{model_architecture}}}
Output schema
{{{model_output_schema}}}
Example input and output
Input:
{{{model_input}}}

Output:

{{{model_output}}}

Дані

[edit]
Data pipeline
Лейбліки були зібрані з оцінки якості статті на вики, а потім поєднані з функціями перегляду для створення вихідного набору даних.
Training data
Дані поїзда були автоматично розділені від даних випробувань за допомогою функціоналу з ревскорингового сховища.
Test data
Отримання даних було автоматично і випадково розділено з даних поїзда за допомогою функціоналу з ревскоруючого репозиторію і зберігалося протягом процесу навчання.

Ліцензії

[edit]

Цитата

[edit]

Cite this model card as:

@misc{
  Triedman_Bazira_2023_{{{language}}}_{{{project}}}_article_quality,
  title={ {{{language}}} {{{project}}} article quality model card },
  author={ Triedman, Harold and Bazira, Kevin },
  year={ 2023 },
  url={ https://meta.wikimedia.org/wiki/Model_card_ORES_article_quality/uk }
}