Jump to content

Template:Model card ORES damaging edit/he

From Meta, a Wikimedia project coordination wiki
Model card
This page is an on-wiki machine learning model card.
A diagram of a neural network
A model card is a document about a machine learning model that seeks to answer basic questions about the model.
Model Information Hub
Model creator(s)Aaron Halfaker (User:EpochFail) and Amir Sarabadani
Model owner(s)WMF Machine Learning Team (ml@wikimediafoundation.org)
Model interfaceOres homepage
CodeORES Github, ORES training data, and ORES model binaries
Uses PIINo
In production?Yes
Which projects?{{{language}}} {{{project}}}
מודל זה משתמש בנתונים על תיקון כדי לחזות את הסיכוי שהתיקון מזיק


מניע

[edit]

כמה תיקונים בכוונה מזיקים למאמר, ולא כל תיקונים מזיקים הם בכוונה רעה. מודל זה (בצורה עם מודל בכוונה) נועד להבדיל בין תיקונים שפוגעים בכוונה (כדונה רעה/נפלה) לבין תיקונים שנועדו להיות מזיקים (תקונים טובים/נפילה רעה).

מודל זה מסייע להעדפת העדיפויות של ביקורת של עריכות פוטנציאליות מזיקות או פשעים. הוא מספק תחזית על אם ביקורת נתונה מזיקת או לא, ומספק כמה סבירות לשמש כמדד של רמת האמון שלה.

משתמשים ושימוש

[edit]
Use this model for
  • מודל זה צריך לשמש כדי להעדפות את הביקורת והההפוך הפוטנציאלי של הפגיעה בוויקיפדיה העברית.
  • מודל זה צריך לשמש כדי לזהות תרומות מזיקות על ידי עורכים בוויקיפדיה העברית.
Don't use this model for
  • מודל זה לא צריך להיות משפטן סופי של אם שינוי צריך או לא להיחשב מזיק.
  • המודל לא צריך לשמש מחוץ לוויקיפדיה העברית.
Current uses
  • ויקיפדיה העברית משתמשת במודל כשרת להקל על מינוי פושע יעיל, עריכה של ביקורות או תמיכה חדשה.
  • על בסיס אינדיבידואלי, כל אחד יכול להגיש בקשה API פורמטת כראוי ל-ORES עבור תיקון נתון ולחזור לתוצאה של המודל הזה.
Example API call:
{{{model_input}}}

שיקולים, אזהרות וסיפורים אתיים

[edit]

ויקיפדיה העברית החליטה להשתמש במודל זה. עם הזמן, המודל הוכשר באמצעות שימוש בקהילה.

מודל זה ידוע לתת עורכים חדשים יותר סבירות גבוהה יותר של תיקונים מזיקים.

שינויים פנימיים או חיצוניים שיכולים להפוך את המודל הזה לשווא או לא שימושי יותר הם:

  • דריף נתונים פירושו נתונים אימונים למודל כבר לא ניתן להשתמש.
  • לא עונה למתרי ביצועים הרצויים בתפקוד.
  • קהילת ויקיפדיה העברית מחליטה לא להשתמש במודל הזה יותר.

דגם

[edit]

ביצועים

[edit]

Test data confusion matrix: {{{confusion_matrix}}}

Test data sample rates: {{{sample_rates}}}

Test data performance: {{{performance}}}

יישום

[edit]
Model architecture
{{{model_architecture}}}
Output schema
{{{model_output_schema}}}
Example input and output
Input:
{{{model_input}}}

Output:

{{{model_output}}}

נתונים

[edit]
Data pipeline
נתונים טבולריים על תיקונים נאספים מ-Mediawiki API, מעובדים מראש (דרך שינויים בלוג, חיבור עם נתונים של עורכים ציבוריים, וכו') ומושלבים עם תוויות טובות/נזקים שנוצרו על ידי המשתמש.
Training data
מודל זה הוכשר באמצעות נתונים אימונים ידניים שמותגים שיש להם שנים רבות.
Test data
הסטטיסטיקה שהוצגה כאן נחשדה על ידי בחירת חלוקה אקראית של נתוני הכשרה כדי לעמוד בתהליך הכשרה. המודל עושה אז תחזית על נתונים אלה, אשר נשווה לאמת הקרקע הבסיסית.

רישיונות

[edit]

ציטוט

[edit]

Cite this model card as:

@misc{
  Triedman_Bazira_2023_{{{language}}}_{{{project}}}_damaging,
  title={ {{{language}}} {{{project}}} damaging model card },
  author={ Triedman, Harold and Bazira, Kevin },
  year={ 2023 },
  url={ https://meta.wikimedia.org/wiki/Model_card_ORES_damaging_edit/he }
}