Jump to content

Template:Model card ORES article topic/eu

From Meta, a Wikimedia project coordination wiki
Model card
This page is an on-wiki machine learning model card.
A diagram of a neural network
A model card is a document about a machine learning model that seeks to answer basic questions about the model.
Model Information Hub
Model creator(s)Aaron Halfaker (User:EpochFail) and Amir Sarabadani
Model owner(s)WMF Machine Learning Team (ml@wikimediafoundation.org)
Model interfaceOres homepage
CodeORES Github, ORES training data, and ORES model binaries
Uses PIINo
In production?Yes
Which projects?{{{language}}} {{{project}}}
Modelo honek artikuluaren testua erabiltzen du artikuluak gai multzo bati dagozkioen probabilitatea aurreikusteko.


Motivazioa

[edit]

Nola aurresan dezakegu zer gai orokorretan dagoen artikulu bat? Galdera honi erantzutea erabilgarria da Wikipedia-ren dinamika aztertu ahal izateko. Hala ere, zaila da Wikipediako artikulu oso anitza eskuz gai koherente eta bateragarrietan taldeko.

Modelo hau, ORES-en ereduen multzoaren parte, artikulu bat aztertzen du gai multzo batera egokitzeko probabilitatea aurreikusteko. Modelo antzekoak (ez behintzat errendimendu maila edo gai berdinekin, beste hamaika proiektuetan ere erabiltzen dira.

Eredu hau baliagarria izan daiteke Wikipediaren dinamika maila altuko azterketetarako (orri-ikuspegiak, artikuluen kalitatea, editatu joerak) eta artikuluak iragazterako.

Erabiltzaileak eta erabilerak

[edit]
Use this model for
  • Wikipediaren dinamika maila altuko analisiak, hala nola orrialde ikuspegi, artikuluen kalitatea edo editatu joerak - adibidez, nola desberdintzen dira orrialde-ikuspegien dinamika fisikaren eta biologiaren kategorien artean?
  • artikuluak filtratzea - adibidez, musika kategoriakoak soilik filtratzea.
Don't use this model for
  • artikulu batek zein gaira duen behin betiko finkatzen
  • artikuluak edo gaiak editatu automatikoa gizakiak ez dauden tokitan
Current uses

Modelo hau ORES-en parte da, eta API bidez sar daiteke.

Example API call:
{{{model_input}}}

Kontuan hartu beharrekoak, abisuak eta gomendioak

[edit]

Modelo hau hainbat urteko datuetan oinarritzen da (2020ko erdialdetik aurrera). Modelo honek entrenamendu ezaugarri gisa erabiltzen du. Word2vec, beste hizkuntza natural batzuen antzera, azpi-datu multzoen aurkako alderdi linguistikoak kodetzen ditu - genero, arraza, etnia, erlijioa, etab. Wikipedia-k bere testuan aurkakoak ezagutzen dituenez, eredu honek aurkakoen aurkakoa kodetu eta batzuetan erreproduzitu dezake. Modelo honek oso erakusketak aldagarriak ditu gai desberdinetan.

Modelo bat

[edit]

Errendimendua

[edit]

Test data confusion matrix: {{{confusion_matrix}}}

Test data sample rates: {{{sample_rates}}}

Test data performance: {{{performance}}}

Erabateko bideratzea

[edit]
Model architecture
{{{model_architecture}}}
Output schema
{{{model_output_schema}}}
Example input and output
Input:
{{{model_input}}}

Output:

{{{model_output}}}

Datuak

[edit]
Data pipeline
Prestatzeko datuak berrikuspen-ID multzo batetik jaso ziren. Gero berrikuspenaz informazio zatiak atera zituzten prozesu automatikoak erabiliz, eta berrikusketa testua word2vec-en sartu zen artikulu bat txertatzeko.
Training data
Prestakuntza-datuak automatikoki eta ausaz banatu ziren prestakuntza-prozesuan zehar, drafttopic git repositorio erabiliz (zerk prestatzen dituen bai drafttopic-a eta bai articletopic-eko ereduak).
Test data
Test datuak automatikoki eta ausaz banatu ziren tren datuetatik drafttopic git repository (zerk bai ereduak prestatzen dituen) ereduak aurreikuspen bat egiten du datu horien gainean, eta lurreko egia azpian dagoenarekin konparatzen da errendimenduaren estatistikak kalkulatzeko.

Baimenak

[edit]

Oharra

[edit]

Cite this model card as:

@misc{
  Triedman_Bazira_2023_{{{language}}}_{{{project}}}_article_topic,
  title={ {{{language}}} {{{project}}} article topic model card },
  author={ Triedman, Harold and Bazira, Kevin },
  year={ 2023 },
  url={ https://meta.wikimedia.org/wiki/Model_card_ORES_article_topic/eu }
}