Template:Model card ORES article topic/eu
Model card | |
---|---|
This page is an on-wiki machine learning model card. | |
Model Information Hub | |
Model creator(s) | Aaron Halfaker (User:EpochFail) and Amir Sarabadani |
Model owner(s) | WMF Machine Learning Team (ml@wikimediafoundation.org) |
Model interface | Ores homepage |
Code | ORES Github, ORES training data, and ORES model binaries |
Uses PII | No |
In production? | Yes |
Which projects? | {{{language}}} {{{project}}} |
Modelo honek artikuluaren testua erabiltzen du artikuluak gai multzo bati dagozkioen probabilitatea aurreikusteko. | |
Motivazioa
[edit]Nola aurresan dezakegu zer gai orokorretan dagoen artikulu bat? Galdera honi erantzutea erabilgarria da Wikipedia-ren dinamika aztertu ahal izateko. Hala ere, zaila da Wikipediako artikulu oso anitza eskuz gai koherente eta bateragarrietan taldeko.
Modelo hau, ORES-en ereduen multzoaren parte, artikulu bat aztertzen du gai multzo batera egokitzeko probabilitatea aurreikusteko. Modelo antzekoak (ez behintzat errendimendu maila edo gai berdinekin, beste hamaika proiektuetan ere erabiltzen dira.
Eredu hau baliagarria izan daiteke Wikipediaren dinamika maila altuko azterketetarako (orri-ikuspegiak, artikuluen kalitatea, editatu joerak) eta artikuluak iragazterako.
Erabiltzaileak eta erabilerak
[edit]- Wikipediaren dinamika maila altuko analisiak, hala nola orrialde ikuspegi, artikuluen kalitatea edo editatu joerak - adibidez, nola desberdintzen dira orrialde-ikuspegien dinamika fisikaren eta biologiaren kategorien artean?
- artikuluak filtratzea - adibidez, musika kategoriakoak soilik filtratzea.
- artikulu batek zein gaira duen behin betiko finkatzen
- artikuluak edo gaiak editatu automatikoa gizakiak ez dauden tokitan
Modelo hau ORES-en parte da, eta API bidez sar daiteke.
Example API call:{{{model_input}}}
Kontuan hartu beharrekoak, abisuak eta gomendioak
[edit]Modelo hau hainbat urteko datuetan oinarritzen da (2020ko erdialdetik aurrera). Modelo honek entrenamendu ezaugarri gisa erabiltzen du. Word2vec, beste hizkuntza natural batzuen antzera, azpi-datu multzoen aurkako alderdi linguistikoak kodetzen ditu - genero, arraza, etnia, erlijioa, etab. Wikipedia-k bere testuan aurkakoak ezagutzen dituenez, eredu honek aurkakoen aurkakoa kodetu eta batzuetan erreproduzitu dezake. Modelo honek oso erakusketak aldagarriak ditu gai desberdinetan.
Modelo bat
[edit]Errendimendua
[edit]Test data confusion matrix: {{{confusion_matrix}}}
Test data sample rates: {{{sample_rates}}}
Test data performance: {{{performance}}}
Erabateko bideratzea
[edit]{{{model_input}}}
Output:
{{{model_output}}}Datuak
[edit]Baimenak
[edit]- Code: MIT license
- Model: MIT license
Oharra
[edit]Cite this model card as:
@misc{
Triedman_Bazira_2023_{{{language}}}_{{{project}}}_article_topic,
title={ {{{language}}} {{{project}}} article topic model card },
author={ Triedman, Harold and Bazira, Kevin },
year={ 2023 },
url={ https://meta.wikimedia.org/wiki/Model_card_ORES_article_topic/eu }
}