Jump to content

Mix'n'match/Manuel

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Mix'n'match/Manual and the translation is 47% complete.
Outdated translations are marked like this.

Mix'n'match est un outil développé par Magnus Manske qui contient diverses listes de thématiques provenant de sources externes. Il vous autorise à faire des correspondances avec des entrées Wikidata permettant ainsi d'identifier celles qui existent déjà sur Wikidata et celles qui n'ont pas d'éléments. "think of a red-link list on steroids".

Mix'n'match comprend actuellement plus de 2 500 catalogues, comme le Oxford Dictionary of National Biography (terminé), le Australian Dictionary of Biography (terminé), et le National Portrait Gallery's catalogue (52,5 % d'identifiants réconciliés).

De cette manière, il sera facile de voir quels éléments manquent dans une Wikipédia particulière, ou quelle langue a la meilleure couverture d'un sujet particulier.

Comment ça marche ?

Mix'n'match possède 5 catégories d'éléments :

Exemple de statistiques de l'un des catalogues.
  1. Associations validées (anciennement correspondance manuelle) : un utilisateur a établi la correspondance entre une entrée du catalogue et un élément Wikidata (en incluant les éléments importés d'une Wikipédia) ;
  2. Préassociées (anciennement correspondance automatique) : le système a deviné une ou plusieurs correspondances possibles pour une entrée dans Wikidata, mais un humain doit la vérifier ou la rejeter ;
  3. Pas sur Wikidata : Cette entrée est connue pour n'avoir aucune correspondante ;
  4. Pas applicable à Wikidata (N/A) : cette entrée a été marquée comme non pertinente sur Wikidata (par exemple, si c'est un doublon, une entrée for example, it is a duplicate, c'est une wikt:fr:marque substitutive, une redirection, ou simplement un sujet non approprié) ;
  5. Correspondance inconnue : cette entrée n'a pas encore été examinée en détail, et il n'y a pas de candidats trouvé automatiquement.

L'objectif étant, bien entendu, de marquer autant d'entrées que possible avec une correspondances manuelle. (ou de confirmer qu'il n'y a pas de candidats dans Wikidata). Pour utiliser l'outil, vous devez créer un compte sur l'un des projets Wikimédia si vous n'en avez, et autoriser l'outil WiDaR.

Lorsque vous ouvrez Mix'n'match, une liste de catalogues est affichée (vous pouvez également sélectionner un catalogue spécifique). Vous pouvez alors :

  • Recherchez un nom spécifique à l'aide de la zone de recherche dans la barre d'en-tête. Cela vous mènera à une page de résultats de recherche.
    • Voir aussi le « mode liste » plus bas pour savoir comment utiliser la liste de résultats.
    • Dans la page des résultats de recherche, vous pouvez également limiter la recherche à un catalogue spécifique.
    • Vous pouvez également rechercher un Qid; cela renverra toutes les entrées auxquelles l'élément est associé. La recherche d'identifiant externe n'est pas prise en charge.
    • Il n'est pas garanti que la page des résultats de recherche contient toutes les entrées correspondant à un nom spécifique; en particulier, la liste peut être tronquée si les résultats sont trop nombreux.
  • Sélectionnez un catalogue spécifique, puis allez à une page de catalogue.

In a catalog page, you will see the number of entries in each category, and the history of number of matches. Clicking a specific category brings you to the List mode. You will also see an "Action" menu, including the following:

  • Fully matched, Preliminarily matched, Unmatched, No Wikidata, Not applicable to Wikidata – links to List mode for all entries in this specific category.
  • Multiple matches – links to List mode for all preliminarily matched entries with multiple automatically-suggested matches.
  • Site stats
  • Download
  • Match mode - see below.
  • Recent Changes in this catalog
  • Aliases
  • Jobs
  • Search only in this catalog
  • Names in other catalogs
  • Manually sync catalog
  • Catalog editor
  • Mobile matching
  • Visual tool
  • Find images
  • Changes last week
  • Catalog report

Mode Semi-automatique (Game mode)

Un exemple du mode jeu.

Si vous choisissez le mode semi-automatique, l'identifiant du catalogue, son titre et une éventuelle description minimale apparaissent en haut. Ceci devrait vous aidez à comprendre ce dont il s'agit.

Au-dessous vous sont présentés quatre choix :

  • Set Q (bouton bleu) : si vous avez identifié quel élément Wikidata correspond à l'entrée du catalogue, vous pouvez coller le numéro Q dans la boîte[1].
  • No wikidata entry (bouton orange) : si vous êtes confiant dans le fait que l'élément Wikidata ne correspond pas.
  • N/A (bouton rouge) : pour les cas où il n'y aura jamais d'élément Wikidata approprié à cette entrée.
  • Skip (bouton gris) : en cas de doute ou d'incertitude, passe simplement à l'élément suivant.

In case of doubt or uncertainty, or there is no matching Wikidata item but you do not want to create an item immediately, you may skip this go to the next element by clicking "Next entry".

If the entry is preliminarily matched, you have two choices:

  • Confirmed (green button): Confirms that the proposed entry is correct.
  • Remove (red button): Confirm that the proposed entry is incorrect. The entry will then become unmatched and may be matched to another (potentially new) item.

If there are multiple automatically-suggested matches, only the first of them is shown, and will be used if "Confirmed" is clicked. You may browse or select other matches using the link to the right of the entry name.

Plus bas figurent des liens suggérés provenant de en.wikipedia, avec un lien vers l'élément sur Wikidata. Dans le cas où l'élément correct serait présent ici, vous pouvez simplement cliquer sur le lien à droite (par exemple « Q384941 ») et cela enregistrera la correspondance. Si l'élément correct ne figure pas parmi les suggestions, vous avez toujours une chance de rechercher via Google sur toutes les versions de Wikipedia, Wikisource ou Wikidata.

Lorsque vous faites une connexion entre une entrée de catalogue et un élément Wikidata, le système mettra automatiquement à jour Wikidata. Cela sera affiché comme une modification dans vos contributions.

(Veuillez noter que quelques entrées sur Mix'n'match peuvent ne pas avoir de propriété déjà réglée - si vous travaillez sur l'une d'elles, la correspondance sera enregistrée et mise à jour plus tard, si approprié)

Mode liste

Un exemple du mode manuel.

Une liste des entrées sera affichée lorsque :

  • You click a specific category (e.g. "Unmatched") in a catalog page - all entries in this category will be shown with fifty entries per page.
  • You browse a search result page.

Formerly it is known as manual mode and it may show fifty entries among all categories; this option was removed.

On the first line of the list, you will see the name and (where available) the description of the entry. Each card will also show the status of the entities.

Éléments qui doivent être vérifiés manuellement (en rouge)

Pour les éléments avec aucune suggestion, la seconde ligne présente différents liens qui vous permettent de réaliser une recherche automatique sur Wikipédia, Wikidata ou Google (en limitant les résultats uniquement à Wikipédia ou Wikidata), ou même de créer l'élément. Dans la colonne de droite, vous avez trois choix :

  1. Set Q (lien vers) : cliquer ici affiche une boîte de dialogue dans laquelle vous pouvez saisir le numéro de l'élément Wikidata (avec ou sans le Q avant le numéro).
  2. New item (lien rouge) : cliquer ici va créer un nouvel élément Wikidata pour cette entrée, qui récupérera automatiquement libellé, description (si présente) et identifiant depuis le catalogue.
  3. N/A (lien jaune) : cliquer ici confirme que l'entrée ne devrait pas exister sur Wikidata, et qu'elle peut être rejetée.

Dans ces trois cas, une fois que vous avez fait votre choix, la couleur changer de rouge à vert. Si vous avez fourni un numéro d'élément Wikidata, le système mettra automatiquement à jour l'entrée Wikidata en utilisant WiDaR, comme dans le mode jeu.

Éléments combinés automatiquement (lilac)

Pour les éléments avec une correspondante automatiquement suggérées, la seconde ligne disposera d'un lien vers Wikidata associé à un résumé auto-généré de l'entrée Wikidata. Dans la colonne de droite, vous aurez trois choix :

  1. Confirm (lien vert) : confirme que la proposition est correcte.
  1. Remove (lien rouge) : confirme que l'entrée n'existe pas sur Wikidata (mais ça pourrait changer)

Sometimes, a list of alternative matches is available.

Une fois de plus, le système fera la modification correspondante via WiDaR sur Wikidata, si vous avez validé une correspondance.

Éléments validés manuellement (en vert)

Pour les éléments qui ont déjà été associés, la seconde ligne disposera d'un lien vers Wikidata avec un résumé auto-généré de l'entrée Wikidata.

Dans la colonne de droite sera affiché le nom de l'utilisateur qui a fait le lien, avec en rouge Remove match. Ce lien devrait être utilisé uniquement si vous croyez que l'association faite par quelqu'un d'autre est fausse. Lorsque la correspondance est correcte, laissez tout tel quel et avancez.

Veuillez noter qu'une association met à jour Wikidata, tandis qu'une suppression de correspondance ne le fait pas (actuellement). Si vous retirez une correspondance d'un élément, vous devrez ouvrir l'élément Wikidata dans un nouvel onglet et retirez la propriété là-bas également - autrement, il pourrait revenir dans mix'n'match dans le futur.

Candidats à la création

Beaucoup d'entrées des catalogues ne sont pas (encore !) sur Wikidata. Certaines peuvent ne pas remplir les critères pour un élément Wikidata, mais d'autres sont listées dans plusieurs catalogues, et ainsi ont plusieurs sources externes, ce qui améliore leur « notabilité » significativement. Les entrées qui ont le même nom dans de multiple catalogues (>=3), mais qui n'ont pas d'élément Wikidata associé, peuvent être trouvées via Creation candidates.

Un exemple de candidats à la création.

Les entrées listées ont des options de recherche habituelles, pour assurer qu'aucun élément n'existe déjà sur Wikidata. On peut alors créer un nouvel élément Wikidata, avec un label (en anglais) pré-rempli. Ensuite, le nouvel élément peut être associé à l'entrée adéquate via Set Q. On peut également rechercher sur Commons pour ce label ; parfois, une image de cette personne existe déjà là-bas !

Faites attention: Le simple fait que les entrées aient le même nom n'implique pas nécessairement qu'elles ont le même sujet. S'il vous plaît soyez prudents et vérifiez à l'aide des catalogues !

Matching tips

When matching entries to Wikidata items please bear the following tips in mind:

  • Don't guess: guessing will introduce errors into the data. If in doubt follow the link on the catalogue entry, check other catalogs at the bottom of the entry or other information (e.g coordinate location). You can always skip entries and let someone else match it, you can even move to a different catalogue you have more knowledge of.
  • Don't be afraid to create new items: If it isn't exactly the same concept please create a new item. It is much easier to merge two items after the matching has finished than separate an item into two separate items. E.g a World Heritage site for a city often does not cover the same area as the city itself, so a new item should be made.
  • Don't match to disambiguation items: Wikidata items exist for Wikipedia disambiguation pages. These items act as a list of links, rather than a concept to be matched to. Eg Bambaia (Q4853316) should not be matched, Agostino Busti (Q395600) should be.
  • Don't match from disambiguation items: some authority databases have disambiguation or alias pages.
    • Eg RKD Artists used to have an entry for "Bambaia" that was wrongly mapped to Wikidata. (Now RKD Bambaia properly redirects to RKD Augustino Busti)
    • Never match to GND "undifferentiated names"
  • Check the automatic matches: Whilst the automatic matching is often correct it can still get confused between similarly named items.
  • N/A status is exclusively for entries that can never, ever be a Wikidata item, or for known duplicates within the same catalog.
  • Use the 'jobs' option: The 'action' drop-down menu on any catalogue has a 'jobs' option. This gives you a list of tasks that will help with matching. For example, 'auxiliary matcher' will check the dataset for additional identifiers such as VIAF IDs and check them against existing records in Wikidata. If the automatching process has thrown up a lot of low-quality matches, there is the option to 'purge automatches'.

Trier la liste du catalogue

Par défaut, la liste des catalogues est triée alphabétiquement. Le paramètre sort_mode peut prendre un ou plusieurs mots-clefs pour modifier cela :

  • sort_mode=groups groupe les catalogues par type/sujet, les plus grands en premier, triés alphabétiquement à l'intérieur de chaque groupe. Les catalogues terminés ont leur propre groupe à la fin ;
  • sort_mode=groups,by_easiest fait la même chose que ci-dessus, mais avec les « plus faciles » (#auto-matched+2*#unmatched) à finir d'abord ;
  • sort_mode=by_easiest,no_complete trie sans groupes, mais avec les « plus faciles » d'abord, les catalogues terminés masqués (sinon ils seraient eux-mêmes classés comme les plus faciles) ;
  • sort_mode=groups,complete_inline groupe les catalogues, mais avec les catalogues terminés dans leur groupe respectif.

Si votre catalogue préféré est marqué « unknown » ou est dans le mauvais groupe, merci de le signaler à Magnus Manske (talk).

Créer des nouveaux catalogues

Vous pouvez importer des nouveaux catalogues vous-même, le mieux étant de les coller depuis un tableur. Alternativement, vous pouvez demander à Magnus Manske (talk) d'importer un catalogue pour vous.

Tips

  • The field Wikidata property is for when a property exists for external identifiers. You can propose an external identifier property at Wikidata:Property proposal.
  • Create detailed descriptions for the Entry description field where possible, it will often make it much easier for people to match the catalogue, leading to less incorrect matches and higher data quality.
  • You can add aliases to items to help with the matching process. To import aliases, go to the catalogue and use the drop down 'action' menu in the top right. The 'aliases' option takes you to a page where you can import alternative labels for entries in the mix'n'match dataset. It will need to be in a tab separated format, and will use the dataset's external IDs for matching.

Managing catalogs

There is a catalog editor, accessible at mix-n-match/#/catalog_editor/<id> for the catalog creator and a subset of users (“catalog editors”). There it is possible to change some of the catalog properties (name, description, URL, type, language and Wikidata property) and to disable a catalog.

Scraper-based catalogs can be updated by following the catalog creation process, and entering an existing ”Catalog ID”.

Références

  1. Vous pouvez coller le numéro Q soit comme « Q123 », soit comme « 123 ». Le logiciel acceptera aussi d'autres caractères, tels que des parenthèses ou des virgules, du moment que le numéro Q que vous fournissez est valide.

Liens