Mix'n'match/Manual/nl
Deze pagina is verouderd, maar als het bijgewerkt zou worden, zou het nog steeds nuttig kunnen zijn. Help alstublieft door de tekst te corrigeren, uit te breiden en te herzien tot een actuele vorm. |
Mix'n'match is een hulpmiddel van Magnus Manske, die verschillende lijsten bevat van onderwerpen van externe bronnen. Het laat u deze vergelijken met Wikidata items, waarbij u identificeert welke er in Wikidata zijn en welke nog steeds geen items hebben - "denk aan een rode-link lijst over steroïden".
Het bevat nu meer dan 2.500 catalogi, zoals de Oxford Dictionary of National Biography (voltooid), de Australian Dictionary of Biography (voltooid) en de National Portrait Gallery's catalogus (52,5% overeenkomst).
Op deze manier is het gemakkelijk om te zien welke items ontbreken op een bepaalde Wikipedia, of welke taal de beste dekking van een bepaald onderwerp heeft.
Hoe werkt het?
Mix'n'match verdeelt items in vijf categorieën:

- Volledig gematcht (voorheen Handmatig gematcht): een gebruiker heeft dit catalogusitem gekoppeld aan een Wikidata-item (dit geldt ook voor items die zijn geïmporteerd uit Wikidata);
- Voorlopig gematcht (voorheen Automatisch gematcht): het systeem heeft een of meer mogelijke overeenkomsten geraden voor de vermelding in Wikidata, maar een persoon moet deze verifiëren of weigeren;
- Niet op Wikidata (ontraden): het is bekend dat dit catalogusitem geen overeenkomende Wikidata-item heeft;
- Niet van toepassing op Wikidata (n.v.t.): het item is gemarkeerd als niet relevant voor Wikidata (het is bijvoorbeeld een duplicaat, een tijdelijke aanduiding, een doorverwijzing of gewoon geen geschikt onderwerp);
- Niet gematcht: dit item is nog niet gematcht en er is geen geautomatiseerde suggestie beschikbaar.
Het doel is natuurlijk om zoveel mogelijk items te markeren als Volledig gematcht (of te bevestigen dat er geen mogelijke Wikidata-overeenkomst is). Om het hulpmiddel te gebruiken, moet u een account registreren op een Wikimedia-project en het hulpmiddel WiDaR autoriseren.
Wanneer u Mix'n'match opent, wordt een lijst met catalogi weergegeven (u kunt ook een specifieke catalogus selecteren). U kunt dan:
- Naar een specifieke naam zoeken met behulp van het zoekvak in de koptekstbalk. Dit brengt u naar een pagina met zoekresultaten.
- Zie ook Lijstmodus hieronder voor het gebruik van de lijst met resultaten.
- Op de pagina met zoekresultaten kunt u de zoekopdracht ook beperken tot een specifieke catalogus.
- U kunt ook zoeken naar een Qid; Hiermee worden alle items geretourneerd waarmee het artikel is gematcht. Het zoeken naar externe ID's wordt niet ondersteund.
- Er is geen garantie dat de pagina met zoekresultaten alle vermeldingen bevat die overeenkomen met een specifieke naam; De lijst kan met name worden ingekort als er te veel resultaten zijn.
- Selecteer een specifieke catalogus en ga dan naar een cataloguspagina.
Op een cataloguspagina ziet u het aantal gegevens in elke categorie en de geschiedenis van het aantal overeenkomsten. Als u op een specifieke categorie klikt, komt u in de Lijstmodus. U ziet ook een menu "Actie", waaronder het volgende:
- Volledig gematcht, Voorlopig gematcht, Niet gematcht, Geen Wikidata, Niet van toepassing op Wikidata – links naar Lijstmodus voor alle items in deze specifieke categorie.
- Meerdere overeenkomsten – links naar de Lijstmodus voor alle voorlopig gematchte items met meerdere automatisch voorgestelde overeenkomsten.
- Statistieken van de site
- Download
- Overeenkomst modus - zie hieronder.
- Recente wijzigingen in deze catalogus
- Aliassen
- Jobs
- Alleen in deze catalogus zoeken
- Namen in andere catalogi
- Catalogus handmatig synchroniseren
- Catalogus editor
- Mobiele overeenkomst
- Visueel hulpmiddel
- Afbeeldingen zoeken
- Wijzigingen laatste week
- Catalogus rapport
Overeenkomst modus

Als u kiest voor de modus match (voorheen bekend als semi-automatische modus of modus game), bovenaan de pagina heeft u de ID van de catalogus (catalogus-ID), de titel van de catalogus (catalogusnaam) en eventueel een minimale beschrijving uit de catalogus (catalogusbeschrijving). Dit zou u moeten helpen erachter te komen wie of wat het is.
Als het record niet overeenkomt, dan zij er drie mogelijkheden:
- Zet Q (blauwe knop): Als u heeft vastgesteld welk Wikidata-item overeenkomt met de catalogusvermelding, kunt u het Q-nummer in dit vak plakken. U kunt het Q-nummer plakken als "Q123" of als "123". De software accepteert ook andere tekens, zoals haakjes of komma's, zolang het Q-nummer dat u opgeeft geldig is.
- Nieuw item (groene knop): als u zeker weet dat er geen overeenkomend Wikidata-item is. Dit maakt een nieuw Wikidata-item voor dit item -
- N.v.t. (rode knop): voor gevallen waarin er nooit een geschikt Wikidata-item voor dit item zal zijn. De beschrijving van een nieuw aangemaakt item kan ongepast zijn voor Wikidata en kan handmatig worden verbeterd
In geval van twijfel of onzekerheid, of er is geen overeenkomend Wikidata-item, maar u wilt nu geen item aanmaken, kunt u dit item overslaan en naar het volgende gaan door op de knop met "Volgende" te klikken.
Als het record voorlopig overeenkomt, zijn er twee mogelijkheden:
- Bevestigd (groene knop): Bevestigt dat de voorgestelde invoer correct is.
- Verwijderen (rode knop): Bevestig dat de voorgestelde invoer onjuist is. De invoer wordt dan niet meer gematcht en kan worden gekoppeld aan een ander (mogelijk nieuw) item.
Als er meerdere automatisch aangegeven matches zijn, wordt alleen de eerste ervan getoond en wordt deze gebruikt als er op "Bevestigd" wordt geklikt. U kunt andere matches bekijken of selecteren met de link rechts van de naam van het item.
Verder naar beneden zijn enkele voorgestelde links van en.wikipedia, met de link naar het item op Wikidata. Als er een correcte item aanwezig is, kunt u eenvoudig op de link aan de rechterkant klikken (bijv. "Q384941") en zal een match worden geregistreerd. Als het juiste item niet bij de suggesties is, heeft u nog steeds de kans om door Google te zoeken op alle versies van Wikipedia of Wikisource of op Wikidata.
Elke keer als u een verband legt tussen een catalogusvermelding en een Wikidata-item, zal het systeem Wikidata automatisch bijwerken. Dit wordt weergegeven als een bewerking in uw bijdragen.
(Let op dat een paar opmerkingen op Mix'n'match mogelijk nog geen eigenschap hebben ingesteld - als u aan een van deze werkt, wordt de match later opgeslagen en bijgewerkt, indien nodig)
Lijstmode

Een lijst van items wordt weergegeven wanneer:
- U klikt op een specifieke categorie (bijv. "Niet gematcht") in een cataloguspagina - alle vermeldingen in deze categorie worden weergegeven met vijftig vermeldingen per pagina.
- U bekijkt een zoekresultaatpagina.
Vroeger stond het bekend als handmatige modus en het kan vijftig vermeldingen onder alle categorieën tonen; Deze optie is verwijderd.
Op de eerste regel van de lijst wordt de naam en (indien beschikbaar) de beschrijving van het item weergegeven. Elke kaart zal ook de status van de entiteiten tonen.
Niet gematcht
Voor items zonder suggereerde match, zal de tweede regel verschillende links presenteren die u in staat stellen om een automatische zoektocht op Wikipedia, Wikidata of Google te doen (het resultaat beperken tot Wikipedia of Wikidata), of zelfs het item te maken. In de rechterkolom zijn er drie keuzes:
- Zet Q (groene link): als u hier klikt, verschijnt er een dialoogvenster waarin u het nummer van het Wikidata-item kunt invoeren (met of zonder de Q voor het nummer).
- Nieuw item (rode link): als u hier klikt, wordt er een nieuw item op Wikidata gemaakt voor dat item, dat automatisch naam, beschrijving (indien aanwezig) en ID uit de catalogus krijgt.
- N.v.t. (gele link): als u hier klikt, bevestigt u dat het item niet mag bestaan op Wikidata en kan worden verwijderd.
Als u een Wikidata-itemnummer heeft verstrekt, zal het systeem het overeenkomstige Wikidata-record automatisch bijwerken met WiDaR, zoals in de match-modus.
Voorlopig gematcht
Voor items met een automatisch voorgestelde match, zal de tweede lijn een link naar Wikidata bevatten samen met een automatische samenvatting van het Wikidata-record. In de rechterkolom zijn er drie keuzes:
- Bevestigen (groene link): als u hier klikt, bevestigt u dat de voorgestelde invoer correct is.
- Verwijderen (rode link): Bevestig dat de voorgestelde invoer onjuist is. De invoer wordt dan niet meer gematcht en kan worden gekoppeld aan een ander (mogelijk nieuw) item.
Soms is er een lijst met alternatieve overeenkomsten beschikbaar.
Het systeem zal de correcte bewerking via WiDaR op Wikidata doen, als u een match heeft bevestigd.
Gematcht
Voor items die al zijn gematcht, zal de tweede regel een link naar Wikidata bevatten, samen met een automatisch gegenereerde samenvatting van het Wikidata-item, of "Niet van toepassing op Wikidata".
In de rechterkolom staat de naam van de gebruiker die de link heeft gemaakt, samen met een rode "Verwijderen" Deze link moet alleen worden gebruikt als u denkt dat de combinatie die door iemand anders is gemaakt, verkeerd is. Als het goed wordt gematcht, laat alles zoals het is en ga verder.
Merk op dat het maken van een match het Wikidata-item bijwerkt, maar het verwijderen van een match (op dit moment) dat niet doet. Als u een match op een item verwijdert, wilt u dat Wikidata-item misschien openen in een nieuw tabblad en de eigenschap daar ook verwijderen - anders kan het in de toekomst weer in mix'n'match komen.
Kandidaten aanmaken
Veel items uit catalogi staan (nog!) niet op Wikidata. Sommige voldoen misschien niet aan de criteria voor een Wikidata-item, maar andere staan vermeld in verschillende catalogi en hebben dus verschillende externe bronnen, wat hun "relevantie" aanzienlijk ten goede komt. Items met dezelfde naam in meerdere (>=3) catalogi, maar zonder bijbehorend Wikidata-item, zijn te vinden via Kandidaten aanmaken.

De genoemde items hebben de gebruikelijke zoekopties om ervoor te zorgen dat er geen enkele item al op Wikidata bestaat. Men kan dan een nieuw Wikidata-item maken, met het (Engelse) label vooraf gevuld. Vervolgens kan het nieuwe item worden gematcht via Set Q
. Men kan ook op de Commons zoeken naar dat label; soms bestaat er al een afbeelding van die persoon!
Let op: Het feit dat deze items dezelfde naam hebben, betekent niet dat ze allemaal naar dezelfde entiteit verwijzen. Controleer zorgvuldig de afzonderlijke catalogi!
Tips voor het matchen
Houd bij het matchen de volgende tips in gedachten:
- Niet raden: raden zal fouten in de gegevens introduceren. Volg bij twijfel de link op de catalogusvermelding, controleer andere catalogi onderaan de invoer of andere informatie (bijv. coördinatenlocatie). U kunt altijd een item overslaan en iemand anders het laten matchen, u kunt zelfs naar een andere catalogus gaan waar u meer kennis van heeft.
- Wees niet bang om nieuwe items te maken: Als het niet precies hetzelfde concept is, maak dan een nieuw item aan. Het is veel gemakkelijker om twee items samen te voegen nadat het matchen is voltooid dan een item in twee afzonderlijke items te scheiden. Een werelderfgoed voor een stad beslaat bijvoorbeeld vaak niet hetzelfde gebied als de stad zelf, dus moet er een nieuw item worden gemaakt.
- Niet matchen met doorverwijsitems: Er bestaan Wikidata-items voor Wikipedia-doorverwijspagina's. Deze items fungeren als een lijst met links, in plaats van een concept waaraan moet worden gekoppeld. Bijv. met het matchen zou Bambaia (Q4853316) niet meoten worden gekozen, met Agostino Busti (Q395600) wel.
- Match niet vanaf doorverwijsitems: sommige autoriteitsdatabases hebben doorverwijs- of aliaspagina's.
- Bijv. RKD Artists hadden vroeger een lemma voor "Bambaia" dat verkeerd was toegewezen aan Wikidata. (Nu verwijst RKD Bambaia correct door naar RKD Augustino Busti)
- Match nooit met GND "ongedifferentieerde namen"
- Controleer de automatische overeenkomsten: Hoewel de automatische afstemming vaak correct is, kan deze nog steeds in de war raken met items met dezelfde naam.
- N.v.t.-status is uitsluitend voor lemma's die nooit, maar dan ook nooit een Wikidata-item kunnen zijn, of voor bekende duplicaten binnen dezelfde catalogus.
- Gebruik de optie 'jobs': Het dropdown-menu 'actie' op elke catalogus heeft een optie 'jobs'. Dit geeft u een lijst met taken die helpen bij het matchen. 'auxiliary matcher' controleert bijvoorbeeld de dataset op aanvullende identifiers zoals VIAF-ID's en controleert deze aan de hand van bestaande records in Wikidata. Als het automatching-proces veel matches van lage kwaliteit heeft opgeleverd, is er de optie om 'automatches verwijderen' (purge).
Cataloguslijst sorteren
Standaard, wordt de cataloguslijst alfabetisch gesorteerd. De parameter sort_mode
kan één of meerdere zoekwoorden gebruiken om dit te veranderen:
- sort_mode=groups groepeert catalogi op type/onderwerp, grootste groepen eerst, alfabetisch gesorteerd binnen de betreffende groep. Voltooide catalogi hebben aan het einde een eigen groep
- sort_mode=groups,by_easiest hetzelfde als hierboven, maar "gemakkelijkste" (#auto-matched+2*#unmatched) om als eerste te voltooien
- sort_mode=by_easiest,no_complete niet-gegroepeerde sortering, maar "gemakkelijkst" om als eerste te voltooien, het verbergen van voltooide catalogi (omdat ze standaard "gemakkelijkst" zouden zijn)
- sort_mode=groups,complete_inline gegroepeerd, maar met voltooide catalogi in hun respectievelijke vakgebied.
Als uw favoriete catalogus "onbekend" is of in de verkeerde groep zit, geef dit dan door aan Magnus Manske (overleg).
Een nieuwe catalogus aanmaken
U kunt een nieuwe catalogus maken en ofwel een lijst met kandidaten voor koppeling aanbieden (het beste is om ze uit een spreadsheet te plakken) of een scraper maken om automatisch deze kandidaten te verkrijgen. Vraag anders Magnus Manske (overleg) om een catalogus voor u te importeren.
Tips
- Het veld Wikidata eigenschap (Wikidata property) is voor wanneer een eigenschap bestaat voor externe identifiers. U kunt een externe identificatie-eigenschap voorstellen op deze pagina.
- Maak waar mogelijk gedetailleerde beschrijvingen voor het veld Invoerbeschrijving (Entry description), dit maakt het vaak veel gemakkelijker voor mensen om de catalogus te matchen, wat leidt tot minder onjuiste overeenkomsten en een hogere gegevenskwaliteit.
- U kunt aliassen (aliases) toevoegen aan items om te helpen bij het matchen. Om aliassen te importeren, gaat u naar de catalogus en gebruikt u het drop-down 'actie' menu in de rechterbovenhoek. De optie 'aliassen' brengt u naar een pagina waar u alternatieve labels kunt importeren voor items in de mix'n'match-dataset. Het moet in een door tabgescheiden indeling zijn en de externe ID's van de gegevensset gebruiken om te matchen.
Catalogi beheren
Er is een catalogus-editor, die voor de catalogusmaker op mix-n-match/#/catalog_editor/<id>
beschikbaar is en een deel van de gebruikers ("catalogus-bewerkers"). Daar is het mogelijk om een aantal van de catalogus-eigenschappen (naam, beschrijving, URL, type, taal en Wikidata-eigenschap) te wijzigen en een catalogus te deactiveren.
Een catalogus op scraperbasis kan worden bijgewerkt door het cataloguscreatieproces te volgen en een bestaand "Catalog ID" in te voeren.
Referenties
Links
- Rode links lijsten over steroïden - Magnus's originele blogpost
- Lijst van artikelen die elke Wikipedia zou moeten hebben
- Manual for small and new Wikipedias/nl