믹스앤매치/매뉴얼
이 문서는 오래되었습니다. 하지만 최신 정보를 반영한다면, 계속해서 도움이 될 수 있습니다. 최근의 양식으로 내용을 수정 및 보완, 개선하도록 도와주세요. |
믹스앤매치는 마그누스 만스케가 만든 도구로, 외부 소스에서 가져온 다양한 주제 목록을 담고 있습니다. 이를 통해 위키데이터 항목과 매치하여 위키데이터에 존재하는 항목과 아직 항목이 없는 항목을 식별할 수 있습니다. "스테로이드를 투여한 레드링크 목록을 생각해 보세요".
현재 옥스포드 국립 인명 사전(완성됨), 오스트레일리아 인명 사전(완성됨), 국립 초상화 미술관 카탈로그(52.5% 일치) 등을 포함하여 2,500개 이상의 카탈로그가 수록되어 있습니다.
이렇게 하면 특정 위키백과에서 어떤 항목이 누락되었는지, 또는 어떤 언어가 특정 주제를 가장 잘 다루고 있는지 쉽게 알 수 있습니다.
작동 방식
믹스앤매치는 품목을 5가지 분류로 구분합니다:
- 완전히 일치됨(이전 명칭 "수동으로 일치됨"): 사용자가 이 카탈로그 항목을 위키데이터 항목(여기에는 Wikidata에서 가져온 항목이 포함됨)과 일치시켰습니다.
- 예비적으로 일치됨(이전 명칭 "자동으로 일치됨"): 시스템이 위키데이터의 항목에 대한 하나 이상의 가능한 일치 항목을 추측했지만, 사용자가 이를 확인하거나 거부해야 합니다.
- 위키데이터에 없음 (사용 중단됨): 이 카탈로그 항목은 일치하는 위키데이터 항목이 없는 것으로 알려져 있습니다.
- 위키데이터에 적용할 수 없음(N/A): 항목이 위키데이터와 관련이 없는 것으로 표시되었습니다(예: 중복, 플레이스홀더, 넘겨주기 또는 단순히 적절한 주제가 아님).
- 매치되지 않음: 이 항목은 아직 매치되지 않았으며 자동 제안이 없습니다.
물론 목표는 가능한 많은 항목을 수동으로 일치시킨 것으로 표시하는 것입니다(또는 가능한 위키데이터 일치가 없음을 확인하는 것입니다). 도구를 사용하려면 위키미디어 프로젝트에 계정을 등록하고 WiDaR 도구 승인을 실행해야 합니다.
믹스앤매치를 열면 카탈로그 목록이 표시됩니다(특정 카탈로그를 선택할 수도 있음). 그런 다음 다음을 수행할 수 있습니다.
- 헤더 바의 검색 상자를 사용하여 특정 이름을 검색합니다. 그러면 검색 결과 페이지로 이동합니다.
- 결과 목록을 사용하는 방법은 아래의 "목록 모드"를 참조하세요.
- 검색 결과 페이지에서 특정 카탈로그로 검색을 제한할 수도 있습니다.
- Qid를 검색할 수도 있습니다. 그러면 항목이 매치되는 모든 항목이 반환됩니다. 외부 ID 검색은 지원되지 않습니다.
- 검색 결과 페이지에 특정 이름과 일치하는 모든 항목이 포함되어 있다는 보장은 없습니다. 특히, 결과가 너무 많으면 목록이 잘릴 수 있습니다.
- 특정 카탈로그를 선택한 다음 카탈로그 페이지로 이동하세요.
카탈로그 페이지에서는 각 카테고리의 항목 수와 일치 횟수 기록을 볼 수 있습니다. 특정 카테고리를 클릭하면 "목록 모드"로 이동합니다. 다음을 포함한 "작업" 메뉴도 표시됩니다.
- 완전히 일치함, 예비적으로 일치함, 일치하지 않음, 위키데이터 없음, 위키데이터에 적용되지 않음 – 이 특정 카테고리의 모든 항목에 대한 "목록 모드"로의 링크.
- 다중 일치 항목 – 사전 매칭된 모든 항목과 자동 제안된 다중 일치 항목에 대한 "목록 모드"로의 링크입니다.
- 사이트 통계
- 다운로드
- 매치 모드 - 아래를 참조하세요.
- 이 카탈로그의 최근 변경 사항
- 다른 이름
- 직업
- 이 카탈로그에서만 검색
- 다른 카탈로그의 이름
- 카탈로그를 수동으로 동기화
- 카탈로그 편집기
- 모바일 매칭
- 시각적 도구
- 이미지 찾기
- 지난주 변경 사항
- 카탈로그 보고서
매치 모드
매치 모드(이전에는 "반자동 모드" 또는 "게임 모드"라고 함)를 선택하면 페이지 상단에 카탈로그 ID(카탈로그 ID), 카탈로그 제목(카탈로그 이름) 및 카탈로그에서 제공된 최소한의 설명(카탈로그 설명)이 표시됩니다. 이를 통해 누구 또는 무엇인지 파악하는 데 도움이 될 것입니다.
항목이 일치하지 않는 경우 세 가지 선택이 있습니다:
- Q 설정(파란색 버튼): 카탈로그 항목과 일치하는 위키데이터 항목을 식별한 경우 이 상자에 Q 번호를 붙여넣을 수 있습니다.[1]
- 새 항목(녹색 버튼): 일치하는 위키데이터 항목이 없다고 확신하는 경우. 이렇게 하면 이 항목에 대한 새 위키데이터 항목이 생성됩니다.
- N/A (빨간색 버튼): 이 항목에 적합한 위키데이터 항목이 절대 없을 경우. 새로 만든 항목에 대한 설명은 위키데이터에 부적절할 수 있으며 수동으로 개선할 수 있습니다.
의심이나 불확실한 경우 또는 일치하는 위키데이터 항목이 없지만 즉시 항목을 만들고 싶지 않은 경우 "다음 항목"을 클릭하여 이 항목을 건너뛰고 다음 요소로 이동할 수 있습니다.
항목이 사전에 일치하는 경우 두 가지 선택이 있습니다:
- 확인됨(녹색 버튼): 제안된 항목이 올바른지 확인합니다.
- 제거(빨간색 버튼): 제안된 항목이 올바르지 않은지 확인합니다. 그러면 항목이 일치하지 않게 되고 다른(잠재적으로 새로운) 항목과 일치될 수 있습니다.
자동 제안된 매치가 여러 개 있는 경우, 첫 번째 매치만 표시되고 "확인됨"을 클릭하면 사용됩니다. 항목 이름 오른쪽에 있는 링크를 사용하여 다른 매치를 찾아보거나 선택할 수 있습니다.
더 아래에는 en.wikipedia에서 제안된 링크가 몇 개 있는데, 위키데이터의 항목에 대한 링크가 있습니다. 올바른 항목이 거기에 있는 경우 오른쪽에 있는 링크(예: "Q384941")를 클릭하면 일치 항목이 등록됩니다. 올바른 항목이 제안에 없는 경우 구글에서 위키백과 또는 위키문헌의 모든 버전이나 위키데이터에서 검색할 수 있습니다.
카탈로그 항목과 위키데이터 항목 간에 연결을 만들 때마다 시스템은 자동으로 위키데이터를 업데이트합니다. 이는 귀하의 기여에서 편집으로 표시됩니다.
(믹스앤매치의 몇몇 항목에는 아직 속성이 설정되어 있지 않을 수 있습니다. 이 중 하나에서 작업 중이라면 해당 매치가 저장되고 나중에 적절한 경우 업데이트됩니다.)
목록 모드
다음과 같은 경우 항목 목록이 표시됩니다:
- 카탈로그 페이지에서 특정 카테고리(예: "Unmatched")를 클릭합니다. 이 카테고리의 모든 항목이 페이지당 50개 항목으로 표시됩니다.
- 검색 결과 페이지를 탐색합니다.
이전에는 수동 모드로 알려져 있었으며, 모든 카테고리에서 50개 항목을 표시할 수 있었습니다. 이 옵션은 제거되었습니다.
목록의 첫 번째 줄에는 항목의 이름과 (사용 가능한 경우) 설명이 표시됩니다. 각 카드에는 엔터티의 상태도 표시됩니다.
비교할 수 없음
제안된 일치 항목이 없는 항목의 경우 두 번째 줄에는 위키백과, 위키데이터 또는 구글에서 자동 검색을 하거나(결과를 위키백과 또는 위키데이터로만 제한) 항목을 만들 수 있는 다양한 링크가 표시됩니다. 오른쪽 열에는 세 가지 선택 사항이 있습니다.
- Q 설정 (녹색 링크): 여기를 클릭하면 대화 상자가 나타나서 위키데이터 항목의 번호를 입력할 수 있습니다(숫자 앞에 Q가 있든 없든).
- 새로운 항목(빨간색 링크): 여기를 클릭하면 해당 항목에 대한 "새로운" 항목이 위키데이터에 생성되고, 카탈로그에서 이름, 설명(있는 경우), ID가 자동으로 제공됩니다.
- N/A (노란색 링크): 여기를 클릭하면 해당 항목이 위키데이터에 "존재해서는 안 되며" 삭제될 수 있음을 확인합니다.
위키데이터 항목 번호를 제공한 경우 시스템은 매치 모드와 마찬가지로 WiDaR을 사용하여 해당 위키데이터 항목을 자동으로 업데이트합니다.
예비 매칭
자동으로 제안된 일치 항목이 있는 항목의 경우 두 번째 줄에는 위키데이터 항목의 자동 생성된 요약과 함께 위키데이터 링크가 있습니다. 오른쪽 열에는 세 가지 선택 사항이 있습니다:
- 확인 (녹색 링크): 여기를 클릭하면 제안된 항목이 올바른지 확인합니다.
- 제거(빨간색 링크): 여기를 클릭하면 제안된 항목이 잘못되었음을 확인할 수 있습니다. 그러면 항목이 일치하지 않게 되고 다른(잠재적으로 새로운) 항목과 일치될 수 있습니다.
때로는 대체 일치 항목 목록이 제공되기도 합니다.
다시 말해, 시스템이 위키데이터의 WiDaR을 통해 일치가 확인되면 해당 편집을 수행합니다.
일치함
이미 매칭된 항목의 경우 두 번째 줄에 위키데이터 항목에 대한 자동 생성된 요약과 함께 위키데이터 링크가 표시되거나 "위키데이터에 적용되지 않음"이 표시됩니다.
오른쪽 열에는 링크를 만든 사용자의 이름과 빨간색 "제거"가 표시됩니다. 이 링크는 다른 사람이 만든 조합이 잘못되었다고 생각될 때만 사용해야 합니다. 제대로 결합되면 모든 것을 그대로 두고 계속 진행하세요.
매치를 만들면 위키데이터 항목이 업데이트되지만, 매치를 제거하면(현재) 업데이트되지 않습니다. 항목에서 매치를 제거하는 경우 새 탭에서 해당 위키데이터 항목을 열고 속성을 제거해야 할 수 있습니다. 그렇지 않으면 나중에 빅스앤매치로 다시 들어올 수 있습니다.
생성 후보
카탈로그의 많은 항목은 (아직!) 위키데이터에 없습니다. 일부는 위키데이터 항목의 기준을 충족하지 못할 수 있지만, 다른 항목은 여러 카탈로그에 나열되어 있고, 따라서 여러 외부 소스가 있어 "주목할 만한" 항목에 상당히 도움이 됩니다. 여러 (>=3) 카탈로그에 같은 이름이 있지만 연관된 위키데이터 항목이 없는 항목은 생성 후보를 통해 찾을 수 있습니다.
나열된 항목에는 일반적인 검색 옵션이 있어 위키데이터에 항목이 이미 존재하지 않는지 확인합니다. 그런 다음 (영어) 라벨이 미리 채워진 새 위키데이터 항목을 만들 수 있습니다. 그런 다음 Set Q
을 통해 새 항목을 해당 항목과 일치시킬 수 있습니다. 해당 라벨에 대해 공용을 검색할 수도 있습니다. 때로는 해당 사람의 이미지가 이미 존재합니다!
"주의": 이러한 항목의 이름이 같다고 해서 모두 같은 엔터티를 참조하는 것은 아닙니다. 개별 카탈로그를 주의 깊게 확인하세요!
매칭 팁
위키데이터 항목과 항목을 일치시킬 때 다음 팁을 명심하세요:
- 추측하지 마세요: 추측은 데이터에 오류를 발생시킵니다. 의심스러운 경우 카탈로그 항목의 링크를 따라가거나 항목 하단의 다른 카탈로그나 다른 정보(예: 좌표 위치)를 확인하세요. 항목을 건너뛰고 다른 사람이 일치하도록 할 수도 있고, 더 잘 알고 있는 다른 카탈로그로 이동할 수도 있습니다.
- 새로운 항목을 만드는 것을 두려워하지 마세요: 정확히 동일한 개념이 아니라면 새로운 항목을 만드세요. 매칭이 완료된 후 두 항목을 병합하는 것이 항목을 두 개의 별도 항목으로 분리하는 것보다 훨씬 쉽습니다. 예를 들어, 도시의 세계 유산은 종종 도시 자체와 같은 지역을 포함하지 않으므로 새로운 항목을 만들어야 합니다.
- 동음이의어 항목과 매치하지 않음: 위키백과 동음이의어 페이지에 대한 위키데이터 항목이 있습니다. 이 항목은 매치할 개념이 아니라 링크 목록 역할을 합니다. 예를 들어 Bambaia (Q4853316)은 매치하면 안 되고, Agostino Busti (Q395600)은 매치해야 합니다.
- 동음이의어 항목과 일치하지 않습니다.: 일부 권위 데이터베이스에는 모호성 해소 또는 별칭 페이지가 있습니다.
- 예를 들어 RKD 아티스트는 위키데이터에 잘못 매핑된 "봄베이"에 대한 항목을 가지고 있었습니다. (이제 RKD 봄베이는 RKD 아우구스티노 부스티로 제대로 넘겨주기됩니다)
- GND "미분화된 이름"과 절대로 일치하지 않습니다.
- 자동 매칭 확인: 자동 매칭이 종종 정확하지만 이름이 비슷한 항목 간에 혼동될 수는 있습니다.
- N/A 상태는 위키데이터 항목이 될 수 없는 항목이나 동일한 카탈로그 내에 있는 알려진 중복 항목에만 적용됩니다.
- 작업' 옵션 사용: 모든 카탈로그의 '작업' 드롭다운 메뉴에는 '작업' 옵션이 있습니다. 여기에는 매칭에 도움이 되는 작업 목록이 제공됩니다. 예를 들어, '보조 매처'는 VIAF ID와 같은 추가 식별자에 대한 데이터 세트를 확인하고 위키데이터의 기존 레코드와 비교합니다. 자동 매칭 프로세스에서 품질이 낮은 매칭이 많이 발생한 경우 '자동 매칭 제거' 옵션이 있습니다.
카탈로그 목록 정렬
기본적으로 카탈로그 목록은 알파벳순으로 정렬됩니다. sort_mode
매개변수는 이를 변경하기 위해 하나 이상의 키워드를 취할 수 있습니다:
- sort_mode=groups는 유형/주제 영역별로 카탈로그를 그룹화합니다. 가장 큰 그룹이 먼저이고, 각 그룹 내에서 알파벳 순으로 정렬합니다. 완료된 카탈로그는 끝에 자체 그룹이 있습니다.
- sort_mode=groups,by_easiest 위와 동일하지만, 가장 먼저 완료하기 "가장 쉽습니다"(#auto-matched+2*#unmatched)
- sort_mode=by_easiest,no_complete 그룹화되지 않은 정렬이지만, 가장 먼저 완료하기 "가장 쉽습니다", 완료된 카탈로그를 숨깁니다(기본적으로 "가장 쉽습니다")
- sort_mode=groups,complete_inline 그룹화되지만, 해당 주제 영역에 완료된 카탈로그가 있습니다.
좋아하는 카탈로그가 "알 수 없음"이거나 잘못된 그룹에 속해 있는 경우 마그누스 만스케 (토론)에게 알려주십시오.
새로운 카탈로그 만들기
새 카탈로그를 만들고 매핑 후보 목록을 제공하거나(스프레드시트에서 붙여넣는 것이 가장 좋음) 스크래퍼를 만들어 매핑 후보를 자동으로 수집할 수 있습니다. 그렇지 않으면 마그누스 만스케(토론)에게 카탈로그를 가져오도록 요청하세요.
팁
- 위키데이터 속성 필드는 외부 식별자에 대한 속성이 존재하는 경우를 위한 것입니다. 위키데이터:속성 제안에서 외부 식별자 속성을 제안할 수 있습니다.
- 가능한 경우 항목 설명 필드에 대한 자세한 설명을 작성하면 사람들이 카탈로그를 일치시키기가 훨씬 쉬워져 잘못된 일치가 줄어들고 데이터 품질이 향상됩니다.
- 항목에 별칭을 추가하여 매칭 프로세스를 도울 수 있습니다. 별칭을 가져오려면 카탈로그로 이동하여 오른쪽 상단의 드롭다운 '작업' 메뉴를 사용합니다. '별칭' 옵션을 사용하면 믹스앤매치 데이터 세트의 항목에 대한 대체 레이블을 가져올 수 있는 페이지로 이동합니다. 탭으로 구분된 형식이어야 하며, 매칭을 위해 데이터 세트의 외부 ID를 사용합니다.
카탈로그 관리
카탈로그 작성자와 일부 사용자("카탈로그 편집자")가 mix-n-match/#/catalog_editor/<id>
에 액세스할 수 있는 카탈로그 편집기가 있습니다. 여기서 일부 카탈로그 속성(이름, 설명, URL, 유형, 언어 및 위키데이터 속성)을 변경하고 카탈로그를 비활성화할 수 있습니다.
스크래퍼 기반 카탈로그는 카탈로그 생성 프로세스에 따라 기존 "카탈로그 ID"를 입력하여 업데이트할 수 있습니다.
참고문헌
- ↑ Q 번호를 "Q123" 또는 "123"으로 붙여넣을 수 있습니다. 제공된 Q 번호가 유효한 한 소프트웨어는 괄호나 쉼표와 같은 다른 문자도 허용합니다.
링크
- 레드 링크 목록 스테로이드 - 마그너스의 원래 블로그 게시물
- 모든 위키백과에 있어야 할 문서 목록
- 소규모 및 새로운 위키백과를 위한 매뉴얼