Jump to content

Web2Cit

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Web2Cit and the translation is 100% complete.
Web2Cit: ウェブ典拠から共同作業で出典を自動生成
Web2Cit ロゴ

ウィキペディア用の出典自動生成機能(Citoid=サイトイド)は知識が限られていても出典が追加でき手間も時間も節約してウィキペディアの5本の柱の一つである検証可能性を満たします。しかしながら時には自動出典が予測と異なる動作をしてしまうことがあります(調査を参照)。

Web2Cit(ウェブツーキット)は共同作業でウェブ典拠から出典を自動生成する機能で、サイトイド(Citoid)の結果として返す出典を補うために作ったものです。コントロールはコミュニティの共同作業が担い、自動生成の出典を改善する補助になるよう、比較的、簡略なツール類を組み合わせて技術的な技能の習熟の格差を縮めようとしました。

Coolest Tool Award 2024 logo
Web2Cit

2024 Coolest Tool
Award Winner

in the category
Quality

始めてみよう

インストール

ウィキペディアで出典の自動生成機能 Web2Cit を使う準備は簡単で、ユーザスクリプトをお使いのウィキペディアの account[Notes 1] に追加すればよく、以下のコードをコピーし、ウィキペディアの Special:MyPage/common.js ファイルにペーストするだけです。

// Web2Cit
mw.loader.load( '//en.wikipedia.org/w/index.php?title=User:Diegodlh/Web2Cit/script.js&action=raw&ctype=text/javascript' ); // Backlink: [[:en:User:Diegodlh/Web2Cit/script.js]]

詳細な手順の指示はユーザスクリプトの説明文書をご一読ください。

使ってみる

Web2Cit ユーザスクリプト。(左) 出典の「Cite」ダイアログに「Web2Cit」のチェックボックスが表示されたら、インストールが成功した印です。(右) 上段の出典は Citoid の出力、下段は Web2Cit の出力を示します。

インストールが成功したかどうかは、Web2Cit チェックボックスがビジュアルエディタの「出典」ダイアログ(Cite)に表示されたら成功したと確認できます。

出典に使いたい URL を入力し、生成ボタンGenerate を押します。すると従来の1件ではなく2件、典拠テンプレートが出力されます。出力元はそれぞれ上段は従来どおり Citoid、下段はこの Web2Cit からです。

これだけ理解していれば、ウィキペディアで出典自動生成の Web2Cit を使えます。

しかしながら、遅かれ早かれ特定の URL の場合、Citoid も Web2Cit も両方とも結果が正しくないことに気づくはずです。この事態を解決するには、Web2Cit をどう使えば良いか説明します。

編集

Web2Cit の使い方解説の短い動画
Web2Cit ワークショップの開催例、LD4 ウィキデータ同志グループのミーティング(LD4 Wikidata Affinity Group calls)
Web2Cit ワークショップのスペイン語版をWikiherramientas サイクル(Wiki ヘルプ)で開催

Web2Cit ではウェブサイトごとに設定ファイル3件を単位として採用、Web2Cit が当該のウェブサイト(domain )由来のWebページ(paths )をどう扱うか定義します。詳細は Web2Cit 基本編ページを読むと、Web2Cit の動作や細部の構成がわかります。

これらの設定ファイルは共同作業で定義されるため、Web2Cit の抽出結果(つまり翻訳 )がどうもおかしいと感じたら、その場で編集してもらうと、その結果が Web2Cit の利用者にも反映されます。

エディタを開く

翻訳要約欄ページで編集 "edit" リンクをクリック、対応する設定ファイルを JSON エディタで編集します。

設定ファイルの編集は、まず Web2Cit サーバで対象のWebページの翻訳要約ページを開きます。その手順はCite ダイアログで目にする出典検索結果画面の右下角のリンク、Web2Cit を押します(上記の始めてみよう参照)。あるいは直接、Web2Cit サーバのホームページを開き、目当ての URL を入力、抽出のExtract ボタンを押します。

次に翻訳要約ページに現れた編集用の「edit」リンクをどれでも良いので押し、以下の見出しに説明があるとおり、私たちの JSON 編集機能を使って対応するドメインの設定ファイルを編集します。設定の変更が済むたびに編集要約ページを再読み込みし、表示が以前とどこがどのように変わったか確かめます。

編集の説明文書の見出しJSON editor に加えてサーバの説明文書を読むと詳細が書いてあり、例えば設定ファイルを一時的に保存するなら利用者の個人サンドボックスの空間にすると Web2Cit 利用者全員に波及しないとか、サンドボックス空間のその一時的なファイルを使うように Web2Cit サーバに指示する方法、デバグの情報は翻訳要約に書き込むと、予想外の出力を分析するときに役に立つなどが書いてあります。

翻訳テストを追加

まず最初に、翻訳テストの定義をしてから次の作業に進みましょう。Web2Cit 設定の管理を担当するご自身や他の利用者にとって、どんなウェブサイト・ドメインに対応するときも、例となるウェブページを1、2件示し、どんな結果を期待するのか明確に記しておく点が非常に重要です。

まず最初に、目当てのWebページについて翻訳テストを定義し、期待される結果を示します。

  1. 翻訳要約ページで期待される出力 "Expected output" の横の編集 "edit" リンクをクリック、私たちの JSON エディタを使い、当該のドメインでテスト設定を編集します。
  2. 対象のWebページにまだ翻訳テストを作成していない場合、新規の翻訳テストとウェブページのパスを入力。
  3. 1件以上の翻訳のフィールドを追加して、予測する出力を添えます。詳細はテストの説明文書を開いてください。
  4. 設定ファイルを Web2Cit ストレージに保存。

翻訳テストの定義のみ担当したい、あるいはこれならできるという時点でとてもありがたいです。誰かがテストしておいてくれると、他の貢献者が翻訳テンプレートの定義に参考になりますし(以下を参照)、Web2Cit システムの健全さを定期的にチェックするときにも頼りになります(以下の変更点は要チェック)。

翻訳テンプレートを追加

この段階で当該のウェブサイトでは、ご自身もしくは誰かが期待される出力を示してあるはずです。しかしそこには、その結果を得る方法は書いてありません。

Web2Cit はウェブソースから出典メタデータを抽出するため翻訳テンプレートを採用します。目的のWebページにしたがってテンプレートを定義する方法は以下の通り。

  1. 翻訳要約ページで期待される出力 "Expected output" の横の編集 "edit" リンクをクリック、私たちの JSON エディタを使い、当該のドメインのテンプレート設定を編集します。
  2. 目標のWebページに基づく翻訳テンプレートがまだ作成されていない場合は、新しい翻訳テンプレートを追加して対象のWebページのパスを入力。
  3. 追加する1件以上の翻訳のフィールドは少なくとも翻訳手順を1件ずつ含めてください。その手順では一連の選択および変換手順を組み合わせて引用メタデータを取得し変換します。詳細は、テンプレートのドキュメントを参照してください。
  4. 設定ファイルを Web2Cit ストレージに保存。

場合によっては1つのウェブサイトに複数のテンプレートを使う必要があります。これらは URL パスのパターンに基づき、まとめて編集用のサブグループに指定します。詳しい情報はテンプレートならびにパターンの説明文書をごらんください。

満足できる設定ができたら、ウィキペディアに戻って目当ての URL に対する出典を生成してみてください。

変更をウォッチする

この見本は Web2Cit モニタの結果ページの一つ。いずれかをウォッチリストに入れておくと、テスト結果が変わるたびに通知が届く。

最後に Web2Cit モニターは、Web2Cit の翻訳結果を翻訳テストに照らして、期待された結果に適合するかどうか定期的に点検します。

テスト結果はオンウィキでドメイン単位の一連の成果ページごとに書いてあり、ウォッチリストに加えておくとテスト結果の変更通知が届きます。テスト結果ページの総覧は概論のページをご参照ください。

詳細はWeb2Cit モニタ解説文書を参照してください。

ヘルプを受ける

説明文書

Web2Cit の動作を説明する文書には以下のものを含みます。

  • Basics:Web2Cit の動作の仕方のまとめと Web2Cit エコシステムのそれを支える部分。
  • Fields:翻訳欄の種別と詳細。
  • Templates:翻訳テンプレート類とその動作の説明。
  • Tests:翻訳テストの説明とその動作の説明。
  • Patterns: URL パスのパターンと動作の仕方。
  • Editing:Web2Cit 設定を編集する方法。

利用者向けと技術者対象でWeb2Cit エコシステムを成立させる部分の解説文書は基本というリンク元の文書ページを参照してください。

サポート

Web2Cit は、最初は覚えるのに苦労するかもしれません。分からなくなったときにヘルプを頼むなら、次の方法があります。

  • Web2Cit のこのページもしくはその他のページで、議論ページに新しいスレッドを投稿
  • Phabricator で新しいタスクを開始するには、Web2Cit 総合プロジェクトを使う。

誰かに質問する

Web2Cit はウィキペディアの機能で、共同作業でウェブ典拠から出典を自動生成します。わからないことがあったら、直接、Web2Cit の他の利用者に質問ができます。カテゴリのWeb2Cit 貢献者を見ると、利用者プロフィールのページにこのアイコンを出している利用者が探せます。またご自身のプロフィールにもぜひ、Web2Cit 貢献者としてこのカテゴリを追加してください。

貢献する方法

設定

Web2Cit に協力してもらえるなら、共同作業でドメイン設定ファイルを上記の説明に従って作成し管理をお願いします。

ページ翻訳

Web2Cit は共同作業によりさまざまな言語に翻訳しています。Web2Cit の部分ごとに、翻訳作業の進行は異なります。

メタウィキの関連ページ

このページを例にすると、翻訳はまずページの上部バナーに「このページを翻訳」"translate this page" リンクがあるか探します。ある場合はそれをクリックして翻訳を開始。ない場合、そのページは翻訳準備が(まだ)整っていないという意味です。対応する議論ページでその点を投稿して他の人にも知らせてください。

ユーザーインターフェイス

Web2Cit サーバ用インターフェースは共同翻訳の対象で、作業はtranslatewiki.net で行います。

現状、Web2Cit JSON エディタはこの対象外です。インタフェースならびにコンテンツは translatewiki.net の同じプロジェクトで共同翻訳できるようにする予定です。それまではウェブ・ブラウザが提供する自動翻訳機能をお使いください。

Web2Cit モニタ

Web2Cit モニターを使うと、カスタムのテンプレートを使った場合の作業まとめ、変更履歴、出力結果のページを生成します。ぜひこれらのページを皆さんの言語で利用できるように、翻訳に力を貸してください(詳細はT321606)。

説明文書

Web2Cit はウィキメディアの大部分のツールと同様に、説明文書を共同で作成しています。基本的な一般解説と技術解説の提供に最善を尽くしましたが、まだ改善の余地がたくさんあると承知しています。どうか現状の解説を自由に改善してください。

開発

Web2Cit のコードは全件オープンソースの無償のソフトウェアです。構成要素のさまざまなソフトウェアのページを見て、どういう貢献が求められているか確認してください。

謝辞

Web2Cit の開発は当初、Strainu さんの発想を根元に、ウィキメディア財団の助成金を受けて始まりました。

立ち上げ当初のチームには以下の人を含みました。

  • Diego de la Hera ディエゴ・デ・ラ・エラは筆頭開発者、プロジェクト管理者。
  • Evelin Heidel エヴェリン・ヘイデはコミュニティ対応管理者で広報連絡担当。
  • 調査チームからジメナ・デル・リオ・リアンデ Gimena del Rio Riande、にディア・エルナンデス Nidia Hernández、ロミーナ・で・レオン Romina De León
  • Dennis Tobar デニス・トゥバーは Web2Cit モニタの開発者。

この機会にプロジェクトの草創期から開発期間にわたって助言してくれた諮問委員会の皆さんをたたえたいと思います。

Web2Cit の代替

Web2Cit が常に最適な選択肢とは限りません。他の案を検討するのも意義があります。

  • 固有のウェブサイトを設定しようと Web2Cit を使って余分な作業をしても、誰の助けにもならないと判断した場合は、Citoid が生成する出典を手動で訂正すれば良いのです。記入欄の追加や訂正なら面倒は少ないですが、出典テンプレートそのものの変更が必要な場合は、結構な労力になります。これが最も時間短縮できる方法だとしても、同じウェブサイトを典拠にしようとする人たちの役には立ちません。
  • 典拠にしようとしているウェブサイトの管理人に連絡を取り、 ぜひ構造化データを埋め込むように説得してください。一般に Citoid は構造化メタデータを組み込んだWebページをシームレスに理解します。長期的に見て、説得が最も良い選択肢です。
  • ご自身が JavaScript に精通している場合(もしくは誰か他の人に頼める場合)、典拠にしようとする特定のウェブサイト固有のZotero 翻訳を作成もしくは編集します。留意点として Zotero のリポジトリに反映されるまで、さらに更新がウィキメディアに統合されるまで、しばらく時間がかかります。この方法は最も高度の選択肢であり、Web2Cit よりも強力です。

関連項目

注記

  1. クロアチア語版とルーマニア語版ウィキペディアでは Web2Cit をガジェットとして導入、有効にする手順は簡単でウィキペディアの個人設定で有効にします。