Jump to content

Wikipédia Abstrata/Atualizações/21-06-2022

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Abstract Wikipedia/Updates/2022-06-21 and the translation is 30% complete.
Atualizações da Wikipédia abstrata Translate

Wikipédia Abstrata via lista de discussão Wikipédia Abstrata no IRC Wikifunções no Telegram Wikifunctions on Mastodon Wikifunções no Twitter Wikifunções no Facebook Wikifunções no YouTube Site da Wikifunções Translate

Artigos escritos manualmente

As comunidades criarão (pelo menos) dois tipos diferentes de artigos usando a Wikipédia Abstrata: por um lado, teremos artigos altamente padronizados baseados inteiramente em Wikidata, chamados artigos modelo; e teremos conteúdo sob medida, feito à mão, sendo montado frase por frase. Hoje vamos discutir o segundo tipo, depois de discutirmos o primeiro tipo (artigos modelo, em um boletim anterior). Ambos os tipos, aliás, podem ser implementados pelo conceito "templatic renderers" (que faz parte da proposta de Ariel Gutman). Dedicaremos também um futuro informativo uma comparação dos dois tipos.

Para artigos montados manualmente, temos que fazer muito mais suposições sobre o que eventualmente estará disponível no Wikifunctions do que para artigos baseados em um modelo. A descrição a seguir não pretende prescrever à comunidade como as coisas devem funcionar, mas fornece apenas uma ideia de uma possibilidade. Ele é baseado em um "experimento do Mágico de Oz" (em inglês) feito pela equipe da Wikipédia abstrata externamente.

Tomamos a primeira frase de um artigo escolhido de forma semi-aleatória, com o objetivo de elaborar a representação dessa frase na Wikipédia Abstrata. Muitas vezes é mais difícil ver como traduzir artigos sobre ideias do que coisas mais concretas como pessoas, lugares e objetos. A frase veio do artigo da Wikipedia em inglês Lucro (economia)/Profit, que escolhemos como um exemplo comum de conceito:

An economic profit is the difference between the revenue a commercial entity has received from its outputs and the opportunity costs of its inputs.

Observe que não esperamos que a Wikipédia em inglês seja a fonte de todos os artigos da Wikipédia abstrata, mas certamente é uma fonte conveniente de inspiração para a equipe, já que todos nós falamos inglês. Como linha de base, cada um de nós traduziu manualmente esse texto para os idiomas que falamos.

Uma ferramenta poderosa, se não a mais poderosa em nosso arsenal para transformar essa frase em conteúdo abstrato é que podemos reescrevê-la e simplificá-la. Na Wikipédia abstrata, o objetivo não é traduzir o mais fielmente possível as palavras de qualquer artigo existente na Wikipédia, mas capturar o máximo possível o significado dos artigos. Então tomamos a liberdade de reescrever a frase da seguinte forma:

In economics, the profit of a commercial entity is defined as the difference between its outputs’ revenue and its inputs’ opportunity cost.

Reduzimos ainda mais a frase, devido a restrições de tempo, para somente:

In economics, profit is defined as the difference between revenue and cost.

A partir disso, montamos o seguinte conteúdo abstrato.

Contexto

Aqui, o texto em negrito é o rótulo de um construtor, o texto em itálico é o rótulo de uma chave do construtor fornecido e, o link aponta para um item do Wikidata. Isso segue a notação usada nos exemplos anteriores. Assim assumimos a disponibilidade dos construtores usados. Para ser explícito, neste caso assumimos os construtores listados abaixo com suas respectivas chaves. Como as chaves ou construtores seriam nomeados e, de fato, quais construtores e chaves existiriam, pode muito bem ser muito diferente.

Context returns a full clause representing a subordinate clause being put in a context

  • context takes a noun phrase, describing the context in which the content is
  • content takes a clause that is being put in the context

Definition returns a full clause defining something as a definition

  • subject takes a noun phrase that is being defined
  • definition takes a noun phrase that represents the definition

Difference returns a noun phrase that means the quantitative difference between two given noun phrases

  • first takes a noun phrase that represents the first part
  • second takes a noun phrase that represents the second part

Where we have mentioned "noun phrase" above, we actually mean "concept that can be realized as a noun phrase by a renderer". Also, we have glossed over the considerable challenge of having a mechanism through which a renderer could just take in a Wikidata item and turn it into a noun phrase. That is a challenge that Mahir has tackled admirably with Ninai and Udiron.

Another challenge was to find the right Wikidata items for each of the involved noun phrases. For example, for the second key of the Difference constructor, we chose operating cost. Other candidates could have been cost or opportunity cost. Again, this is not necessarily the best choice, but just the one we came up with, given our time constraints and the way we approached the task.

The final step of the exercise was to take that abstract content, and to render (by hand) a natural language text in the languages that we speak, as mechanically as possible, using the labels of the selected Wikidata items (it should be the lexeme connected to the items, but that was too sparse). This step is why we called the whole exercise a “Wizard of Oz” exercise, as we simulate here what renderers in Wikifunctions would do.

Here are some results (unfortunately, we didn’t record the results we came up with during the offsite, so we re-created them for this newsletter):

English: In economics, economic profit is defined as the difference between income and operating cost.

German: In Wirtschaftswissenschaft ist Gewinn definiert als der Unterschied zwischen Einkommen und Betriebskosten.

Croatian: U ekonomiji, dobit je definiran kao razlika između dohodka i troška*.

Russian: В экономике, экономическая прибыль определяется как разница между доходом и операционными затратами.

French: En économie, le profit est défini comme la différence entre les revenus et les dépenses d'exploitation.

Spanish: En economía, ganancia económica se define como la diferencia entre ingresos y costes*.

Kannada: ಅರ್ಥಶಾಸ್ತ್ರದಲ್ಲಿ, ಆರ್ಥಿಕ ಲಾಭವನ್ನು ಆದಾಯ ಮತ್ತು ನಿರ್ವಹಣಾ ವೆಚ್ಚದ ನಡುವಿನ ಅಂತರವೆಂದು ವ್ಯಾಖ್ಯಾನಿಸಲಾಗಿದೆ.

Chinese: 在经济学中,经济利润被定义为收入与经营成本之间的差额。

Hebrew: בכלכלה, רווח מוגדר כהפרש בין הכנסה להוצאות תפעוליות.

Swedish: I nationalekonomi definieras vinst som skillnaden mellan inkomst och Opex.

Italian: In economia, il profitto è definito come la differenza fra il reddito e i costi operativi*.

Arabic: في الاقتصاد*، يتم تعريف الربح على أنه الفرق بين الدخل المالي والمصروفات الجارية.

Words marked with an asterisk were given manual translations from us, as they did not at the time have a label in Wikidata, or the label did not fit.

During the offsite, we evaluated the results, and found them in fact not only readable (although not perfect), but also easier to understand than our initial translation. This is likely an effect of the simplification process the text underwent. The whole exercise left us filled with optimism about the approach.

This newsletter was late due to the amount of discussion it generated internally. Don’t expect everyone on the team to agree on everything being said here. We think these discussions should be in the open, for everyone to join in. Expect more to follow.

Further updates:

We are getting additional support from ThisDot technical writers: Two ThisDot technical writers will be joining the team for the remainder of June to figure out how to on-board users into the concept of functions, and how to communicate to users what functions are and how they work, in an easily-translatable manner.

Below is the brief weekly summary highlighting the status of each workstream

Performance:

  • Drafted the Performance Metrics document
  • Started research on reported slowness in function evaluation
  • Added logging and dashboarding to Beta Cluster and wrote documentation for Beta Cluster

NLG:

  • Wrote a Proof of Concept of support for new Wikifunctions features to support proposed NLG pipelines

Meta-data:

  • Altered MediaWiki PHP and Vue layers to handle either format
  • Ensured that no function-orchestrator test code/cases employ the old format

Experience:

  • WikiLambda PHP and Function-schemata finished and merged
  • Design: continue working on typed list view
  • Front-end: made ISO codes mobile friendly and started table component implementation