Jump to content

Códigos especiais do idioma

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Special language codes and the translation is 41% complete.
Outdated translations are marked like this.

O idioma de um wiki da Wikimedia pode ser encontrado nos atributos lang="..." e xml:lang="..." do elemento <html> de cada página (ou outros elementos para subconteúdos específicos em páginas multilíngues); eles também são usados ​​para estilizar seletores de linguagem CSS. Esses códigos de idioma geralmente devem ser tags de idioma canônico conforme definido por BCP 47.

Em muitos casos, os nomes de subdomínios que usamos para projetos correspondem a códigos de idioma, mas ainda existem algumas exceções. Isso geralmente ocorre por razões históricas, onde um código ISO 639 válido (ou código de variante BCP 47 registrado e não obsoleto) ainda não estava disponível no momento da criação do projeto, mas também porque alguns códigos ISO 639 anteriores foram obsoletos ou removidos pois abrangiam um grupo de línguas que hoje são consideradas distintas.

Os códigos ISO 639 obsoletos ou removidos ainda são considerados válidos no BCP 47 (onde os códigos existentes não são removidos), na maioria das vezes como possíveis substitutos para traduções ausentes ou para permitir compatibilidade ascendente, mesmo que não sejam mais recomendados para uso moderno e conteúdos recém-criados ( o uso desses códigos pode potencialmente criar disputas insolúveis na Wikimedia, a menos que sejam distinguidos com traduções distintas usando códigos mais recentes). Em alguns casos, algumas distinções iniciais na ISO 639 também foram removidas porque foram introduzidas artificialmente por um período temporário (às vezes por razões políticas não neutras), mas não foram bem apoiadas pelos usuários, e quando complicaram desnecessariamente a tarefa dos tradutores, ou quando eles frequentemente exigiam o uso de substitutos de linguagem ou transliteradores automáticos (quando um padrão confiável e convenções ortográficas foram adotados entre a maioria dos usuários de diferentes variantes de escrita), ou devido ao desenvolvimento da educação para melhor compreensão mútua e aceitação de múltiplas variantes no uso vernáculo.

Subdomínios que não correspondem ao atributo lang

Subdomínio Idioma Projeto(s) Notas
als Local name : Alemannisch
English name : Alemannic
Language family : Germanic
Wikipedia, Wiktionary, Wikibooks, Wikiquote Usa gsw que corresponde ao código ISO 639-3 da linguagem.
bh Local name : भोजपुरी
English name : Bihari
Language family : Indo-Aryan
Tracked in Phabricator:
Task T41968 stalled

Código legado ambíguo. Usa bho que corresponde ao código ISO 639-3 do idioma para um idioma da família.

roa-rup Local name : armãneashti
English name : Aromanian
Language family : Italic
Wikipedia, Wiktionary Usos do rup o qual combina ao código ISO da língua 639-3.
simple Local name : Simple English
English name : Simple English
Language family : Germanic
Wikipedia, Wiktionary Usos de en do inglês comum.
zh-classical Local name : 文言
English name : Classical Chinese
Language family : Sinitic
Wikipedia O chinês clássico tem o codigo ISO 639-3 lzh.
zh-min-nan Local name : 閩南語 / Bân-lâm-gú
English name : Minnan
Language family : Sinitic
Wikipedia, Wiktionary, Wikibooks, Wikiquote, Wikisource O Min Nan tem o código ISO 639-3 nan.
zh-yue Local name : 粵語
English name : Cantonese
Language family : Sinitic
Wikipedia O cantonês tem o código ISO 639-3 yue.


  • All subdomains of wikimedia.org

Subdomains that do not conform to a valid ISO 639 language code

Subdomínio Idioma Projeto(s) Notas
als Local name : Alemannisch
English name : Alemannic
Language family : Germanic
Wikipedia, Wiktionary, Wikibooks, Wikiquote
Tracked in Phabricator:
Task T6793 stalled

Alemannic possui o código ISO 639-3 gsw. O código ISO 639-3 als é atribuído a Tosk Albanian.

bat-smg Local name : žemaitėška
English name : Samogitian
Language family : Baltic
Tracked in Phabricator:
Task T27522 stalled

Samogitian has the ISO 639 code sgs.

cbk-zam Local name : Chavacano de Zamboanga
English name : Chavacano de Zamboanga
Language family : Pidgin and Creole
Tracked in Phabricator:
Task T124657 stalled

Chavacano de Zamboanga has no ISO 639 code as an individual language. ISO 639-3 code cbk is assigned to Chavacano, a superset of Chavacano de Zamboanga.

eml Local name : emiliàn e rumagnòl
English name : Emilian-Romagnol
Language family : Italic
Tracked in Phabricator:
Task T36217 stalled

ISO 639-3 code eml for Emilian-Romagnol is now retired and split into egl (Emilian) and rgn (Romagnol).

fiu-vro Local name : võro
English name : Võro
Language family : Finno-Permic
Tracked in Phabricator:
Task T31186 stalled

Võro has ISO 639-3 code vro.

iu Local name : ᐃᓄᒃᑎᑐᑦ / inuktitut
English name : Inuktitut
Language family : Eskimo-Aleut
Wikipedia ISO 639 considers iu/iku not a single language, but a macrolanguage comprising ike and ikt. MediaWiki agrees (see phabricator), but: falls back to ike, called ike-cans; adds ike-latn; has no ikt support. CLDR considers Cans an aspirational script.
ksh Local name : Ripoarisch
English name : Ripuarian
Language family : Germanic
Wikipedia ISO 639-3 code ksh is assigned to Kölsch, a subset of Ripuarian.
map-bms Local name : Basa Banyumasan
English name : Banyumasan
Language family : Sunda-Sulawesi
Wikipedia Banyumasan has no ISO 639 code as an individual language. ISO 639-1 code jv/jav is assigned to Javanese, a superset of Banyumasan.
nds-nl Local name : Nedersaksies
English name : Dutch Low Saxon
Language family : Germanic
Wikipedia Duplicated with Low German's nds.
nrm Local name : Nouormand
English name : Norman
Language family : Italic
Tracked in Phabricator:
Task T25216 stalled

Norman has no ISO 639 code as an individual language (However, two dialects of Norman, Guernésiais and Jèrriais, are sharing ISO 639-3 code nrf). ISO 639-3 code nrm is assigned to Narom language instead. ISO 639-3 lumps Norman with French, as with most varieties of northern France.

roa-rup Local name : armãneashti
English name : Aromanian
Language family : Italic
Wikipedia, Wiktionary
Tracked in Phabricator:
Task T17988 stalled

Aromanian has ISO 639-3 code rup.

roa-tara Local name : tarandíne
English name : Tarantino
Language family : Italic
Wikipedia Tarantino has no ISO 639 code as an individual language. ISO 639-3 lumps it with Italian, as with most varieties of northern Italy.
sh Local name : srpskohrvatski / српскохрватски
English name : Serbo-Croatian
Language family : Slavic
Wikipedia, Wiktionary
Tracked in Phabricator:
Task T127680 stalled

sh was originally ISO 639-1 code for Serbo-Croatian but is no longer active. However, it remains a valid BCP 47 language tag. There is the ISO 639-3 code hbs for Serbo-Croatian. In CLDR aliases, sh maps to sr-Latn.

simple Local name : Simple English
English name : Simple English
Language family : Germanic
Wikipedia, Wiktionary
Tracked in Phabricator:
Task T110190 stalled

Simple English has no ISO 639 code but has a registered IETF variant subtag simple
No entanto, mesmo que o código simple seja válido como uma subtag padrão para BCP 47, porque ele só é registrado como uma subtag genérica para variantes de idioma para vários idiomas base como en-simple ou fr-simple (usar a subtag variante agora padrão é preferível ao uso de múltiplas subtags, incluindo uma extensão privada não registrada, como "en-x-simple"). Como uma tag simples, "simples" não significa nada no BCP 47 ou ISO 639 (já que não é uma linguagem simples).
Observe que, sob as regras da ISO 639, Inglês Simples é uma variante ou dialeto ou ortografia especial do inglês ( portanto, pode ser registrado como uma subtag variante do inglês, como "formal" ou informal "usado em alemão ou holandês), definido como um subconjunto para algum uso limitado. O banco de dados da IANA para o BCP 47 da IETF já indica isso e reconhece o BCP 47 os aplicativos não devem ter problemas para identificar o idioma como parte do inglês normal, desde que esteja devidamente marcado como "en-simple" e não apenas "simples".Além disso, o conteúdo da Wikipédia em inglês simples é difícil de avaliar se for está realmente em inglês "simples" ou apenas em inglês normal, já que NÃO existe um padrão para tal "simplicação", mas apenas uma decisão editorial da comunidade que não é realmente executável, exceto por algumas regras de apresentação. Por exemplo, não existe nenhum "inglês simples" ", e todos os usuários de "Inglês Simples" referem-se a dicionários normais de inglês. O inglês simples é apenas uma decisão estilística tomada por diferentes autores com diferentes preferências ou percepções do que é “simples” o suficiente para eles individualmente; na verdade, mesmo a Wikipédia em "Inglês Simples" poderia ser totalmente integrada na Wikipédia em inglês normal, através de uma melhor classificação de seu conteúdo ou do uso de portais decicados para algum público com compreensão limitada do inglês, e garantindo que a Wikipédia em inglês não entre em demasiado detalhes muito complexos sem separá-los em subpáginas ou seções detalhadas: deveria ser possível descrever qualquer tópico em termos mais simples antes de usar termos mais complexos que seriam definidos primeiro, usando regras didático-pedagógicas para ordenar esse conteúdo. E há opiniões diferentes sobre como simplificar o inglês, dependendo do público (para jovens? para falantes não nativos? para pessoas com deficiência? para algum país específico? As simplificações são as mesmas nos EUA, Canadá, Reino Unido, Austrália, África do Sul ou Índia?).

zh-classical Local name : 文言
English name : Classical Chinese
Language family : Sinitic
Tracked in Phabricator:
Task T10217 stalled
Tracked in Phabricator:
Task T30443 stalled

O chinês clássico tem o código ISO 639-3 lzh.

zh-min-nan Local name : 閩南語 / Bân-lâm-gú
English name : Minnan
Language family : Sinitic
Wikipedia, Wiktionary, Wikibooks, Wikiquote, Wikisource
Tracked in Phabricator:
Task T10217 stalled
Tracked in Phabricator:
Task T30442 stalled

O Min Nan tem o código ISO 639-3 nan.

zh-yue Local name : 粵語
English name : Cantonese
Language family : Sinitic
Tracked in Phabricator:
Task T10217 stalled
Tracked in Phabricator:
Task T30441 stalled

O cantonés tem o código ISO 639-3 yue.


  • tokipona.wikipedia.org (difunto)
  • ru-sib.wikipedia.org (difunto)
  • be-x-old.wikipedia.org (arranjado e redirigido a be-tarask.wikipedia.org, veja-se phab:T11823)
  • tokipona – defunct Wikipedia subdomain
  • ru-sib – defunct Wikipedia subdomain, hoax in fictional “Siberian” language
  • be-x-old – fixed and redirected to be-tarask Wikipedia subdomain (see phab:T11823)


Subdomínio Idioma Projeto(s) Notas
ms Local name : Bahasa Melayu
English name : Malay
Language family : Sunda-Sulawesi
Wikipedia, Wikibooks, Wiktionary Malay language used to be "ms", just like Indonesian language is "id", but since the Malay Wikipedia inception, the code "ms" has become the code for macro language (not individual language).

There are many individual languages under "ms"/"msa", including Indonesian ("id"/"ind"), Banjar ("bjn"), Minang ("min"), three living languages with their own Wikimedia projects, as well as Malay (individual language) ("mly"-Deprecated 2008 or "zlm"-Malay or "zsm"-Standard Malay / Malaysian Malay / Malaysian language)

It should be noted that the creation of Malay Wikipedia, Wikibooks, and Wiktionary all predates the change in the language code in 18 February 2008, with the latest one, Malay Wikibooks, created on 24 August 2004.

See also:

ak Local name : ak
English name : Akan
Language family : Niger-Congo
Closed : Wikibooks, Wiktionary

Are these two sets of wikis in the same language? See Wikipedia article.

Note that this situation is quite similar to the artificial distinction between Luxembourgish and Moselle Franconian, or between Serbian, Croatian and Bosnian: they are also clusters of dialects of the same mutually intelligible base language with just minor differences (for terminology choice or their preferred orthography, but multiple orthographies exist for all these dialects). It's hard (and in fact impossible) to make a real distinction at linguistic level, this is purely an ethnopolitical distinction and native speakers in one region going to the other region where the other dialect cluster is referred by a different name will be known there to use the other cluster name and will speak/write without more problems than in their origin ethopolitical community. This adaptation also occurs within each cluster, based on social interaction or level of formality (e.g. in religion, or for prestige, or for vernacular speech and jargons in the street or used by younger or less educated people).
tw Local name : Twi
English name : Twi
Language family : Niger-Congo
Closed : Wiktionary
de-formal Local name : Deutsch
English name : German
Language family : Germanic
Not used as host names but included as pseudo-variant subtags (unregistered) for some translations in translatewiki.net (used in Meta-Wiki for pages like policies when refering directly to wiki users according to their preferences): we should have used a private-use extension
nl-informal Local name : Nederlands
English name : Dutch
Language family : Germanic

Technical language code

The special language code qqx can be used to display the ids of all system messages used on a page.

Ver também