BCP 47 Sprach-Tag
Ein BCP 47 Sprach-Tag ist eine Zeichenfolge, die eine menschliche Sprache genau spezifiziert, einschließlich der grundlegenden Sprache, aber optional auch des Schriftsystems und des Dialekts. Zum Beispiel spezifiziert en
Englisch, während en-GB
und en-US
genauer Britisches Englisch bzw. Amerikanisches Englisch spezifizieren.
BCP 47 Sprach-Tags werden überall dort auf der Webplattform verwendet, wo eine Funktion designed wurde, um unterschiedliche Ergebnisse je nach angegebener Sprache auszugeben, was die Internationalisierung unterstützt.
Beispiele umfassen:
- Das HTML-Attribut
lang
- Das HTML-Element
<track>
- Das Objekt
Temporal
- Die Eigenschaft
CanvasRenderingContext2D.lang
- Die Translator and Language Detector APIs
BCP 47 Syntax
Die vollständige BCP 47 Syntax ist in RFC 5646 spezifiziert. Sie ist in der Lage, äußerst spezifische Sprachdialekte zu identifizieren, aber die meisten Anwendungen sind viel einfacher.
Ein Sprach-Tag besteht aus durch Bindestriche getrennten Subtags, wobei jedes Subtag eine bestimmte Eigenschaft der Sprache angibt. Die drei häufigsten Subtags sind:
- Sprach-Subtag
-
Ein 2- oder 3-stelliger Code, der die grundlegende Sprache definiert, typischerweise in Kleinbuchstaben geschrieben. Zum Beispiel ist der Sprachcode für Englisch
en
, und der Code für Badeshi istbdz
. - Schrift-Subtag Optional
-
Dieses Subtag definiert das für die Sprache verwendete Schriftsystem und ist immer 4 Zeichen lang, wobei der erste Buchstabe großgeschrieben ist. Zum Beispiel ist Französisch in Braille
fr-Brai
und Japanisch, geschrieben mit dem Katakana-Alphabet,ja-Kana
.Hinweis: Wenn die Sprache auf eine sehr typische Weise geschrieben wird, wie Englisch im lateinischen Alphabet, ist es nicht notwendig, dieses Subtag zu verwenden.
- Regions-Subtag Optional
-
Dieses Subtag definiert einen Dialekt der Basissprache aus einem bestimmten Ort und besteht entweder aus zwei Großbuchstaben, die einem Ländercode entsprechen, oder drei Zahlen, die einem nicht landgebundenen Gebiet entsprechen. Zum Beispiel steht
es-ES
für Spanisch, wie es in Spanien gesprochen wird, undes-013
steht für Spanisch, wie es in Zentralamerika gesprochen wird. "Internationales Spanisch" wäre einfaches
.
Das Schrift-Subtag geht dem Regions-Subtag voraus, wenn beide vorhanden sind — ru-Cyrl-BY
ist Russisch, geschrieben im kyrillischen Alphabet, wie es in Weißrussland gesprochen wird.
Siehe auch
- RFC 5646: Tags for Identifying Languages: wo BCP 47 Sprach-Tags spezifiziert sind.
- BCP 47 language subtag lookup: Suche nach Subtag-Codes für eine Sprache.