/ / Gibt es einen ISO-Sprachcode für gemischten Text? - nlp, iso

Gibt es einen ISO-Sprachcode für gemischten Text? - nlp, iso

Ich habe das überprüft ISO 639-1-Spezifikationen Ich kann aber keine Referenzen finden. Ich kann mir nur etwas für meine Datenbank ausdenken, war aber neugierig, ob es einen Standard gibt.

Update 2012-02-26: Am Ende habe ich einen speziellen Eintrag in meiner Sprachtabelle mit einem Stern (*) als Ländercode erstellt, den ich jetzt verwende, um Einträge in keiner Sprache darzustellen.

Antworten:

2 für die Antwort № 1

Es gibt einige Vorrang bei der Verwendung von Kommas beim Speichern mehrerer ISO-Sprachcodes, aber für einen Datenbankeintrag könnte eine andere Tabelle verwendet werdenSeien Sie beim Speichern solcher Metadaten (oder sogar der Daten selbst zusammen mit ihrem Sprachcode, wenn sie auf Absatz- oder sogar auf Satzebene partitioniert werden können) umsichtig, um eine solche Beziehung zwischen mehreren Personen darzustellen.

Wenn Sie sich darauf beziehen KollationWenn Sie mit mehreren Sprachen zu tun haben, ist es am besten, den Text in eine zu konvertieren Unicode Zeichensatz, den Ihre Datenbank unterstützt, und speichern Sie mehrsprachigen Text in diesem Format.


2 für die Antwort № 2

ISO 639-2 und ISO 639-3 reservierte den Code mul für Dokumente, die mehrere Sprachen enthalten.

Apropos, IETF BCP 47 ist derzeit das maßgeblichste Dokument zur Verwendung von Sprachcodes.