Kodierungen

Computer arbeiten mit Zahlen und alle Zeichen in einem Dokument werden intern durch Zahlen repräsentiert. Die Kodierung bestimmt, welche Zahl für welches Zeichen steht. Unter Windows wird die Kodierung durch eine ID bestimmt.

Verschiedene Systeme (DOS-PCs, Windows-PCs, Apple-Computer, World Wide Web) verwenden teils unterschiedliche Kodierungen und es ist wichtig zu wissen, in welcher Kodierung ein Dokument vorliegt, da sonst i.d.R. Buchstabensalat angezeigt wird, wenn für die Anzeige des Dokuments die falsche Kodierung gewählt wird.

Eine Besonderheit stellt Unicode (manchmal UCS, Universal Coded Character Set genannt) dar. Das Unicode-Projekt hat das Ziel, sämtliche Zeichen aller Sprachen und alle Symbole zu kodieren. Aufgrund der sehr großen Anzahl werden die Kodes in Unicode aus Effizienzgründen abhängig von der Kodierung unterschiedlich in Zahlenfolgen übersetzt. Die wichtigsten Kodierungen sind UTF-16 LE unter Windows und UTF-8 im Web und für Gedcom-Dateien.

Die wichtigsten Kodierungen für AGS sind in der folgenden Tabelle aufgeführt:

KodierungIDVerwendung
ANSI - Lateinisch I1252Standardkodierung unter Windows in Mitteleuropa, verpflichtend für RTF-Dateien
UTF-16 LE1200Unicode, Standardkodierung unter Windows
UTF-865001Unicode, häufig im Web, Gedcom-Dateien
US-ASCII201277-bit, Buchstaben, Ziffern und einige Sonderzeichen
OEM437DOS (US-amerikanische Kodeseite), Omega
ANSEL-Gedcom-Dateien
ISO 8859-1 Lateinisch I28591Standardkodierung unter Unix in Mitteleuropa
MAC - Romanisch10000Apple-Computer

AGS detektiert Unicode i.d.R. automatisch und nimmt ansonsten ANSI als Kodierung einer Datei an. Bei der Erstellung von Omega-5-Auswertungen werden diese automatisch als OEM-kodiert erkannt. Beim Import von Gedcom-Dateien wird die Kodierung aus der Gedcom-Datei gelesen.

Sie können folgende Faustregeln verwenden, um die Kodierung einer Datei zu erraten:

Verwenden Sie bitte wo es geht Unicode für Ihre Dokumente, weil damit sämtliche Zeichen inklusive der genealogischen Sonderzeichen dargestellt werden.

Textdokumente (Notizen, Gedcom-Dateien, ...) können in unterschiedlichen Kodierungen vorliegen. Der Editor und der Gedcom-Import-Assistent erkennen die Kodierung der Dokumente meist selbständig. Im unteren Bereich des Datei-öffnen-Dialogs können Sie die Kodierung der zu öffnenden Datei aber auch einstellen, wenn Sie diese kennen. Üblicherweise ist die Auswahl für die Kodierung mit ? vorbelegt, wodurch die Kodierung vom Programm erraten wird.

Verweise

Liste aller Windows-Kodierungen
Unicode in der Wikipedia