Code point
Ein Codepunkt ist eine Zahl, die verwendet wird, um ein abstraktes Zeichen in einem System zur Darstellung von Text (wie Unicode) zu repräsentieren. In Unicode wird ein Codepunkt in der Form "U+1234" ausgedrückt, wobei "1234" die zugeordnete Zahl ist. Zum Beispiel hat das Zeichen "A" den Codepunkt U+0041.
Zeichencodierungsformen, wie UTF-8 und UTF-16, bestimmen, wie ein Unicode-Codepunkt als eine Folge von Bytes codiert werden soll. Verschiedene Codierungsformen können denselben Codepunkt als verschiedene Bytesequenzen codieren: beispielsweise wird das kyrillische Zeichen "Ф", dessen Codepunkt U+0424 ist, in UTF-8 als 0xd0a4
und in UTF-16 als 0x0424
kodiert.