Иди на текст

Unicode карактери

Карактери енглеског алфабета, цифре од 0 до 9, основни интерпункцијски карактери, математички оператори и основни контролни карактери имају исте кодне вредности у Unicode и ASCII коду. Unicode табелу можеш пронаћи на веб-сајту wikipedia.org или многим другим веб-сајтовима.

Ако желиш да користиш латинична и ћирилична слова у конзоли, потребно је да дефинишеш кодирање улаза и/или излаза конзоле на следећи начин:

Console.InputEncoding = Encoding.UTF8;     // kodiranje ulaza
Console.OutputEncoding = Encoding.UTF8;    // kodiranje izlaza

Латинични карактери српске азбуке

Специфични латинични карактери српске азбуке дефинисани су на следећи начин:

Кôд Симбол Декадно
U+0106 Ć 262
U+0107 ć 263
U+010C Č 268
U+010D č 269
U+0110 Đ 272
U+0111 đ 273
U+0160 Š 288
U+0161 š 289
U+017D Ž 381
U+017E ž 382

Дефинисана су и слова која се пишу са два карактера:

Кôд Симбол Декадно
U+01C4 DŽ 452
U+01C5 Dž 453
U+01C6 dž 454
U+01C7 LJ 455
U+01C8 Lj 456
U+01C9 lj 457
U+01CA NJ 458
U+01CB Nj 459
U+01CC nj 460

Ћирилични карактери српске азбуке

Ћирилични карактери српске азбуке дефинисани су на следећи начин:

Кôд Симбол Декадно
U+0410 А 1040
U+0411 Б 1041
U+0412 В 1042
U+0413 Г 1043
U+0414 Д 1044
U+0402 Ђ 1026
U+0415 Е 1045
U+0416 Ж 1046
U+0417 З 1047
U+0418 И 1048
U+0408 Ј 1032
U+041A К 1050
U+041B Л 1051
U+0409 Љ 1033
U+041C М 1052
U+041D Н 1053
U+040A Њ 1034
U+041E О 1054
U+041F П 1055
U+0420 Р 1056
U+0421 С 1057
U+0422 Т 1058
U+040B Ћ 1035
U+0423 У 1059
U+0424 Ф 1060
U+0425 Х 1061
U+0426 Ц 1062
U+0427 Ч 1063
U+040F Џ 1039
U+0428 Ш 1064
U+0430 а 1072
U+0431 б 1073
U+0432 в 1074
U+0433 г 1075
U+0434 д 1076
U+0452 ђ 1106
U+0435 е 1077
U+0436 ж 1078
U+0437 з 1079
U+0438 и 1080
U+0458 ј 1112
U+043A к 1082
U+043B л 1083
U+0459 љ 1113
U+043C м 1084
U+043D н 1085
U+045A њ 1114
U+043E о 1086
U+043F п 1087
U+0440 р 1088
U+0441 с 1089
U+0442 т 1090
U+045B ћ 1115
U+0443 у 1091
U+0444 ф 1092
U+0445 х 1093
U+0446 ц 1094
U+0447 ч 1095
U+045F џ 1119
U+0448 ш 1096

Иако изгледа да су нека слова енглеског алфабета (латинична) и ћирилична слова иста, њихове Unicode кодне вредности се разликују. На пример, латинично велико слово A кодирано је са U+0041, док је ћирилично велико слово А кодирано са U+0410.