Unicode карактери
Карактери енглеског алфабета, цифре од 0
до 9
, основни интерпункцијски карактери, математички оператори и основни контролни карактери имају исте кодне вредности у Unicode и ASCII коду. Unicode табелу можеш пронаћи на веб-сајту wikipedia.org или многим другим веб-сајтовима.
Ако желиш да користиш латинична и ћирилична слова у конзоли, потребно је да дефинишеш кодирање улаза и/или излаза конзоле на следећи начин:
Console.InputEncoding = Encoding.UTF8; // kodiranje ulaza
Console.OutputEncoding = Encoding.UTF8; // kodiranje izlaza
Латинични карактери српске азбуке
Специфични латинични карактери српске азбуке дефинисани су на следећи начин:
Кôд | Симбол | Декадно |
---|---|---|
U+0106 | Ć | 262 |
U+0107 | ć | 263 |
U+010C | Č | 268 |
U+010D | č | 269 |
U+0110 | Đ | 272 |
U+0111 | đ | 273 |
U+0160 | Š | 288 |
U+0161 | š | 289 |
U+017D | Ž | 381 |
U+017E | ž | 382 |
Дефинисана су и слова која се пишу са два карактера:
Кôд | Симбол | Декадно |
---|---|---|
U+01C4 | DŽ | 452 |
U+01C5 | Dž | 453 |
U+01C6 | dž | 454 |
U+01C7 | LJ | 455 |
U+01C8 | Lj | 456 |
U+01C9 | lj | 457 |
U+01CA | NJ | 458 |
U+01CB | Nj | 459 |
U+01CC | nj | 460 |
Ћирилични карактери српске азбуке
Ћирилични карактери српске азбуке дефинисани су на следећи начин:
Кôд | Симбол | Декадно |
---|---|---|
U+0410 | А | 1040 |
U+0411 | Б | 1041 |
U+0412 | В | 1042 |
U+0413 | Г | 1043 |
U+0414 | Д | 1044 |
U+0402 | Ђ | 1026 |
U+0415 | Е | 1045 |
U+0416 | Ж | 1046 |
U+0417 | З | 1047 |
U+0418 | И | 1048 |
U+0408 | Ј | 1032 |
U+041A | К | 1050 |
U+041B | Л | 1051 |
U+0409 | Љ | 1033 |
U+041C | М | 1052 |
U+041D | Н | 1053 |
U+040A | Њ | 1034 |
U+041E | О | 1054 |
U+041F | П | 1055 |
U+0420 | Р | 1056 |
U+0421 | С | 1057 |
U+0422 | Т | 1058 |
U+040B | Ћ | 1035 |
U+0423 | У | 1059 |
U+0424 | Ф | 1060 |
U+0425 | Х | 1061 |
U+0426 | Ц | 1062 |
U+0427 | Ч | 1063 |
U+040F | Џ | 1039 |
U+0428 | Ш | 1064 |
U+0430 | а | 1072 |
U+0431 | б | 1073 |
U+0432 | в | 1074 |
U+0433 | г | 1075 |
U+0434 | д | 1076 |
U+0452 | ђ | 1106 |
U+0435 | е | 1077 |
U+0436 | ж | 1078 |
U+0437 | з | 1079 |
U+0438 | и | 1080 |
U+0458 | ј | 1112 |
U+043A | к | 1082 |
U+043B | л | 1083 |
U+0459 | љ | 1113 |
U+043C | м | 1084 |
U+043D | н | 1085 |
U+045A | њ | 1114 |
U+043E | о | 1086 |
U+043F | п | 1087 |
U+0440 | р | 1088 |
U+0441 | с | 1089 |
U+0442 | т | 1090 |
U+045B | ћ | 1115 |
U+0443 | у | 1091 |
U+0444 | ф | 1092 |
U+0445 | х | 1093 |
U+0446 | ц | 1094 |
U+0447 | ч | 1095 |
U+045F | џ | 1119 |
U+0448 | ш | 1096 |
Иако изгледа да су нека слова енглеског алфабета (латинична) и ћирилична слова иста, њихове Unicode кодне вредности се разликују. На пример, латинично велико слово A
кодирано је са U+0041
, док је ћирилично велико слово А
кодирано са U+0410
.