КОІ-8

КОІ-8 (код обміну інформацією, 8 бітів; рос. КОИ-8) — восьмибітова ASCII-сумісна кодова таблиця, розроблена для кодування букв кириличних алфавітів.

Існує також семибітова версія кодування, не повністю сумісна з ASCII — КОІ-7. КОІ-7 і КОІ-8 описані в ГОСТ 19768-74 (зараз нечинний).

Ідея

Розробники КОІ-8 помістили символи російського алфавіту у верхній частині кодової таблиці таким чином, що позиції кириличних символів відповідають їхнім фонетичним аналогам в англійському алфавіті, в нижній частині таблиці. Це означає, що якщо в тексті, закодованому КОІ-8, прибрати восьмий біт кожного символу, то вийде прочитний текст, хоча й записаний латинськими символами. Наприклад, слова «Русский Текст» перетворяться на «rUSSKIJ tEKST». Як наслідок, символи кирилиці в таблиці виявилися розташованими не в алфавітному порядку.

Існує декілька варіантів кодування КОІ-8 для різних кириличних алфавітів. Російський алфавіт описується в кодуванні KOI8-R, український — у KOI8-U. KOI8-R став фактично стандартом для російської кирилиці в юнікс-подібних операційних системах і електронній пошті.

Андрій Чернов створив документ RFC 1489 («Registration of а Cyrillic Character Set»), який, проте, не належить до категорії RFC-стандартів. Існує RFC 2319 на KOI8-U.

RFC-2319. Стандарт кодування української мови сформований у RFC. Створено ініціативною групою - Павло Гульчук, Юрко Демченко, Євген Шерстобітов, Борис Мостовий, Ігор Романенко, Олександр Єременко, Андрій Стесін.[1]

За набором символів KOI8-R відповідає одному з варіантів альтернативного кодування. Стандарт RFC 1489 також стверджує наявність графічних символів «рамок» (псевдографіки), проте ця вимога виконується досить рідко.

Нижня частина таблиці кодування (латиниця) повністю відповідає кодуванню ASCII.

Кодування KOI8-R (російське)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
 
8−
 

2500

2502

250C

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588

258C

2590
 
9−
 

2591

2592

2593

2320

25A0

2219

221A

2248

2264

2265
 
A0

2321
°
B0
²
B2
·
B7
÷
F7
 
A−
 

2550

2551

2552
ё
451

2553

2554

2555

2556

2557

2558

2559

255A

255B

255C

255D

255E
 
B−
 

255F

2560

2561
Ё
401

2562

2563

2564

2565

2566

2567

2568

2569

256A

256B

256C
©
A9
 
C−
 
ю
44E
а
430
б
431
ц
446
д
434
е
435
ф
444
г
433
х
445
и
438
й
439
к
43A
л
43B
м
43C
н
43D
о
43E
 
D−
 
п
43F
я
44F
р
440
с
441
т
442
у
443
ж
436
в
432
ь
44C
ы
44B
з
437
ш
448
э
44D
щ
449
ч
447
ъ
44A
 
E−
 
Ю
42E
А
410
Б
411
Ц
426
Д
414
Е
415
Ф
424
Г
413
Х
425
И
418
Й
419
К
41A
Л
41B
М
41C
Н
41D
О
41E
 
F−
 
П
41F
Я
42F
Р
420
С
421
Т
422
У
423
Ж
416
В
412
Ь
42C
Ы
42B
З
417
Ш
428
Э
42D
Щ
429
Ч
427
Ъ
42A

Інші варіанти

показані лише неоднакові рядки таблиць, оскільки решта збігається

Кодування KOI8-U (українське)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
 
A−
 

2550

2551

2552
ё
451
є
454

2554
і
456
ї
457

2557

2558

2559

255A

255B
ґ
491

255D

255E
 
B−
 

255F

2560

2561
Ё
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A
Ґ
490

256C
©
A9

Кодування KOI8-RU (російсько-українсько-білоруське)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
 
A−
 

2550

2551

2552
ё
451
є
454

2554
і
456
ї
457

2557

2558

2559

255A

255B
ґ
491
ў
45E

255E
 
B−
 

255F

2560

2561
Ё
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A
Ґ
490
Ў
40E
©
A9

Кодування KOI8-C (кавказьке)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. ғ
493
җ
497
қ
49B
ҝ
49D
ң
4A3
ү
4AF
ұ
4B1
ҳ
4B3
ҷ
4B7
ҹ
4B9
һ
4BB

2580
ҝ
49D
ӣ
4E3
ө
4E9
ӯ
4EF
9. Ғ
492
Җ
496
Қ
49A
Ҝ
49C
Ң
4A2
Ү
4AE
Ұ
4B0
Ҳ
4B2
Ҷ
4B6
Ҹ
4B8
Һ
4BA

2321
Ә
4D8
Ӣ
4E2
Ө
4E8
Ӯ
4EE
A.  
A0
ђ
452
ѓ
453
ё
451
є
454
ѕ
455
і
456
ї
457
ј
458
љ
459
њ
45A
ћ
45B
ќ
45C
ґ
491
ў
45E
џ
45F
B.
2116
Ђ
402
Ѓ
403
Ё
401
Є
404
Ѕ
405
І
406
Ї
407
Ј
408
Љ
409
Њ
40A
Ћ
40B
Ќ
40C
Ґ
490
Ў
40E
Џ
40F

Кодування KOI8-T (таджицьке)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. қ
49B
ғ
493

201A
Ғ
492

201E

2026

2020

2021
 
2030
ҳ
4B3

2039
Ҳ
4B2
ҷ
4B7
Ҷ
4B6
 
9. Қ
49A

2018

2019

201C

201D

2022

2013

2014
 
2122
 
203A
       
A.   ӯ
4EF
Ӯ
4EE
ё
451
¤
A4
ӣ
4E3
¦
A6
§
A7
      «
AB
¬
AC
­
AD
®
AE
 
B. °
B0
±
B1
²
B2
Ё
401
  Ӣ
4E2

B6
·
B7
 
2116
  »
BB
      ©
A9

Кодування KOI8-O, KOI8-C (старослов'янська орфографія)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
 
8−
 
Ђ
0402
Ѓ
0403
¸
00B8
ѓ
0453

201E

2026

2020
§
00A7

20AC
¨
00A8
Љ
0409

2039
Њ
040A
Ќ
040C
Ћ
040B
Џ
040F
 
9−
 
ђ
0452

2018

2019

201C

201D

2022

2013

2014
£
00A3
·
00B7
љ
0459

203A
њ
045A
ќ
045C
ћ
045B
џ
045F
 
A−
 
 
00A0
ѵ
0475
ѣ
0463
ё
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
®
00AE

2122
«
00AB
ѳ
0473
ґ
0491
ў
045E
´
00B4
 
B−
 
°
00B0
Ѵ
0474
Ѣ
0462
Ё
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408

2116
¢
00A2
»
00BB
Ѳ
0472
Ґ
0490
Ў
040E
©
00A9

Кодування ISO-IR-111, koi8-e

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
 
A−
 
 
00A0
ђ
0452
ѓ
0453
ё
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
­
00AD
ў
045E
џ
045F
 
B−
 

2116
Ђ
0402
Ѓ
0403
Ё
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
¤
00A4
Ў
040E
Џ
040F

Кодування KOI8-Unified, koi8-f

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
 
8−
 

2500

2502

250C

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588

258C

2590
 
9−
 

2591

2018

2019

201C

201D

2022

2013

2014
©
00A9

2122
 
00A0
»
00BB
®
00AE
«
00AB
·
00B7
¤
00A4
 
A−
 
 
00A0
ђ
0452
ѓ
0453
ё
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
ґ
0491
ў
045E
џ
045F
 
B−
 

2116
Ђ
0402
Ѓ
0403
Ё
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
Ґ
0490
Ў
040E
Џ
040F

Некириличні варіанти KOI-8

В деяких країнах РЕВ були створені модифікації КОІ-8 для національних варіантів латиниці. Базова ідея була та ж сама : при «зрізанні» восьмого біта текст мав лишатися більш-менш зрозумілим. Наприклад, в чеському варіанті КОІ-8 букви Čč повинні перетворюватися на cC, Žž — на zZ тощо. В наш час[коли?] ці кодування не використовуються.

Див. також

Примітки

  1. KOI8-U: Як це було. Архів оригіналу за 23 травня 2017. Процитовано 22 січня 2017. 

Посилання