Поскольку я выполнил определённую работу по украинизации моих компьютеров (с 1992 года), я хочу собрать все её части воедино. Посмотрите также на моей странице проектов несколько пакетов для украинизации различных програм.
Итак существует несколько кодировок для украинского языка, наиболее важные из которых перечислены ниже.
RUSCII, определена в РСТ 2018-91.
Также известна как CP1125.
Это стандартная кодировка для DOS и OS/2. Вы можете загрузить мой пакет для
украинизации DOS (dos4ua.zip, 14 kb)
или экранные шрифты для этой кодировки
(8x8, 8x14, 8x16 точек).
Поскольку консоль Win32 также использует DOS кодировку, вы можете загрузить
CP1125 экранные шрифты для консольных программ,
исполняемых в окне (vgaoem.fon, 8514.fon, dosapp.fon; 18 kb).
KOI8-U, определена в RFC 2319
Это наиболее популярный стандарт для юникса и транспортная кодировка по
умолчанию для интернетовской почты и групп новостей.
CP1251, определена MicroSoft, Inc.
Это стандартная кодировка для семейства ОС MS Windows, содержащая белорусские,
русские и украинские символы. Вы можете загрузить мой пакет с клавиатурными
раскладками для русских и украинских букв для MS Windows 3.1*
(win4ua.zip, 14 kb) и для MS Windows 95
(w954ua.zip, 3 kb). На моей странице
проектов вы можете найти пакеты для поддержки
украинского в некоторых Win* программах.
MAC Ukrainian, определена Apple, Inc.
К сожалению, у меня нет компьютеров фирмы Apple, поэтому я не могу сказать
ничего большего о ней.
Вы также можете посмотреть на другие кодировки кирилицы:
- CP866, стандартная кодировка DOS в России. Включает белорусскую 'краткое У' и украинские 'ЙЕ', 'ЙИ'; но не имеет белорусско-украинской 'И' и украинской 'Г твёрдое'. Поэтому, эта кодировка непригодна для серьёзной работы с украинским языком.
- KOI8-R, стандартная кодировка юникс в России. Смотрите больше о ней на странице Ache (Андрея Чернова).
- KOI8-RU, вариация от MicroSoft на тему KOI8-U, включает белорусскую 'краткое У'.
- ISO 8859-5 (известна также как GOST 19768-74), старый стандарт Советского Союза, используется на машинах Sun.
- KOI-7, одна из первых кодировок кирилицы, использует только 7 бит, поэтому не содержит латинских букв. Имеет вариант не содержащий строчных русских символов, вместо них в позициях 0x40-0x5f заглавные латинские символы. Некоторые терминалы позволяют переключать эти варианты.
- ASCII, Американский Стандартный Код Информационного Обмена, 7-ми битный. Все вышеперечисленные кодировки кирилицы (кроме KOI-7) используют его в нижней половине таблицы символов.
Я использовал информацию со страницы Fingertip Software Cyrillic Character Sets и страницы Roman Czyborra The Cyrillic Charset Soup.