<абвгдеёжзийклмнопрстуфхчшщъыьэюяАБВГДЕЁЖЗИЙКЛМНОПРСТУФХЧШЩЪЫЬЭЮЯ
>abvgdeoxzijklmnoprstufhcwwjyjeuqABVGDEOXZIJKLMNOPRSTUFHCWWJYJEUQ
// выше даны замены по дефолту, они работают в последнюю очередь
// знаки <> в первых байтах нужно указывать только для html,
// чтобы не менялось содержимое тегов;
// иначе поставь в первых байтах первых двух строк точки
// буквы 'ц' и 'щ' - особый случай, используем диграфы
ц:ts
щ-R(иеИЕ):wj
// мягкий знак сохраняем в разделительной функции
// и там где он реально смягчает
ь+L(щЩ):
ь+L(шжчлШЖЧЛ)-R(аяуюоёэеиыАЯУЮОЁЭЕИЫ):
// окончания возвратных глаголов упрощаем
ться+R(\r\n .,?!:;`'"([{}]\)):tsa
ся+R(\r\n .,?!:;`'"([{}]\)):sa
// упрощаем написание окончаний (прилагательных в основном)
ая+R(\r\n .,?!:;`'"([{}]\)):a
яя+R(\r\n .,?!:;`'"([{}]\)):q
ую+R(\r\n .,?!:;`'"([{}]\)):u
юю+R(\r\n .,?!:;`'"([{}]\)):ju
ий+R(\r\n .,?!:;`'"([{}]\)):i
ый+R(\r\n .,?!:;`'"([{}]\)):y
// гласные после фиксированной мягкости/твёрдости
ю-L(шжщчлийьъШЖЩЧЛИЙЬЪ):ju
ё-L(шжщчлийьъШЖЩЧЛИЙЬЪ):jo
я+L(шжщчлийьъШЖЩЧЛИЙЬЪ):a
и+L(шШ):y
// то же самое, но для больших букв
Ц:TS
Щ-R(иеИЕ):WJ
Ь+L(щЩ):
Ь+L(шжчлШЖЧЛ)-R(аяуюоёэеиыАЯУЮОЁЭЕИЫ):
ТЬСЯ+R(\r\n .,?!:;`'"([{}]\)):TSA
СЯ+R(\r\n .,?!:;`'"([{}]\)):SA
AЯ+R(\r\n .,?!:;`'"([{}]\)):A
ЯЯ+R(\r\n .,?!:;`'"([{}]\)):Q
УЮ+R(\r\n .,?!:;`'"([{}]\)):U
ЮЮ+R(\r\n .,?!:;`'"([{}]\)):JU
ИЙ+R(\r\n .,?!:;`'"([{}]\)):I
ЫЙ+R(\r\n .,?!:;`'"([{}]\)):Y
Ю-L(шжщчлийьъШЖЩЧЛИЙЬЪ):JU
Ё-L(шжщчлийьъШЖЩЧЛИЙЬЪ):JO
Я+L(шжщчлийьъШЖЩЧЛИЙЬЪ):A
И+L(шШ):Y
---
/*
Николай Михайленко
http://mi.anihost.ru/rv4.htm
RV4 - сверхэкономный транслит
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Как передать русское звучание латинскими буквами ?
Чтобы полученный код был компактен, хорошо смотрелся и легко читался ?
Русских букв 33, а латинских всего 26. Задачка !
Vot idealnoe rewenie, esli prostoj obratimosti koda ne trebuetsa
Optimalnoe rewenie dla SMS, dla fajlovoj sistemy
i dla kommentariev po-russki
Обычно при записи русского текста латинскими буквами объём текста
заметно возрастает
Но если _не_ требуется легко обратимая передача _napisania_ слов, то
_zvucanie_ русских слов можно передать, не увеличивая длины текста
Соответствия для большинства русских и латинских букв очевидны:
Гласные (работают голосовые связки)
Е А О - И Ы У
E A O - I Y U
Сонанты (голос преобладает над шумом)
Р Л - Н М
R L - N M
Губные (губа-губа, зубы-губа)
Б П - В Ф
B P - V F
Переднеязычные (взрывные - щелевые)
Д Т - С З
D T - S Z
Заднеязычные
К Г Х
K G H
Распределение остальных букв не столь очевидно ...
Русскую букву 'ш' изобразим латинской 'w' (очевидное графическое сходство)
Аналогично, 'ж' изобразим латинской 'x' (нет только вертикальной черты)
'я' ---------"--------- 'q' (не хватает только ножки спереди)
Буква "мягкий знак" ставится _только_ после согласных, а буква Й _никогда_
не встречается в такой позиции. Поэтому в обоих случаях я рекомендую
латинскую J. Мягкий знак - это очень короткая 'И'. Произнесите несколько
раз слово "КОНИ" сокращая длительность гласной 'И', в итоге получится "КОНЬ"
Далее, сравните, "подъезд" и "подьезд" - разница не чувствительна.
Твёрдый знак также отобразим латинской J.
Русская буква Ц обычно передаётся латинской 'C', но будет правильнее
зарезервировать латинскую 'C' за русской 'Ч' (на итальянский манер),
ибо 'Ч' гораздо частотнее 'Ц'
Сравнительно редкую русскую букву 'Э' можно отождествить с частотной 'Е'
и представлять латинской 'E' (etot poet)
Осталось разобраться с четырьмя малочастотными русскими буквами Ю, Ё, Ц, Щ.
Проблема в том, что мы уже исчерпали _все_ латинские буквы
Можно использовать традиционные диграфы: Ю=JU, Ё=JO, Ц=TS.
А для Щ(ШЬШЬ) использовать диграф WJ, поскольку Ш=W, а Ь=J
В результате получается такая табличка замен русских букв латинскими:
а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я
a b v g d e jo x z i j k l m n o p r s t u f h ts c w wj j y j e ju q
е - э = e, traditsionno
ъ - ь - й = j, kratkoe i
ш = w, qvnoe graficeskoе shodstvo
ж = x, net liw vertikali poseredine
я = q, tolko bez perednej noxki
Согласные
~~~~~~~~~
Х = H (hirurg, nahal)
Й = J (kraj, rajon) - kak v latinskom
Ш = W (wapka, wywka) - estj graficeskoe shodstvo
Ж = X (xopa, xir, poxar)
Щ = WJ (wjavel, borwj)
Ц = TS (tsarj, tablitsa)
Ч = C (casto, molca) - bukva Ч castotnee, cem Ц
Мягкий и твёрдый знаки
~~~~~~~~~~~~~~~~~~~~~~
Ь = J (konj, borjba)
Ъ = J (podjezd, objekt) - znaki otoxdestvlaem
Гласные
~~~~~~~
Э = E (etot poet)
Я = Q (qbloko, ponqtie)
Ё = Jo (jolka, sjola)
Ю = Ju (junostj, tjurma)
Текст можно сделать ещё компактнее и понятнее, если ввести упрощённую
орфографию для русского языка.
Скажем, не писать мягкий знак после шипящих на конце слов,
и считать букву 'Л' мягкой и писать после неё гласные без йотировки
Прочтите: noc dla lubvi
Правила сокращения
~~~~~~~~~~~~~~~~~~
1) После "Ш, Ж, Ч, Щ, Л" и "И, Й, Ь, Ъ" йотировка с гласных "Я, Ю, Ё"
снимается:
Я = A (dla, konjak, Maria)
Ё = O (Korolov, Hruwjov, Muravjov)
Ю = U (lubovj, parawut, Iunj)
2) После "Ш, Ж, Ч, Щ, Л" на конце слова, а также перед _согласными_,
опускается мягкий знак
(brow, mowj, drox, noc, bol, palto; но nocju, bolju)
3) В соответствии с произношением мы заменяем "ши" на "wy", a ne "wi"!
Для некоторых сочетаний буквы 'Щ' принимаем упрощённую транслитерацию:
ще=we, щи=wi.
(wywka, mywy, walaw, westj; wjavel, ewjo, powjada, welcok, wi, mowju)
4) Окончания -ТЬСЯ и -ТСЯ пишутся, как произносятся - TSA
(moetsa, mytsa - подсмотрено у БИ ЛАЙН)
-СЯ пишется -SA
(mylsa, maqlsa)
5) Допускается просторечное написание окончаний:
-АЯ -> -А (druxna semja) (NB: semja - семья; semq - семя)
-ЯЯ -> -Я (sinq ptitsa)
-УЮ -> -У (bujnu golovu)
-ЮЮ -> -Ю (poslednju monetu)
-ИЙ -> -И (tsepki vzglad)
-ЫЙ -> -Ы (corny kvadrat)
Вы не обязаны применять эти правила, но они позволяют писать короче
и изящнее. Пример, по дефолту, МОЩЬЮ=М+О+Ш+Ь+Ю=M+O+WJ+J+JU=MOWJJJU.
А согласно правилам сокращения получается MOWJU. Проверьте!
Позвольте пояснить, почему мягкий знак на конце слов часто совершенно
избыточен. Дело в том, что в современном русском языке звуки 'Ш' и 'Ж'
всегда твёрдые, а звуки 'Ч' и 'Щ' всегда мягкие; поэтому добавление
мягкого знака на письме не меняет произношение этих звуков. Латиницей
мы можем писать короче: myw, drox, doc, mowj
Что касается "ненормального" использования латинских букв W, X, Q;
то практика показала, что человеческий глаз легко перестраивается
на разные системы. Так буквы X, H, P в русском и английском языках
имеют совсем разное звучание, но проблем при считывании текстов от
этого не возникает, восприятие перестраивается автоматически, после
известной тренировки глаза.
Отступать от правил сокращения имеет смысл только когда нужно различить
схожие по написанию, но разные слова: luk - ljuk, klon - kljon.
С этой же целью начальную русскую 'е' можно порой транскрибировать в "je":
el - jel - jelj - elj
эл - ел - ель - эль
Когда очень хочется подчеркнуть, разницу между 'е' и 'э', для последней
можно использовать диграф "eh":
mehr, poeht, ehl
мэр, поэт, эл
Впрочем, при наличии контекста, подобные мелочи не заслуживают внимания.
Взрослые люди читают не по буквам, текст захватывается глазом кусками и
если кусок вписывается в общую картину, то детали не анализируются
Что касается замены окончаний на просторечные (типа -ая -> -а ...),
то можно применение этого правила ограничить случаем _прилагательного_,
стоящего _перед_ существительным
"bolwa tarelka", но "stolovaq na dace byla bolwaq"
С другой стороны, текст набранный латинскими буквами, можно сделать
ещё короче. Тоскливо вместо русской буквы 'ц' набивать две латинские?
А вы включите Num Lock и вместо 'ц' бейте '7'. Раз уж пошла такая пьянка,
вот полный список замен для самых ленивых:
ц - ts - 7 // напоминает t
щ - wj - 6 // westj
ъ - j - 5 // разделительная функция
ю - ju - 8 // 'ю' на попа
ё - jo - 0 // перечёркнутая 'о'
э - e - 2 // дублёр 'е'
Конечно, цифры портят строку:
e6о 8nga s5el bor6 i 7iplonka
Но если тупой терминал знает только большие буквы, то юзать цифры самое оно:
7IFRY PO8T POD 0LKOJ NA PLO6ADI
И всё же, почему набирать _русский_ текст _латинскими_ буквами _некомфортно_?
Русская раскладка ЙЦУКЕН была создана, чтобы ускорить набор текста,
напротив американская раскладка QWERTY специально разработана,
чтобы пользователь тюкал по взаимно удалённым клавишам, чтобы рычаги
первых неповоротливых пишмашин не залипали. Проще говоря, QWERTY замедляет
ввод, она хуже, чем отечественная раскладка.
Я написал компьютерную программу, которая быстро вычисляет эффективность
раскладки и с её помощью создал клавиатуру FONIS OFTA, которая заметно
лучше и ЙЦУКЕН и, тем более, QWERTY. А латинские и русские буквы совмещаются
на клавишах по правилам RV4, то есть, в основном, фонематически, а не
хаотически, как на стандартной гнилой клавиатуре. Уж год как у меня
нормальная клава, а комментарии к прогам я, не переключая регистра,
пишу по-русски транслитом RV4.
Также мной написана универсальная программа транслитерации, нужно только
составить файл замен для каждого конкретного случая.
Данная статья всего лишь комментарий в файле замен транслита RV4
===
Из романа В. Пелевина "Поколение педерастов"
... вечность, в которую он раньше верил, могла существовать только
на государственных дотациях - или, что то же самое, как нечто
запрещённое государством. Больше того, существовать она могла
только в качестве полуосознанного воспоминания какой-нибудь Маньки
из обувного. А ей, точно так же, как ему самому, эту сомнительную
вечность просто вставляли в голову в одном контейнере с природоведением
и неорганической химией. Вечность была произвольной - если бы, скажем,
не Сталин убил Троцкого, а наоборот, её населяли бы совсем другие лица.
Но даже это было не важно, потому что Татарский ясно понимал:
при любом раскладе Маньке просто не до вечности, и когда она окончательно
перестанет в неё верить, никакой вечности больше не будет, потому что
где ей тогда быть? Или, как он записал в свою книжечку, прийдя домой:
"Когда исчезает субъект вечности, то исчезают и все её объекты, -
а единственным субъектом вечности является тот, кто хоть изредка
про неё вспоминает".
===
>> Vvedeno strok kontekstnoj zameny vsego 32
>> Po umolcaniu zamenqjutsa:
>> абвгдеёжзийклмнопрстуфхчшщъыьэюяАБВГДЕЁЖЗИЙКЛМНОПРСТУФХЧШЩЪЫЬЭЮЯ
>> na simvoly:
>> abvgdeoxzijklmnoprstufhcwwjyjeuqABVGDEOXZIJKLMNOPRSTUFHCWWJYJEUQ
>> Simvoly vnutri <...> ne zamenqjutsa
!! Xdite ... Preryvanie po Control-C
>> Bylo vvedeno 840 zamenqemyh bajtov, iz nih polucilosj 840 simvolov
>> Vybuhanie ravno 0.0%
===
Iz romana V. Pelevina "Pokolenie pederastov"
... vecnostj, v kotoru on ranjwe veril, mogla suwestvovatj tolko
na gosudarstvennyh dotatsiah - ili, cto to xe samoe, kak necto
zaprewjonnoe gosudarstvom. Bolwe togo, suwestvovatj ona mogla
tolko v kacestve poluosoznannogo vospominania kakoj-nibudj Manjki
iz obuvnogo. A ej, tocno tak xe, kak emu samomu, etu somnitelnu
vecnostj prosto vstavlali v golovu v odnom kontejnere s prirodovedeniem
i neorganiceskoj himiej. Vecnostj byla proizvolnoj - esli by, skaxem,
ne Stalin ubil Trotskogo, a naoborot, ejo naselali by sovsem drugie litsa.
No daxe eto bylo ne vaxno, potomu cto Tatarski qsno ponimal:
pri lubom rasklade Manjke prosto ne do vecnosti, i kogda ona okoncatelno
perestanet v nejo veritj, nikakoj vecnosti bolwe ne budet, potomu cto
gde ej togda bytj? Ili, kak on zapisal v svoju knixecku, prijdq domoj:
"Kogda iscezaet subjekt vecnosti, to iscezajut i vse ejo objekty, -
a edinstvennym subjektom vecnosti qvlaetsa tot, kto hotj izredka
pro nejo vspominaet".
===
*/
Взять универсальный досовский транслитератор можно на ...
ftp://ftp.anihost.ru/users/mi/trans.zip
ftp://ftp.mccme.ru/users/nick/trans.zip
Там есть исходник с комментариями на RV4.
Это хороший пример полезности транслита.
Также смотрите описание проги TRANS на ...
http://mi.anihost.ru/trans.htm