]> git.phdru.name Git - m_lib.git/blob - m_lib/rus/rus2lat.py
Fix encodings in m_lib/rus
[m_lib.git] / m_lib / rus / rus2lat.py
1 #! /usr/bin/env python
2 # -*- coding: koi8-r -*-
3
4 from __future__ import print_function
5 from ..lazy.dict import LazyDictInitFunc
6
7 #
8 # Rus -> Lat transliteration (koi2lat and win2lat)
9 #
10
11 koi2lat_d = {
12    "А": "A",
13    "Б": "B",
14    "В": "V",
15    "Г": "G",
16    "Д": "D",
17    "Е": "E",
18    "Ж": "Zh",
19    "З": "Z",
20    "И": "I",
21    "Й": "Y",
22    "К": "K",
23    "Л": "L",
24    "М": "M",
25    "Н": "N",
26    "О": "O",
27    "П": "P",
28    "Р": "R",
29    "С": "S",
30    "Т": "T",
31    "У": "U",
32    "Ф": "F",
33    "Х": "H",
34    "Ц": "Ts",
35    "Ч": "Ch",
36    "Ш": "Sh",
37    "Щ": "Sh",
38    "Ъ": "'",
39    "Ь": "'",
40    "Ы": "Y",
41    "Э": "E",
42    "Ю": "Yu",
43    "Я": "Ya",
44    "а": "a",
45    "б": "b",
46    "в": "v",
47    "г": "g",
48    "д": "d",
49    "е": "e",
50    "ж": "zh",
51    "з": "z",
52    "и": "i",
53    "й": "y",
54    "к": "k",
55    "л": "l",
56    "м": "m",
57    "н": "n",
58    "о": "o",
59    "п": "p",
60    "р": "r",
61    "с": "s",
62    "т": "t",
63    "у": "u",
64    "ф": "f",
65    "х": "h",
66    "ц": "ts",
67    "ч": "ch",
68    "ш": "sh",
69    "щ": "sh",
70    "ъ": "'",
71    "ь": "'",
72    "ы": "y",
73    "э": "e",
74    "ю": "yu",
75    "я": "ya",
76 }
77
78 def make_xxx2lat(encoding="cp1251"):
79    d = {}
80    for k, v in koi2lat_d.items():
81       d[k] = v
82    return d
83
84
85 win2lat_d = LazyDictInitFunc(make_xxx2lat, encoding="cp1251")
86
87
88 def rus2lat(instr, rus2lat_d = koi2lat_d):
89    out = []
90    for c in instr:
91       c = rus2lat_d.get(c, c)
92       if isinstance(c, int):
93          c = chr(c)
94       out.append(c)
95    return ''.join(out)
96
97
98 koi2lat = rus2lat
99
100 def win2lat(instr):
101    return rus2lat(instr, win2lat_d)
102
103
104 if __name__ == "__main__":
105    Test = "Щербаков Игорь Григорьевич. АБВ xyz абв ЬЬЭЮЯ ъьэюя"
106    print("Test:", Test)
107    print("Тест:", koi2lat(Test))
108    print("Тест:", win2lat(Test))