]> git.phdru.name Git - bookmarks_db.git/blobdiff - parse_html/bkmk_parse_html.py
Fix(parse_html): Fix import
[bookmarks_db.git] / parse_html / bkmk_parse_html.py
index 997bf6489c9a2e49a44c74d1062a61aa85191cf5..2e7df1a2b90fde750d0d47aafcf073a11c60c3a5 100644 (file)
@@ -13,6 +13,13 @@ __all__ = ['parse_html', 'parse_filename', 'universal_charset']
 
 import codecs
 import os
+import re
+from htmlentitydefs import name2codepoint
+
+from compat import unicode, unichr
+
+DEFAULT_CHARSET = "cp1251"  # Stupid default for Russian Cyrillic
+parsers = []
 
 try:
     from . import bkmk_ph_beautifulsoup4
@@ -59,15 +66,8 @@ else:
 # else:
 #     parsers.append(bkmk_ph_etreetidy.parse_html)
 
-import re
-from htmlentitydefs import name2codepoint
-
 universal_charset = "utf-8"
-DEFAULT_CHARSET = "cp1251"  # Stupid default for Russian Cyrillic
-
-parsers = []
-
-entity_re = re.compile("(&\w+;)")
+entity_re = re.compile("(&\\w+;)")
 num_entity_re = re.compile("(&#[0-9]+;)")