]> git.phdru.name Git - bookmarks_db.git/blob - parse_html/__init__.py
Change parse_html to parse strings, not files
[bookmarks_db.git] / parse_html / __init__.py
1 """HTML Parsers
2
3 This file is a part of Bookmarks database and Internet robot.
4
5 """
6
7 __author__ = "Oleg Broytman <phd@phdru.name>"
8 __copyright__ = "Copyright (C) 1997-2014 PhiloSoft Design"
9 __license__ = "GNU GPL"
10
11 __all__ = ['parse_html', 'parse_filename', 'main']
12
13
14 from .bkmk_parse_html import parse_html, parse_filename
15
16
17 def main():
18    import sys
19    from .bkmk_parse_html import universal_charset
20
21    l = len(sys.argv)
22    if l == 3:
23       filename = sys.argv[1]
24       charset = sys.argv[2]
25    elif l == 2:
26       filename = sys.argv[1]
27       charset = universal_charset
28    else:
29       sys.exit("Usage: main filename [charset]")
30
31    parser = parse_filename(filename, charset, log=lambda s: sys.stdout.write(s + '\n'))
32    print "   refresh:", parser.refresh
33    print "   icon   :", parser.icon