]> git.phdru.name Git - bookmarks_db.git/blob - parse_html/__main__.py
Fix(Robot): Stop splitting and un-splitting URLs
[bookmarks_db.git] / parse_html / __main__.py
1 """HTML Parsers
2
3 This file is a part of Bookmarks database and Internet robot.
4
5 """
6
7 from __future__ import print_function
8 from .bkmk_parse_html import parse_filename
9
10
11 __author__ = "Oleg Broytman <phd@phdru.name>"
12 __copyright__ = "Copyright (C) 2014-2023 PhiloSoft Design"
13 __license__ = "GNU GPL"
14
15
16 def main():
17     import sys
18     from .bkmk_parse_html import universal_charset
19
20     largs = len(sys.argv)
21     if largs == 3:
22         filename = sys.argv[1]
23         charset = sys.argv[2]
24     elif largs == 2:
25         filename = sys.argv[1]
26         charset = universal_charset
27     else:
28         sys.exit("Usage: main filename [charset]")
29
30     parser = parse_filename(filename, charset,
31                             log=lambda s: sys.stdout.write(s + '\n'))
32     print("   charset     :", parser.charset)
33     print("   meta_charset:", parser.meta_charset)
34     print("   title       :", parser.title)
35     print("   refresh     :", parser.refresh)
36     print("   icon        :", parser.icon)
37
38
39 if __name__ == '__main__':
40     main()