]> git.phdru.name Git - bookmarks_db.git/blobdiff - Robots/parse_html.py
Fixed a misspelling.
[bookmarks_db.git] / Robots / parse_html.py
index 3e49491c7fc36ff5f1e8749fc86195f2a49983e8..e676504a9741765fd5f7bc98fb61cd9758b739a2 100755 (executable)
@@ -67,7 +67,7 @@ def parse_html(filename, charset=None, log=None):
       parser = None
       for c in charsets:
          try:
-            parser = p(filename, c)
+            parser = p(filename, c, log)
             break
          except UnicodeEncodeError:
             pass
@@ -119,10 +119,17 @@ def parse_html(filename, charset=None, log=None):
 
 if __name__ == '__main__':
    import sys
-   from m_lib.defenc import default_encoding
-   current_charset = default_encoding.replace("windows-", "cp")
 
-   parser = parse_html(sys.argv[1], universal_charset,
-      log=lambda s: sys.stdout.write(s + '\n'))
+   l = len(sys.argv)
+   if l == 3:
+      filename = sys.argv[1]
+      charset = sys.argv[2]
+   elif l == 2:
+      filename = sys.argv[1]
+      charset = universal_charset
+   else:
+      sys.exit("Usage: %s filename [charset]" % sys.argv[0])
+
+   parser = parse_html(filename, charset, log=lambda s: sys.stdout.write(s + '\n'))
    print "   refresh:", parser.refresh
    print "   icon   :", parser.icon