]> git.phdru.name Git - bookmarks_db.git/blobdiff - Robots/parse_html.py
Fixed a bug - break out of the loop after finding the first working charset.
[bookmarks_db.git] / Robots / parse_html.py
index 6fe1df954236f855e2f08ae1ca048b4f275a704a..c05e66cce3a2ad394807b057e4071625f5390fcb 100755 (executable)
@@ -63,6 +63,7 @@ def parse_html(filename, charset=None, log=None):
       for c in charsets:
          try:
             parser = p(filename, c)
+            break
          except UnicodeEncodeError:
             pass
       if parser:
@@ -85,7 +86,7 @@ def parse_html(filename, charset=None, log=None):
          if parser.meta_charset:
             if log: log("   META charset   : %s" % parser.charset)
          else:
-            if log: log("   HTTP charset   : %s" % parser.charset)
+            if log: log("   guessed charset: %s" % parser.charset)
          if log: log("   current charset: %s" % universal_charset)
          if log: log("   title          : %s" % title)
          try: