Version 0.7: Use lark instead of parsley

author Oleg Broytman <phd@phdru.name>

Thu, 14 Dec 2017 11:27:22 +0000 (14:27 +0300)

committer Oleg Broytman <phd@phdru.name>

Thu, 14 Dec 2017 11:27:22 +0000 (14:27 +0300)
author Oleg Broytman <phd@phdru.name>
Thu, 14 Dec 2017 11:27:22 +0000 (14:27 +0300)
committer Oleg Broytman <phd@phdru.name>
Thu, 14 Dec 2017 11:27:22 +0000 (14:27 +0300)
diff --git a/ChangeLog b/ChangeLog

index 9b7a3dc9d5348858ef108b973730b5d61fcac72f..79857bbb6b50f9e002e325551d6b0e50e9e39078 100644 (file)
--- a/ChangeLog
+++ b/ChangeLog
@@ -1,3 +1,7 @@
+Version 0.7 (2017-12-14)
+
+   Use lark instead of parsley.
+
  Version 0.6 (2017-05-20)
  
     Use parsley instead of parsimonious.
diff --git a/TODO b/TODO

index eda6989f75bb734a604f4ee0e43aa598912971c4..06ad45b63aa37b82c10ce32f9179948c5ecb66d8 100644 (file)
--- a/TODO
+++ b/TODO
@@ -1,6 +1,3 @@
-Use lark instead of parsley.
-
-
  Sort posts by date or tags.
  
  
diff --git a/parser/grammar.ebnf b/parser/grammar.ebnf

index 43752574a181addd522514c7ff8e0e16d6346e6a..3be4d166e0ed7eac1643b7e0176d35e2e75f7d8a 100644 (file)
--- a/parser/grammar.ebnf
+++ b/parser/grammar.ebnf
@@ -1,4 +1,4 @@
-# Grammar rules for tag searching
+# Grammar rules for tag searching; EBNF.
  
  # The grammar defines expressions in the following forms:
  #  TAG - search blog posts that contain the tag;
@@ -11,41 +11,58 @@
  # Allowed operators: conjunction - & && AND and
  #                    disjunction - | || OR or
  #                    negation    - ! NOT not
-# Usual priority: NOT recognized before AND, AND before OR.
  # This  is a simple version of the grammar and it allows
-# rather stupid expressions, like (TAG) or ((TAG)) or !(!(TAG)).
+# rather stupid expressions, like !!TAG or ((TAG)); in the future
+# it will be fixed by making the grammar more complex and stricter.
  
-expression = inner_expression:e end -> e
+?start : expression
  
-inner_expression = (or_expression | aterm_expression):e -> e
+?expression : or_expression
+            | and_expression
+            | and_sub_expression
  
-or_expression = aterm_expression:a or_op inner_expression:e -> ('OR', a, e)
+or_expression : or_sub_expression (or or_sub_expression)+
  
-and_expression = term_expression:t and_op aterm_expression:a -> ('AND',
-t, a)
+?or_sub_expression : and_expression
+                   | and_sub_expression
  
-not_expression = not_op ws (parens_expression | name):n -> ('NOT', n)
+and_expression : and_sub_expression (and and_sub_expression)+
  
-aterm_expression = (and_expression | term_expression):e -> e
+?and_sub_expression : not_expression
+                    | expression_parens
+                    | name
  
-term_expression = (not_expression:e -> e) | (parens_expression:p -> p) | (name:n space_b4letter -> n)
+not_expression: not and_sub_expression
  
-parens_expression = '(' ws inner_expression:e ws ')' -> ('PARENS', e)
+expression_parens : "(" expression ")"
  
-and_op = (ws ('&&' | '&') ws) | (ws ('AND' | 'and') space_b4letter)
+name : /[a-z][a-z0-9_]+/
  
-or_op = (ws ('||' | '|') ws) | (ws ('OR' | 'or') space_b4letter)
+?and : and_op
+     | and_op and_op
+     | and_word
  
-not_op = (ws '!' ws) | (ws ('NOT' | 'not') space_b4letter)
+?or : or_op
+    | or_op or_op
+    | or_word
  
-name = <lletter lletterOrDigit*>:n -> ('NAME', n)
+?not : not_op
+     | not_word
  
-lletter = :l ?(l in 'abcdefghijklmnopqrstuvwxyz') -> l
+?and_op : "&"
  
-digit = :d ?(d in '0123456789') -> d
+?or_op : "|"
  
-lletterOrDigit = (lletter | digit):c -> c
+?not_op : "!"
  
-space_b4letter = (' '+ ~~letter) | ws
+?and_word : "AND"
+          | "and"
  
-# vim: set ft=text :
+?or_word : "OR"
+         | "or"
+
+?not_word : "NOT"
+          | "not"
+
+%import common.WS
+%ignore WS
diff --git a/parser/parser.py b/parser/parser.py

index 3f51d3f9c7b6ee84c597de07a81c354d1d1ee674..dbd054964820852fd530b4cfab0f1da2c8e79e30 100755 (executable)
--- a/parser/parser.py
+++ b/parser/parser.py
@@ -1,7 +1,32 @@
  #! /usr/bin/env python
  
  import os
-from parsley import makeGrammar
+from lark import Lark, Transformer
+
+
+class TagsTransformer(Transformer):
+    def and_expression(self, items):
+        left = items[0]
+        right = items[2]
+        if len(items) > 3:
+            right = self.and_expression(items[2:])
+        return ('AND', left, right)
+
+    def or_expression(self, items):
+        left = items[0]
+        right = items[2]
+        if len(items) > 3:
+            right = self.or_expression(items[2:])
+        return ('OR', left, right)
+
+    def not_expression(self, items):
+        return ('NOT', items[1])
+
+    def expression_parens(self, items):
+        return ('PARENS', items[0])
+
+    def name(self, name):
+        return ('NAME', name[0].value)
  
  
  # cache
@@ -13,21 +38,29 @@ def load_grammar():
      parser_dir = os.path.dirname(__file__)
      with open(os.path.join(parser_dir, 'grammar.ebnf'), 'rt') as grammar_file:
          grammar_text = grammar_file.read()
-    _grammar = makeGrammar(grammar_text, {}, 'Tags')
+    grammar_lines = [line for line in grammar_text.splitlines()
+                     if not line.startswith('#')]
+    grammar_text = '\n'.join(grammar_lines)
+    _grammar = Lark(grammar_text)
  
  
  def parse(input):
      if _grammar is None:
          load_grammar()
-    return _grammar(input).expression()
+    tree = _grammar.parse(input)
+    return TagsTransformer().transform(tree)
  
  
  if __name__ == '__main__':
+    print '----------'
      print parse('test')
      print parse('!test')
      print parse('not test')
      print parse('foo or bar')
      print parse('foo && bar')
+    print parse('foo && bar && baz')
+    print parse('!foo && bar && baz')
      print parse('(test)')
      print parse('(foo || bar)')
      print parse('(foo and !bar)')
+    print '----------'
diff --git a/parser/test_parser.py b/parser/test_parser.py

index 67c0ae3fc848e0a95df1a47e3c2387017b7d7491..8783de50367b714a6d29fec923024f111a3c64b6 100755 (executable)
--- a/parser/test_parser.py
+++ b/parser/test_parser.py
@@ -1,7 +1,7 @@
  #! /usr/bin/env python
  
  import unittest
-from ometa.runtime import ParseError
+from lark import ParseError
  from parser import parse
  
  class TestParser(unittest.TestCase):
diff --git a/search-tags.py b/search-tags.py

index 4f6810adc65a34a95c08ca3b843e6eb5316569d0..c2884fab2942aeeeb7374451770cbd556d5c0581 100755 (executable)
--- a/search-tags.py
+++ b/search-tags.py
@@ -7,7 +7,7 @@ __copyright__ = "Copyright (C) 2014-2017 PhiloSoft Design"
  __license__ = "GNU GPL"
  
  import cgi, sys
-from ometa.runtime import ParseError
+from lark import ParseError
  from html.response import redirect, response
  from parser import parser
author	Oleg Broytman <phd@phdru.name>
	Thu, 14 Dec 2017 11:27:22 +0000 (14:27 +0300)
committer	Oleg Broytman <phd@phdru.name>
	Thu, 14 Dec 2017 11:27:22 +0000 (14:27 +0300)
ChangeLog		patch \| blob \| history
TODO		patch \| blob \| history
parser/grammar.ebnf		patch \| blob \| history
parser/parser.py		patch \| blob \| history
parser/test_parser.py		patch \| blob \| history
search-tags.py		patch \| blob \| history