]> git.notmuchmail.org Git - notmuch/commitdiff
lib/thread-fp: factor out query expansion, rewrite in Xapian
authorDavid Bremner <david@tethera.net>
Tue, 24 Aug 2021 15:17:32 +0000 (08:17 -0700)
committerDavid Bremner <david@tethera.net>
Sun, 5 Sep 2021 00:07:19 +0000 (17:07 -0700)
It will be convenient not to have to construct a notmuch query object
when parsing subqueries, so the commit rewrites the query
expansion (currently only used for thread:{} queries) using only
Xapian. As a bonus it seems about 15% faster in initial experiments.

lib/database-private.h
lib/parse-sexp.cc
lib/query.cc
lib/thread-fp.cc

index 7ee8e62d9b56aada2930b6d69e99494717082382..9ee3b933578739ed389d8ea5cd842fdb88c2ee05 100644 (file)
 
 #include <xapian.h>
 
+#if HAVE_SFSEXP
+#include <sexp.h>
+#endif
+
 /* Bit masks for _notmuch_database::features.  Features are named,
  * independent aspects of the database schema.
  *
@@ -313,11 +317,21 @@ notmuch_status_t
 _notmuch_sexp_string_to_xapian_query (notmuch_database_t *notmuch, const char *querystr,
                                      Xapian::Query &output);
 
+notmuch_status_t
+_notmuch_query_expand (notmuch_database_t *notmuch, const char *field, Xapian::Query subquery,
+                      Xapian::Query &output, std::string &msg);
+
 /* regexp-fields.cc */
 notmuch_status_t
 _notmuch_regexp_to_query (notmuch_database_t *notmuch, Xapian::valueno slot, std::string field,
                          std::string regexp_str,
                          Xapian::Query &output, std::string &msg);
-#endif
 
+#if HAVE_SFSEXP
+/* parse-sexp.cc */
+notmuch_status_t
+_notmuch_sexp_string_to_xapian_query (notmuch_database_t *notmuch, const char *querystr,
+                                     Xapian::Query &output);
+#endif
+#endif
 #endif
index 849142961ed69b49aba28da866440a53628df02d..17401f47d79de3197a5672a19c99b7311e147e54 100644 (file)
@@ -219,8 +219,6 @@ _sexp_to_xapian_query (notmuch_database_t *notmuch, const _sexp_prefix_t *parent
                       Xapian::Query &output)
 {
     if (sx->ty == SEXP_VALUE) {
-       std::string term = Xapian::Unicode::tolower (sx->val);
-       Xapian::Stem stem = *(notmuch->stemmer);
        std::string term_prefix = parent ? _find_prefix (parent->name) : "";
 
        if (sx->aty == SEXP_BASIC && strcmp (sx->val, "*") == 0) {
index 87ee18fc0c8124c35ac0d06a84a7445d7b4c9fd8..b0937fcc97ed3eefa4fb51881ebc4159843bb575 100644 (file)
@@ -821,3 +821,51 @@ notmuch_query_get_database (const notmuch_query_t *query)
 {
     return query->notmuch;
 }
+
+notmuch_status_t
+_notmuch_query_expand (notmuch_database_t *notmuch, const char *field, Xapian::Query subquery,
+                      Xapian::Query &output, std::string &msg)
+{
+    std::set<std::string> terms;
+    const std::string term_prefix =  _find_prefix (field);
+
+    if (_debug_query ()) {
+       fprintf (stderr, "Expanding subquery:\n%s\n",
+                subquery.get_description ().c_str ());
+    }
+
+    try {
+       Xapian::Enquire enquire (*notmuch->xapian_db);
+       Xapian::MSet mset;
+
+       enquire.set_weighting_scheme (Xapian::BoolWeight ());
+       enquire.set_query (subquery);
+
+       mset = enquire.get_mset (0, notmuch->xapian_db->get_doccount ());
+
+       for (Xapian::MSetIterator iterator = mset.begin (); iterator != mset.end (); iterator++) {
+           Xapian::docid doc_id = *iterator;
+           Xapian::Document doc = notmuch->xapian_db->get_document (doc_id);
+           Xapian::TermIterator i = doc.termlist_begin ();
+
+           for (i.skip_to (term_prefix);
+                i != doc.termlist_end () && ((*i).rfind (term_prefix, 0) == 0); i++) {
+               terms.insert (*i);
+           }
+       }
+       output = Xapian::Query (Xapian::Query::OP_OR, terms.begin (), terms.end ());
+       if (_debug_query ()) {
+           fprintf (stderr, "Expanded query:\n%s\n",
+                    subquery.get_description ().c_str ());
+       }
+
+    } catch (const Xapian::Error &error) {
+       _notmuch_database_log (notmuch,
+                              "A Xapian exception occurred expanding query: %s\n",
+                              error.get_msg ().c_str ());
+       msg = error.get_msg ();
+       return NOTMUCH_STATUS_XAPIAN_EXCEPTION;
+    }
+
+    return NOTMUCH_STATUS_SUCCESS;
+}
index 06708ef291852f8ab5e1888c7e5755c18921f288..3aa9c4238c6f80a6d2e9d359006e0b1b2ea9bc44 100644 (file)
@@ -34,28 +34,20 @@ ThreadFieldProcessor::operator() (const std::string & str)
        if (str.size () <= 1 || str.at (str.size () - 1) != '}') {
            throw Xapian::QueryParserError ("missing } in '" + str + "'");
        } else {
+           Xapian::Query subquery;
+           Xapian::Query query;
+           std::string msg;
            std::string subquery_str = str.substr (1, str.size () - 2);
-           notmuch_query_t *subquery = notmuch_query_create (notmuch, subquery_str.c_str ());
-           notmuch_messages_t *messages;
-           std::set<std::string> terms;
 
-           if (! subquery)
-               throw Xapian::QueryParserError ("failed to create subquery for '" + subquery_str +
-                                               "'");
+           status = _notmuch_query_string_to_xapian_query (notmuch, subquery_str, subquery, msg);
+           if (status)
+               throw Xapian::QueryParserError (msg);
 
-           status = notmuch_query_search_messages (subquery, &messages);
+           status = _notmuch_query_expand (notmuch, "thread", subquery, query, msg);
            if (status)
-               throw Xapian::QueryParserError ("failed to search messages for '" + subquery_str +
-                                               "'");
+               throw Xapian::QueryParserError (msg);
 
-           for (; notmuch_messages_valid (messages); notmuch_messages_move_to_next (messages)) {
-               std::string term = thread_prefix;
-               notmuch_message_t *message;
-               message = notmuch_messages_get (messages);
-               term += _notmuch_message_get_thread_id_only (message);
-               terms.insert (term);
-           }
-           return Xapian::Query (Xapian::Query::OP_OR, terms.begin (), terms.end ());
+           return query;
        }
     } else {
        /* literal thread id */