]> git.notmuchmail.org Git - notmuch/blob - lib/regexp-fields.cc
b41747502e1e6b8bbea31044e583e10b75a155a3
[notmuch] / lib / regexp-fields.cc
1 /* regexp-fields.cc - field processor glue for regex supporting fields
2  *
3  * This file is part of notmuch.
4  *
5  * Copyright © 2015 Austin Clements
6  * Copyright © 2016 David Bremner
7  *
8  * This program is free software: you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License as published by
10  * the Free Software Foundation, either version 3 of the License, or
11  * (at your option) any later version.
12  *
13  * This program is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16  * GNU General Public License for more details.
17  *
18  * You should have received a copy of the GNU General Public License
19  * along with this program.  If not, see https://www.gnu.org/licenses/ .
20  *
21  * Author: Austin Clements <aclements@csail.mit.edu>
22  *                David Bremner <david@tethera.net>
23  */
24
25 #include "regexp-fields.h"
26 #include "notmuch-private.h"
27 #include "database-private.h"
28
29 #if HAVE_XAPIAN_FIELD_PROCESSOR
30 static void
31 compile_regex (regex_t &regexp, const char *str)
32 {
33     int err = regcomp (&regexp, str, REG_EXTENDED | REG_NOSUB);
34
35     if (err != 0) {
36         size_t len = regerror (err, &regexp, NULL, 0);
37         char *buffer = new char[len];
38         std::string msg;
39         (void) regerror (err, &regexp, buffer, len);
40         msg.assign (buffer, len);
41         delete[] buffer;
42
43         throw Xapian::QueryParserError (msg);
44     }
45 }
46
47 RegexpPostingSource::RegexpPostingSource (Xapian::valueno slot, const std::string &regexp)
48     : slot_ (slot)
49 {
50     compile_regex (regexp_, regexp.c_str ());
51 }
52
53 RegexpPostingSource::~RegexpPostingSource ()
54 {
55     regfree (&regexp_);
56 }
57
58 void
59 RegexpPostingSource::init (const Xapian::Database &db)
60 {
61     db_ = db;
62     it_ = db_.valuestream_begin (slot_);
63     end_ = db.valuestream_end (slot_);
64     started_ = false;
65
66     /* make sure we start on a matching value */
67     while (!at_end() && regexec (&regexp_, (*it_).c_str (), 0, NULL, 0) != 0) {
68         ++it_;
69     }
70 }
71
72 Xapian::doccount
73 RegexpPostingSource::get_termfreq_min () const
74 {
75     return 0;
76 }
77
78 Xapian::doccount
79 RegexpPostingSource::get_termfreq_est () const
80 {
81     return get_termfreq_max () / 2;
82 }
83
84 Xapian::doccount
85 RegexpPostingSource::get_termfreq_max () const
86 {
87     return db_.get_value_freq (slot_);
88 }
89
90 Xapian::docid
91 RegexpPostingSource::get_docid () const
92 {
93     return it_.get_docid ();
94 }
95
96 bool
97 RegexpPostingSource::at_end () const
98 {
99     return it_ == end_;
100 }
101
102 void
103 RegexpPostingSource::next (unused (double min_wt))
104 {
105     if (started_ && ! at_end ())
106         ++it_;
107     started_ = true;
108
109     for (; ! at_end (); ++it_) {
110         std::string value = *it_;
111         if (regexec (&regexp_, value.c_str (), 0, NULL, 0) == 0)
112             break;
113     }
114 }
115
116 static inline Xapian::valueno _find_slot (std::string prefix)
117 {
118     if (prefix == "from")
119         return NOTMUCH_VALUE_FROM;
120     else if (prefix == "subject")
121         return NOTMUCH_VALUE_SUBJECT;
122     else
123         throw Xapian::QueryParserError ("unsupported regexp field '" + prefix + "'");
124 }
125
126 RegexpFieldProcessor::RegexpFieldProcessor (std::string prefix, Xapian::QueryParser &parser_, notmuch_database_t *notmuch_)
127         : slot (_find_slot (prefix)), term_prefix (_find_prefix (prefix.c_str ())),
128           parser (parser_), notmuch (notmuch_)
129 {
130 };
131
132 Xapian::Query
133 RegexpFieldProcessor::operator() (const std::string & str)
134 {
135     if (str.at (0) == '/') {
136         if (str.at (str.size () - 1) == '/'){
137             RegexpPostingSource *postings = new RegexpPostingSource (slot, str.substr(1,str.size () - 2));
138             return Xapian::Query (postings->release ());
139         } else {
140             throw Xapian::QueryParserError ("unmatched regex delimiter in '" + str + "'");
141         }
142     } else {
143         /* TODO replace this with a nicer API level triggering of
144          * phrase parsing, when possible */
145         std::string quoted='"' + str + '"';
146         return parser.parse_query (quoted, NOTMUCH_QUERY_PARSER_FLAGS, term_prefix);
147     }
148 }
149 #endif