fix notmuch-new bug when database path ends with a trailing /
[notmuch] / lib / message.cc
1 /* message.cc - Results of message-based searches from a notmuch database
2  *
3  * Copyright © 2009 Carl Worth
4  *
5  * This program is free software: you can redistribute it and/or modify
6  * it under the terms of the GNU General Public License as published by
7  * the Free Software Foundation, either version 3 of the License, or
8  * (at your option) any later version.
9  *
10  * This program is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13  * GNU General Public License for more details.
14  *
15  * You should have received a copy of the GNU General Public License
16  * along with this program.  If not, see http://www.gnu.org/licenses/ .
17  *
18  * Author: Carl Worth <cworth@cworth.org>
19  */
20
21 #include "notmuch-private.h"
22 #include "database-private.h"
23
24 #include <stdint.h>
25
26 #include <gmime/gmime.h>
27
28 #include <xapian.h>
29
30 struct _notmuch_message {
31     notmuch_database_t *notmuch;
32     Xapian::docid doc_id;
33     int frozen;
34     char *message_id;
35     char *thread_id;
36     char *in_reply_to;
37     char *filename;
38     notmuch_message_file_t *message_file;
39     notmuch_message_list_t *replies;
40
41     Xapian::Document doc;
42 };
43
44 /* "128 bits of thread-id ought to be enough for anybody" */
45 #define NOTMUCH_THREAD_ID_BITS   128
46 #define NOTMUCH_THREAD_ID_DIGITS (NOTMUCH_THREAD_ID_BITS / 4)
47 typedef struct _thread_id {
48     char str[NOTMUCH_THREAD_ID_DIGITS + 1];
49 } thread_id_t;
50
51 /* We end up having to call the destructor explicitly because we had
52  * to use "placement new" in order to initialize C++ objects within a
53  * block that we allocated with talloc. So C++ is making talloc
54  * slightly less simple to use, (we wouldn't need
55  * talloc_set_destructor at all otherwise).
56  */
57 static int
58 _notmuch_message_destructor (notmuch_message_t *message)
59 {
60     message->doc.~Document ();
61
62     return 0;
63 }
64
65 /* Create a new notmuch_message_t object for an existing document in
66  * the database.
67  *
68  * Here, 'talloc owner' is an optional talloc context to which the new
69  * message will belong. This allows for the caller to not bother
70  * calling notmuch_message_destroy on the message, and no that all
71  * memory will be reclaimed with 'talloc_owner' is free. The caller
72  * still can call notmuch_message_destroy when finished with the
73  * message if desired.
74  *
75  * The 'talloc_owner' argument can also be NULL, in which case the
76  * caller *is* responsible for calling notmuch_message_destroy.
77  *
78  * If no document exists in the database with document ID of 'doc_id'
79  * then this function returns NULL and optionally sets *status to
80  * NOTMUCH_PRIVATE_STATUS_NO_DOCUMENT_FOUND.
81  *
82  * This function can also fail to due lack of available memory,
83  * returning NULL and optionally setting *status to
84  * NOTMUCH_PRIVATE_STATUS_OUT_OF_MEMORY.
85  *
86  * The caller can pass NULL for status if uninterested in
87  * distinguishing these two cases.
88  */
89 notmuch_message_t *
90 _notmuch_message_create (const void *talloc_owner,
91                          notmuch_database_t *notmuch,
92                          unsigned int doc_id,
93                          notmuch_private_status_t *status)
94 {
95     notmuch_message_t *message;
96
97     if (status)
98         *status = NOTMUCH_PRIVATE_STATUS_SUCCESS;
99
100     message = talloc (talloc_owner, notmuch_message_t);
101     if (unlikely (message == NULL)) {
102         if (status)
103             *status = NOTMUCH_PRIVATE_STATUS_OUT_OF_MEMORY;
104         return NULL;
105     }
106
107     message->notmuch = notmuch;
108     message->doc_id = doc_id;
109
110     message->frozen = 0;
111
112     /* Each of these will be lazily created as needed. */
113     message->message_id = NULL;
114     message->thread_id = NULL;
115     message->in_reply_to = NULL;
116     message->filename = NULL;
117     message->message_file = NULL;
118
119     message->replies = _notmuch_message_list_create (message);
120     if (unlikely (message->replies == NULL)) {
121         if (status)
122             *status = NOTMUCH_PRIVATE_STATUS_OUT_OF_MEMORY;
123         return NULL;
124     }
125
126     /* This is C++'s creepy "placement new", which is really just an
127      * ugly way to call a constructor for a pre-allocated object. So
128      * it's really not an error to not be checking for OUT_OF_MEMORY
129      * here, since this "new" isn't actually allocating memory. This
130      * is language-design comedy of the wrong kind. */
131
132     new (&message->doc) Xapian::Document;
133
134     talloc_set_destructor (message, _notmuch_message_destructor);
135
136     try {
137         message->doc = notmuch->xapian_db->get_document (doc_id);
138     } catch (const Xapian::DocNotFoundError &error) {
139         talloc_free (message);
140         if (status)
141             *status = NOTMUCH_PRIVATE_STATUS_NO_DOCUMENT_FOUND;
142         return NULL;
143     }
144
145     return message;
146 }
147
148 /* Create a new notmuch_message_t object for a specific message ID,
149  * (which may or may not already exist in the database).
150  *
151  * The 'notmuch' database will be the talloc owner of the returned
152  * message.
153  *
154  * If there is already a document with message ID 'message_id' in the
155  * database, then the returned message can be used to query/modify the
156  * document. Otherwise, a new document will be inserted into the
157  * database before this function returns, (and *status will be set
158  * to NOTMUCH_PRIVATE_STATUS_NO_DOCUMENT_FOUND).
159  *
160  * If an error occurs, this function will return NULL and *status
161  * will be set as appropriate. (The status pointer argument must
162  * not be NULL.)
163  */
164 notmuch_message_t *
165 _notmuch_message_create_for_message_id (notmuch_database_t *notmuch,
166                                         const char *message_id,
167                                         notmuch_private_status_t *status_ret)
168 {
169     notmuch_message_t *message;
170     Xapian::Document doc;
171     Xapian::WritableDatabase *db;
172     unsigned int doc_id;
173     char *term;
174
175     if (notmuch->mode == NOTMUCH_DATABASE_MODE_READ_ONLY) {
176         *status_ret = NOTMUCH_PRIVATE_STATUS_READONLY_DATABASE;
177         return NULL;
178     }
179
180     *status_ret = NOTMUCH_PRIVATE_STATUS_SUCCESS;
181
182     message = notmuch_database_find_message (notmuch, message_id);
183     if (message)
184         return talloc_steal (notmuch, message);
185
186     term = talloc_asprintf (NULL, "%s%s",
187                             _find_prefix ("id"), message_id);
188     if (term == NULL) {
189         *status_ret = NOTMUCH_PRIVATE_STATUS_OUT_OF_MEMORY;
190         return NULL;
191     }
192
193     db = static_cast<Xapian::WritableDatabase *> (notmuch->xapian_db);
194     try {
195         doc.add_term (term);
196         talloc_free (term);
197
198         doc.add_value (NOTMUCH_VALUE_MESSAGE_ID, message_id);
199
200         doc_id = db->add_document (doc);
201     } catch (const Xapian::Error &error) {
202         fprintf (stderr, "A Xapian exception occurred creating message: %s\n",
203                  error.get_msg().c_str());
204         notmuch->exception_reported = TRUE;
205         *status_ret = NOTMUCH_PRIVATE_STATUS_XAPIAN_EXCEPTION;
206         return NULL;
207     }
208
209     message = _notmuch_message_create (notmuch, notmuch,
210                                        doc_id, status_ret);
211
212     /* We want to inform the caller that we had to create a new
213      * document. */
214     if (*status_ret == NOTMUCH_PRIVATE_STATUS_SUCCESS)
215         *status_ret = NOTMUCH_PRIVATE_STATUS_NO_DOCUMENT_FOUND;
216
217     return message;
218 }
219
220 const char *
221 notmuch_message_get_message_id (notmuch_message_t *message)
222 {
223     Xapian::TermIterator i;
224
225     if (message->message_id)
226         return message->message_id;
227
228     i = message->doc.termlist_begin ();
229     i.skip_to (_find_prefix ("id"));
230
231     if (i == message->doc.termlist_end ())
232         INTERNAL_ERROR ("Message with document ID of %d has no message ID.\n",
233                         message->doc_id);
234
235     message->message_id = talloc_strdup (message, (*i).c_str () + 1);
236
237 #if DEBUG_DATABASE_SANITY
238     i++;
239
240     if (i != message->doc.termlist_end () &&
241         strncmp ((*i).c_str (), _find_prefix ("id"),
242                  strlen (_find_prefix ("id"))) == 0)
243     {
244         INTERNAL_ERROR ("Mail (doc_id: %d) has duplicate message IDs",
245                         message->doc_id);
246     }
247 #endif
248
249     return message->message_id;
250 }
251
252 static void
253 _notmuch_message_ensure_message_file (notmuch_message_t *message)
254 {
255     const char *filename;
256
257     if (message->message_file)
258         return;
259
260     filename = notmuch_message_get_filename (message);
261     if (unlikely (filename == NULL))
262         return;
263
264     message->message_file = _notmuch_message_file_open_ctx (message, filename);
265 }
266
267 const char *
268 notmuch_message_get_header (notmuch_message_t *message, const char *header)
269 {
270     _notmuch_message_ensure_message_file (message);
271     if (message->message_file == NULL)
272         return NULL;
273
274     return notmuch_message_file_get_header (message->message_file, header);
275 }
276
277 /* Return the message ID from the In-Reply-To header of 'message'.
278  *
279  * Returns an empty string ("") if 'message' has no In-Reply-To
280  * header.
281  *
282  * Returns NULL if any error occurs.
283  */
284 const char *
285 _notmuch_message_get_in_reply_to (notmuch_message_t *message)
286 {
287     const char *prefix = _find_prefix ("replyto");
288     int prefix_len = strlen (prefix);
289     Xapian::TermIterator i;
290     std::string in_reply_to;
291
292     if (message->in_reply_to)
293         return message->in_reply_to;
294
295     i = message->doc.termlist_begin ();
296     i.skip_to (prefix);
297
298     if (i != message->doc.termlist_end ())
299         in_reply_to = *i;
300
301     /* It's perfectly valid for a message to have no In-Reply-To
302      * header. For these cases, we return an empty string. */
303     if (i == message->doc.termlist_end () ||
304         strncmp (in_reply_to.c_str (), prefix, prefix_len))
305     {
306         message->in_reply_to = talloc_strdup (message, "");
307         return message->in_reply_to;
308     }
309
310     message->in_reply_to = talloc_strdup (message,
311                                           in_reply_to.c_str () + prefix_len);
312
313 #if DEBUG_DATABASE_SANITY
314     i++;
315
316     in_reply_to = *i;
317
318     if (i != message->doc.termlist_end () &&
319         strncmp ((*i).c_str (), prefix, prefix_len))
320     {
321         INTERNAL_ERROR ("Message %s has duplicate In-Reply-To IDs: %s and %s\n"
322                         notmuch_message_get_message_id (message),
323                         message->in_reply_to,
324                         (*i).c_str () + prefix_len);
325     }
326 #endif
327
328     return message->in_reply_to;
329 }
330
331 const char *
332 notmuch_message_get_thread_id (notmuch_message_t *message)
333 {
334     const char *prefix = _find_prefix ("thread");
335     Xapian::TermIterator i;
336     std::string id;
337
338     /* This code is written with the assumption that "thread" has a
339      * single-character prefix. */
340     assert (strlen (prefix) == 1);
341
342     if (message->thread_id)
343         return message->thread_id;
344
345     i = message->doc.termlist_begin ();
346     i.skip_to (prefix);
347
348     if (i != message->doc.termlist_end ())
349         id = *i;
350
351     if (i == message->doc.termlist_end () || id[0] != *prefix)
352         INTERNAL_ERROR ("Message with document ID of %d has no thread ID.\n",
353                         message->doc_id);
354
355     message->thread_id = talloc_strdup (message, id.c_str () + 1);
356
357 #if DEBUG_DATABASE_SANITY
358     i++;
359     id = *i;
360
361     if (i != message->doc.termlist_end () && id[0] == *prefix)
362     {
363         INTERNAL_ERROR ("Message %s has duplicate thread IDs: %s and %s\n",
364                         notmuch_message_get_message_id (message),
365                         message->thread_id,
366                         id.c_str () + 1);
367     }
368 #endif
369
370     return message->thread_id;
371 }
372
373 void
374 _notmuch_message_add_reply (notmuch_message_t *message,
375                             notmuch_message_node_t *reply)
376 {
377     _notmuch_message_list_append (message->replies, reply);
378 }
379
380 notmuch_messages_t *
381 notmuch_message_get_replies (notmuch_message_t *message)
382 {
383     return _notmuch_messages_create (message->replies);
384 }
385
386 /* Set the filename for 'message' to 'filename'.
387  *
388  * XXX: We should still figure out if we think it's important to store
389  * multiple filenames for email messages with identical message IDs.
390  *
391  * This change will not be reflected in the database until the next
392  * call to _notmuch_message_set_sync. */
393 void
394 _notmuch_message_set_filename (notmuch_message_t *message,
395                                const char *filename)
396 {
397     const char *s;
398     const char *db_path;
399     unsigned int db_path_len;
400
401     if (message->filename) {
402         talloc_free (message->filename);
403         message->filename = NULL;
404     }
405
406     if (filename == NULL)
407         INTERNAL_ERROR ("Message filename cannot be NULL.");
408
409     s = filename;
410
411     db_path = notmuch_database_get_path (message->notmuch);
412     db_path_len = strlen (db_path);
413
414     if (*s == '/' && strlen (s) > db_path_len
415         && strncmp (s, db_path, db_path_len) == 0)
416     {
417         s += db_path_len;
418         while (*s == '/') s++;
419
420         if (!*s)
421                 INTERNAL_ERROR ("Message filename was same as db prefix.");
422     }
423
424     message->doc.set_data (s);
425 }
426
427 const char *
428 notmuch_message_get_filename (notmuch_message_t *message)
429 {
430     std::string filename_str;
431     const char *db_path;
432
433     if (message->filename)
434         return message->filename;
435
436     filename_str = message->doc.get_data ();
437     db_path = notmuch_database_get_path (message->notmuch);
438
439     if (filename_str[0] != '/')
440         message->filename = talloc_asprintf (message, "%s/%s", db_path,
441                                              filename_str.c_str ());
442     else
443         message->filename = talloc_strdup (message, filename_str.c_str ());
444
445     return message->filename;
446 }
447
448 time_t
449 notmuch_message_get_date (notmuch_message_t *message)
450 {
451     std::string value;
452
453     try {
454         value = message->doc.get_value (NOTMUCH_VALUE_TIMESTAMP);
455     } catch (Xapian::Error &error) {
456         INTERNAL_ERROR ("Failed to read timestamp value from document.");
457         return 0;
458     }
459
460     return Xapian::sortable_unserialise (value);
461 }
462
463 notmuch_tags_t *
464 notmuch_message_get_tags (notmuch_message_t *message)
465 {
466     const char *prefix = _find_prefix ("tag");
467     Xapian::TermIterator i, end;
468     notmuch_tags_t *tags;
469     std::string tag;
470
471     /* Currently this iteration is written with the assumption that
472      * "tag" has a single-character prefix. */
473     assert (strlen (prefix) == 1);
474
475     tags = _notmuch_tags_create (message);
476     if (unlikely (tags == NULL))
477         return NULL;
478
479     i = message->doc.termlist_begin ();
480     end = message->doc.termlist_end ();
481
482     i.skip_to (prefix);
483
484     while (i != end) {
485         tag = *i;
486
487         if (tag.empty () || tag[0] != *prefix)
488             break;
489
490         _notmuch_tags_add_tag (tags, tag.c_str () + 1);
491
492         i++;
493     }
494
495     _notmuch_tags_prepare_iterator (tags);
496
497     return tags;
498 }
499
500 void
501 _notmuch_message_set_date (notmuch_message_t *message,
502                            const char *date)
503 {
504     time_t time_value;
505
506     /* GMime really doesn't want to see a NULL date, so protect its
507      * sensibilities. */
508     if (date == NULL || *date == '\0')
509         time_value = 0;
510     else
511         time_value = g_mime_utils_header_decode_date (date, NULL);
512
513     message->doc.add_value (NOTMUCH_VALUE_TIMESTAMP,
514                             Xapian::sortable_serialise (time_value));
515 }
516
517 static void
518 thread_id_generate (thread_id_t *thread_id)
519 {
520     static int seeded = 0;
521     FILE *dev_random;
522     uint32_t value;
523     char *s;
524     int i;
525
526     if (! seeded) {
527         dev_random = fopen ("/dev/random", "r");
528         if (dev_random == NULL) {
529             srand (time (NULL));
530         } else {
531             fread ((void *) &value, sizeof (value), 1, dev_random);
532             srand (value);
533             fclose (dev_random);
534         }
535         seeded = 1;
536     }
537
538     s = thread_id->str;
539     for (i = 0; i < NOTMUCH_THREAD_ID_DIGITS; i += 8) {
540         value = rand ();
541         sprintf (s, "%08x", value);
542         s += 8;
543     }
544 }
545
546 void
547 _notmuch_message_ensure_thread_id (notmuch_message_t *message)
548 {
549     /* If not part of any existing thread, generate a new thread_id. */
550     thread_id_t thread_id;
551
552     thread_id_generate (&thread_id);
553     _notmuch_message_add_term (message, "thread", thread_id.str);
554 }
555
556 /* Synchronize changes made to message->doc out into the database. */
557 void
558 _notmuch_message_sync (notmuch_message_t *message)
559 {
560     Xapian::WritableDatabase *db;
561
562     if (message->notmuch->mode == NOTMUCH_DATABASE_MODE_READ_ONLY)
563         return;
564
565     db = static_cast <Xapian::WritableDatabase *> (message->notmuch->xapian_db);
566     db->replace_document (message->doc_id, message->doc);
567 }
568
569 /* Ensure that 'message' is not holding any file object open. Future
570  * calls to various functions will still automatically open the
571  * message file as needed.
572  */
573 void
574 _notmuch_message_close (notmuch_message_t *message)
575 {
576     if (message->message_file) {
577         notmuch_message_file_close (message->message_file);
578         message->message_file = NULL;
579     }
580 }
581
582 /* Add a name:value term to 'message', (the actual term will be
583  * encoded by prefixing the value with a short prefix). See
584  * NORMAL_PREFIX and BOOLEAN_PREFIX arrays for the mapping of term
585  * names to prefix values.
586  *
587  * This change will not be reflected in the database until the next
588  * call to _notmuch_message_set_sync. */
589 notmuch_private_status_t
590 _notmuch_message_add_term (notmuch_message_t *message,
591                            const char *prefix_name,
592                            const char *value)
593 {
594
595     char *term;
596
597     if (value == NULL)
598         return NOTMUCH_PRIVATE_STATUS_NULL_POINTER;
599
600     term = talloc_asprintf (message, "%s%s",
601                             _find_prefix (prefix_name), value);
602
603     if (strlen (term) > NOTMUCH_TERM_MAX)
604         return NOTMUCH_PRIVATE_STATUS_TERM_TOO_LONG;
605
606     message->doc.add_term (term);
607
608     talloc_free (term);
609
610     return NOTMUCH_PRIVATE_STATUS_SUCCESS;
611 }
612
613 /* Parse 'text' and add a term to 'message' for each parsed word. Each
614  * term will be added both prefixed (if prefix_name is not NULL) and
615  * also unprefixed). */
616 notmuch_private_status_t
617 _notmuch_message_gen_terms (notmuch_message_t *message,
618                             const char *prefix_name,
619                             const char *text)
620 {
621     Xapian::TermGenerator *term_gen = message->notmuch->term_gen;
622
623     if (text == NULL)
624         return NOTMUCH_PRIVATE_STATUS_NULL_POINTER;
625
626     term_gen->set_document (message->doc);
627
628     if (prefix_name) {
629         const char *prefix = _find_prefix (prefix_name);
630
631         term_gen->index_text (text, 1, prefix);
632     }
633
634     term_gen->index_text (text);
635
636     return NOTMUCH_PRIVATE_STATUS_SUCCESS;
637 }
638
639 /* Remove a name:value term from 'message', (the actual term will be
640  * encoded by prefixing the value with a short prefix). See
641  * NORMAL_PREFIX and BOOLEAN_PREFIX arrays for the mapping of term
642  * names to prefix values.
643  *
644  * This change will not be reflected in the database until the next
645  * call to _notmuch_message_set_sync. */
646 notmuch_private_status_t
647 _notmuch_message_remove_term (notmuch_message_t *message,
648                               const char *prefix_name,
649                               const char *value)
650 {
651     char *term;
652
653     if (value == NULL)
654         return NOTMUCH_PRIVATE_STATUS_NULL_POINTER;
655
656     term = talloc_asprintf (message, "%s%s",
657                             _find_prefix (prefix_name), value);
658
659     if (strlen (term) > NOTMUCH_TERM_MAX)
660         return NOTMUCH_PRIVATE_STATUS_TERM_TOO_LONG;
661
662     try {
663         message->doc.remove_term (term);
664     } catch (const Xapian::InvalidArgumentError) {
665         /* We'll let the philosopher's try to wrestle with the
666          * question of whether failing to remove that which was not
667          * there in the first place is failure. For us, we'll silently
668          * consider it all good. */
669     }
670
671     talloc_free (term);
672
673     return NOTMUCH_PRIVATE_STATUS_SUCCESS;
674 }
675
676 notmuch_status_t
677 notmuch_message_add_tag (notmuch_message_t *message, const char *tag)
678 {
679     notmuch_private_status_t status;
680
681     if (tag == NULL)
682         return NOTMUCH_STATUS_NULL_POINTER;
683
684     if (strlen (tag) > NOTMUCH_TAG_MAX)
685         return NOTMUCH_STATUS_TAG_TOO_LONG;
686
687     status = _notmuch_message_add_term (message, "tag", tag);
688     if (status) {
689         INTERNAL_ERROR ("_notmuch_message_add_term return unexpected value: %d\n",
690                         status);
691     }
692
693     if (! message->frozen)
694         _notmuch_message_sync (message);
695
696     return NOTMUCH_STATUS_SUCCESS;
697 }
698
699 notmuch_status_t
700 notmuch_message_remove_tag (notmuch_message_t *message, const char *tag)
701 {
702     notmuch_private_status_t status;
703
704     if (tag == NULL)
705         return NOTMUCH_STATUS_NULL_POINTER;
706
707     if (strlen (tag) > NOTMUCH_TAG_MAX)
708         return NOTMUCH_STATUS_TAG_TOO_LONG;
709
710     status = _notmuch_message_remove_term (message, "tag", tag);
711     if (status) {
712         INTERNAL_ERROR ("_notmuch_message_remove_term return unexpected value: %d\n",
713                         status);
714     }
715
716     if (! message->frozen)
717         _notmuch_message_sync (message);
718
719     return NOTMUCH_STATUS_SUCCESS;
720 }
721
722 void
723 notmuch_message_remove_all_tags (notmuch_message_t *message)
724 {
725     notmuch_private_status_t status;
726     notmuch_tags_t *tags;
727     const char *tag;
728
729     for (tags = notmuch_message_get_tags (message);
730          notmuch_tags_has_more (tags);
731          notmuch_tags_advance (tags))
732     {
733         tag = notmuch_tags_get (tags);
734
735         status = _notmuch_message_remove_term (message, "tag", tag);
736         if (status) {
737             INTERNAL_ERROR ("_notmuch_message_remove_term return unexpected value: %d\n",
738                             status);
739         }
740     }
741
742     if (! message->frozen)
743         _notmuch_message_sync (message);
744 }
745
746 void
747 notmuch_message_freeze (notmuch_message_t *message)
748 {
749     message->frozen++;
750 }
751
752 notmuch_status_t
753 notmuch_message_thaw (notmuch_message_t *message)
754 {
755     if (message->frozen > 0) {
756         message->frozen--;
757         if (message->frozen == 0)
758             _notmuch_message_sync (message);
759         return NOTMUCH_STATUS_SUCCESS;
760     } else {
761         return NOTMUCH_STATUS_UNBALANCED_FREEZE_THAW;
762     }
763 }
764
765 void
766 notmuch_message_destroy (notmuch_message_t *message)
767 {
768     talloc_free (message);
769 }