]> git.notmuchmail.org Git - notmuch/blobdiff - notmuch-new.c
emacs: Add new option notmuch-search-hide-excluded
[notmuch] / notmuch-new.c
index 56c4a6fdd62a3f25709de37730bd0864532bf5bb..4a53e3ebcc064cc531b8cb6255c422ff35938b30 100644 (file)
  * GNU General Public License for more details.
  *
  * You should have received a copy of the GNU General Public License
- * along with this program.  If not, see http://www.gnu.org/licenses/ .
+ * along with this program.  If not, see https://www.gnu.org/licenses/ .
  *
  * Author: Carl Worth <cworth@cworth.org>
  */
 
 #include "notmuch-client.h"
+#include "tag-util.h"
 
 #include <unistd.h>
 
@@ -34,18 +35,31 @@ typedef struct _filename_list {
     _filename_node_t **tail;
 } _filename_list_t;
 
+enum verbosity {
+    VERBOSITY_QUIET,
+    VERBOSITY_NORMAL,
+    VERBOSITY_VERBOSE,
+};
+
 typedef struct {
+    const char *db_path;
+    const char *mail_root;
+
+    notmuch_indexopts_t *indexopts;
     int output_is_a_tty;
-    int verbose;
-    int debug;
-    const char **new_tags;
-    size_t new_tags_length;
-    const char **new_ignore;
-    size_t new_ignore_length;
+    enum verbosity verbosity;
+    bool debug;
+    bool full_scan;
+    notmuch_config_values_t *new_tags;
+    const char **ignore_verbatim;
+    size_t ignore_verbatim_length;
+    regex_t *ignore_regex;
+    size_t ignore_regex_length;
 
     int total_files;
     int processed_files;
     int added_messages, removed_messages, renamed_messages;
+    int vanished_files;
     struct timeval tv_start;
 
     _filename_list_t *removed_files;
@@ -68,13 +82,13 @@ static volatile sig_atomic_t interrupted;
 static void
 handle_sigint (unused (int sig))
 {
-    static char msg[] = "Stopping...         \n";
+    static const char msg[] = "Stopping...         \n";
 
     /* This write is "opportunistic", so it's okay to ignore the
      * result.  It is not required for correctness, and if it does
      * fail or produce a short write, we want to get out of the signal
      * handler as quickly as possible, not retry it. */
-    IGNORE_RESULT (write (2, msg, sizeof(msg)-1));
+    IGNORE_RESULT (write (2, msg, sizeof (msg) - 1));
     interrupted = 1;
 }
 
@@ -123,10 +137,10 @@ generic_print_progress (const char *action, const char *object,
     elapsed_overall = notmuch_time_elapsed (tv_start, tv_now);
     rate_overall = processed / elapsed_overall;
 
-    printf ("%s %d ", action, processed);
+    printf ("%s %u ", action, processed);
 
     if (total) {
-       printf ("of %d %s", total, object);
+       printf ("of %u %s", total, object);
        if (processed > 0 && elapsed_overall > 0.5) {
            double time_remaining = ((total - processed) / rate_overall);
            printf (" (");
@@ -167,27 +181,27 @@ dirent_type (const char *path, const struct dirent *entry)
     char *abspath;
     int err, saved_errno;
 
-#ifdef _DIRENT_HAVE_D_TYPE
+#if HAVE_D_TYPE
     /* Mapping from d_type to stat mode_t.  We omit DT_LNK so that
      * we'll fall through to stat and get the real file type. */
     static const mode_t modes[] = {
-       [DT_BLK]  = S_IFBLK,
-       [DT_CHR]  = S_IFCHR,
-       [DT_DIR]  = S_IFDIR,
+       [DT_BLK] = S_IFBLK,
+       [DT_CHR] = S_IFCHR,
+       [DT_DIR] = S_IFDIR,
        [DT_FIFO] = S_IFIFO,
-       [DT_REG]  = S_IFREG,
+       [DT_REG] = S_IFREG,
        [DT_SOCK] = S_IFSOCK
     };
-    if (entry->d_type < ARRAY_SIZE(modes) && modes[entry->d_type])
+    if (entry->d_type < ARRAY_SIZE (modes) && modes[entry->d_type])
        return modes[entry->d_type];
 #endif
 
     abspath = talloc_asprintf (NULL, "%s/%s", path, entry->d_name);
-    if (!abspath) {
+    if (! abspath) {
        errno = ENOMEM;
        return -1;
     }
-    err = stat(abspath, &statbuf);
+    err = stat (abspath, &statbuf);
     saved_errno = errno;
     talloc_free (abspath);
     if (err < 0) {
@@ -213,10 +227,9 @@ _entries_resemble_maildir (const char *path, struct dirent **entries, int count)
        if (dirent_type (path, entries[i]) != S_IFDIR)
            continue;
 
-       if (strcmp(entries[i]->d_name, "new") == 0 ||
-           strcmp(entries[i]->d_name, "cur") == 0 ||
-           strcmp(entries[i]->d_name, "tmp") == 0)
-       {
+       if (strcmp (entries[i]->d_name, "new") == 0 ||
+           strcmp (entries[i]->d_name, "cur") == 0 ||
+           strcmp (entries[i]->d_name, "tmp") == 0) {
            found++;
            if (found == 3)
                return 1;
@@ -226,18 +239,208 @@ _entries_resemble_maildir (const char *path, struct dirent **entries, int count)
     return 0;
 }
 
+static bool
+_special_directory (const char *entry)
+{
+    return strcmp (entry, ".") == 0 || strcmp (entry, "..") == 0;
+}
+
+static bool
+_setup_ignore (notmuch_database_t *notmuch, add_files_state_t *state)
+{
+    notmuch_config_values_t *ignore_list;
+    int nregex = 0, nverbatim = 0;
+    const char **verbatim = NULL;
+    regex_t *regex = NULL;
+
+    for (ignore_list = notmuch_config_get_values (notmuch, NOTMUCH_CONFIG_NEW_IGNORE);
+        notmuch_config_values_valid (ignore_list);
+        notmuch_config_values_move_to_next (ignore_list)) {
+       const char *s = notmuch_config_values_get (ignore_list);
+       size_t len = strlen (s);
+
+       if (len == 0) {
+           fprintf (stderr, "Error: Empty string in new.ignore list\n");
+           return false;
+       }
+
+       if (s[0] == '/') {
+           regex_t *preg;
+           char *r;
+           int rerr;
+
+           if (len < 3 || s[len - 1] != '/') {
+               fprintf (stderr, "Error: Malformed pattern '%s' in new.ignore\n",
+                        s);
+               return false;
+           }
+
+           r = talloc_strndup (notmuch, s + 1, len - 2);
+           regex = talloc_realloc (notmuch, regex, regex_t, nregex + 1);
+           preg = &regex[nregex];
+
+           rerr = regcomp (preg, r, REG_EXTENDED | REG_NOSUB);
+           if (rerr) {
+               size_t error_size = regerror (rerr, preg, NULL, 0);
+               char *error = talloc_size (r, error_size);
+
+               regerror (rerr, preg, error, error_size);
+
+               fprintf (stderr, "Error: Invalid regex '%s' in new.ignore: %s\n",
+                        r, error);
+               return false;
+           }
+           nregex++;
+
+           talloc_free (r);
+       } else {
+           verbatim = talloc_realloc (notmuch, verbatim, const char *,
+                                      nverbatim + 1);
+           verbatim[nverbatim++] = s;
+       }
+    }
+
+    state->ignore_regex = regex;
+    state->ignore_regex_length = nregex;
+    state->ignore_verbatim = verbatim;
+    state->ignore_verbatim_length = nverbatim;
+
+    return true;
+}
+
+static char *
+_get_relative_path (const char *mail_root, const char *dirpath, const char *entry)
+{
+    size_t mail_root_len = strlen (mail_root);
+
+    /* paranoia? */
+    if (strncmp (dirpath, mail_root, mail_root_len) != 0) {
+       fprintf (stderr, "Warning: '%s' is not a subdirectory of '%s'\n",
+                dirpath, mail_root);
+       return NULL;
+    }
+
+    dirpath += mail_root_len;
+    while (*dirpath == '/')
+       dirpath++;
+
+    if (*dirpath)
+       return talloc_asprintf (NULL, "%s/%s", dirpath, entry);
+    else
+       return talloc_strdup (NULL, entry);
+}
+
 /* Test if the file/directory is to be ignored.
  */
-static notmuch_bool_t
-_entry_in_ignore_list (const char *entry, add_files_state_t *state)
+static bool
+_entry_in_ignore_list (add_files_state_t *state, const char *dirpath,
+                      const char *entry)
 {
+    bool ret = false;
     size_t i;
+    char *path;
+
+    for (i = 0; i < state->ignore_verbatim_length; i++) {
+       if (strcmp (entry, state->ignore_verbatim[i]) == 0)
+           return true;
+    }
+
+    if (state->ignore_regex_length == 0)
+       return false;
+
+    path = _get_relative_path (state->mail_root, dirpath, entry);
+    if (! path)
+       return false;
+
+    for (i = 0; i < state->ignore_regex_length; i++) {
+       if (regexec (&state->ignore_regex[i], path, 0, NULL, 0) == 0) {
+           ret = true;
+           break;
+       }
+    }
+
+    talloc_free (path);
+
+    return ret;
+}
+
+/* Add a single file to the database. */
+static notmuch_status_t
+add_file (notmuch_database_t *notmuch, const char *filename,
+         add_files_state_t *state)
+{
+    notmuch_message_t *message = NULL;
+    const char *tag;
+    notmuch_status_t status;
+
+    status = notmuch_database_begin_atomic (notmuch);
+    if (status)
+       goto DONE;
+
+    status = notmuch_database_index_file (notmuch, filename, state->indexopts, &message);
+    switch (status) {
+    /* Success. */
+    case NOTMUCH_STATUS_SUCCESS:
+       state->added_messages++;
+       notmuch_message_freeze (message);
+       if (state->synchronize_flags)
+           notmuch_message_maildir_flags_to_tags (message);
 
-    for (i = 0; i < state->new_ignore_length; i++)
-       if (strcmp (entry, state->new_ignore[i]) == 0)
-           return TRUE;
+       for (notmuch_config_values_start (state->new_tags);
+            notmuch_config_values_valid (state->new_tags);
+            notmuch_config_values_move_to_next (state->new_tags)) {
+           notmuch_bool_t is_set;
+
+           tag = notmuch_config_values_get (state->new_tags);
+           /* Currently all errors from has_maildir_flag are fatal */
+           if ((status = notmuch_message_has_maildir_flag_st (message, 'S', &is_set)))
+               goto DONE;
+           if (strcmp ("unread", tag) != 0 || ! is_set) {
+               notmuch_message_add_tag (message, tag);
+           }
+       }
+
+       notmuch_message_thaw (message);
+       break;
+    /* Non-fatal issues (go on to next file). */
+    case NOTMUCH_STATUS_DUPLICATE_MESSAGE_ID:
+       if (state->synchronize_flags) {
+           status = notmuch_message_maildir_flags_to_tags (message);
+           if (print_status_message ("add_file", message, status))
+               goto DONE;
+       }
+       break;
+    case NOTMUCH_STATUS_FILE_NOT_EMAIL:
+       fprintf (stderr, "Note: Ignoring non-mail file: %s\n", filename);
+       break;
+    case NOTMUCH_STATUS_PATH_ERROR:
+       fprintf (stderr, "Note: Ignoring non-indexable path: %s\n", filename);
+       (void) print_status_database ("add_file", notmuch, status);
+       break;
+    case NOTMUCH_STATUS_FILE_ERROR:
+       /* Someone renamed/removed the file between scandir and now. */
+       state->vanished_files++;
+       fprintf (stderr, "Unexpected error with file %s\n", filename);
+       (void) print_status_database ("add_file", notmuch, status);
+       break;
+    /* Fatal issues. Don't process anymore. */
+    case NOTMUCH_STATUS_READ_ONLY_DATABASE:
+    case NOTMUCH_STATUS_XAPIAN_EXCEPTION:
+    case NOTMUCH_STATUS_OUT_OF_MEMORY:
+       (void) print_status_database ("add_file", notmuch, status);
+       goto DONE;
+    default:
+       INTERNAL_ERROR ("add_message returned unexpected value: %d", status);
+       goto DONE;
+    }
+
+    status = notmuch_database_end_atomic (notmuch);
+
+  DONE:
+    if (message)
+       notmuch_message_destroy (message);
 
-    return FALSE;
+    return status;
 }
 
 /* Examine 'path' recursively as follows:
@@ -286,12 +489,10 @@ add_files (notmuch_database_t *notmuch,
           const char *path,
           add_files_state_t *state)
 {
-    DIR *dir = NULL;
     struct dirent *entry = NULL;
     char *next = NULL;
     time_t fs_mtime, db_mtime;
     notmuch_status_t status, ret = NOTMUCH_STATUS_SUCCESS;
-    notmuch_message_t *message = NULL;
     struct dirent **fs_entries = NULL;
     int i, num_fs_entries = 0, entry_type;
     notmuch_directory_t *directory;
@@ -299,8 +500,7 @@ add_files (notmuch_database_t *notmuch,
     notmuch_filenames_t *db_subdirs = NULL;
     time_t stat_time;
     struct stat st;
-    notmuch_bool_t is_maildir;
-    const char **tag;
+    bool is_maildir;
 
     if (stat (path, &st)) {
        fprintf (stderr, "Error reading directory %s: %s\n",
@@ -323,6 +523,35 @@ add_files (notmuch_database_t *notmuch,
     }
     db_mtime = directory ? notmuch_directory_get_mtime (directory) : 0;
 
+    /* If the directory is unchanged from our last scan and has no
+     * sub-directories, then return without scanning it at all.  In
+     * some situations, skipping the scan can substantially reduce the
+     * cost of notmuch new, especially since the huge numbers of files
+     * in Maildirs make scans expensive, but all files live in leaf
+     * directories.
+     *
+     * To check for sub-directories, we borrow a trick from find,
+     * kpathsea, and many other UNIX tools: since a directory's link
+     * count is the number of sub-directories (specifically, their
+     * '..' entries) plus 2 (the link from the parent and the link for
+     * '.').  This check is safe even on weird file systems, since
+     * file systems that can't compute this will return 0 or 1.  This
+     * is safe even on *really* weird file systems like HFS+ that
+     * mistakenly return the total number of directory entries, since
+     * that only inflates the count beyond 2.
+     */
+    if (directory && (! state->full_scan) && fs_mtime == db_mtime && st.st_nlink == 2) {
+       /* There's one catch: pass 1 below considers symlinks to
+        * directories to be directories, but these don't increase the
+        * file system link count.  So, only bail early if the
+        * database agrees that there are no sub-directories. */
+       db_subdirs = notmuch_directory_get_child_directories (directory);
+       if (! notmuch_filenames_valid (db_subdirs))
+           goto DONE;
+       notmuch_filenames_destroy (db_subdirs);
+       db_subdirs = NULL;
+    }
+
     /* If the database knows about this directory, then we sort based
      * on strcmp to match the database sorting. Otherwise, we can do
      * inode-based sorting for faster filesystem operation. */
@@ -344,12 +573,25 @@ add_files (notmuch_database_t *notmuch,
     /* Pass 1: Recurse into all sub-directories. */
     is_maildir = _entries_resemble_maildir (path, fs_entries, num_fs_entries);
 
-    for (i = 0; i < num_fs_entries; i++) {
-       if (interrupted)
-           break;
-
+    for (i = 0; i < num_fs_entries && ! interrupted; i++) {
        entry = fs_entries[i];
 
+       /* Ignore special directories to avoid infinite recursion. */
+       if (_special_directory (entry->d_name))
+           continue;
+
+       /* Ignore any files/directories the user has configured to
+        * ignore.  We do this before dirent_type both for performance
+        * and because we don't care if dirent_type fails on entries
+        * that are explicitly ignored.
+        */
+       if (_entry_in_ignore_list (state, path, entry->d_name)) {
+           if (state->debug)
+               printf ("(D) add_files, pass 1: explicitly ignoring %s/%s\n",
+                       path, entry->d_name);
+           continue;
+       }
+
        /* We only want to descend into directories (and symlinks to
         * directories). */
        entry_type = dirent_type (path, entry);
@@ -363,23 +605,13 @@ add_files (notmuch_database_t *notmuch,
            continue;
        }
 
-       /* Ignore special directories to avoid infinite recursion.
-        * Also ignore the .notmuch directory, any "tmp" directory
-        * that appears within a maildir and files/directories
-        * the user has configured to be ignored.
+       /* Ignore any top level .notmuch directory and any "tmp" directory
+        * that appears within a maildir.
         */
-       if (strcmp (entry->d_name, ".") == 0 ||
-           strcmp (entry->d_name, "..") == 0 ||
-           (is_maildir && strcmp (entry->d_name, "tmp") == 0) ||
-           strcmp (entry->d_name, ".notmuch") == 0 ||
-           _entry_in_ignore_list (entry->d_name, state))
-       {
-           if (_entry_in_ignore_list (entry->d_name, state) && state->debug)
-               printf ("(D) add_files_recursive, pass 1: explicitly ignoring %s/%s\n",
-                       path,
-                       entry->d_name);
+       if ((is_maildir && strcmp (entry->d_name, "tmp") == 0) ||
+           (strcmp (entry->d_name, ".notmuch") == 0
+            && (strcmp (path, state->mail_root)) == 0))
            continue;
-       }
 
        next = talloc_asprintf (notmuch, "%s/%s", path, entry->d_name);
        status = add_files (notmuch, next, state);
@@ -400,7 +632,7 @@ add_files (notmuch_database_t *notmuch,
      * being discovered until the clock catches up and the directory
      * is modified again).
      */
-    if (directory && fs_mtime == db_mtime)
+    if (directory && (! state->full_scan) && fs_mtime == db_mtime)
        goto DONE;
 
     /* If the database has never seen this directory before, we can
@@ -411,45 +643,49 @@ add_files (notmuch_database_t *notmuch,
     }
 
     /* Pass 2: Scan for new files, removed files, and removed directories. */
-    for (i = 0; i < num_fs_entries; i++)
-    {
-       if (interrupted)
-           break;
+    for (i = 0; i < num_fs_entries && ! interrupted; i++) {
+       entry = fs_entries[i];
 
-        entry = fs_entries[i];
+       /* Ignore special directories early. */
+       if (_special_directory (entry->d_name))
+           continue;
 
        /* Ignore files & directories user has configured to be ignored */
-       if (_entry_in_ignore_list (entry->d_name, state)) {
+       if (_entry_in_ignore_list (state, path, entry->d_name)) {
            if (state->debug)
-               printf ("(D) add_files_recursive, pass 2: explicitly ignoring %s/%s\n",
-                       path,
-                       entry->d_name);
+               printf ("(D) add_files, pass 2: explicitly ignoring %s/%s\n",
+                       path, entry->d_name);
            continue;
        }
 
        /* Check if we've walked past any names in db_files or
         * db_subdirs. If so, these have been deleted. */
        while (notmuch_filenames_valid (db_files) &&
-              strcmp (notmuch_filenames_get (db_files), entry->d_name) < 0)
-       {
+              strcmp (notmuch_filenames_get (db_files), entry->d_name) < 0) {
            char *absolute = talloc_asprintf (state->removed_files,
                                              "%s/%s", path,
                                              notmuch_filenames_get (db_files));
 
+           if (state->debug)
+               printf ("(D) add_files, pass 2: queuing passed file %s for deletion from database\n",
+                       absolute);
+
            _filename_list_add (state->removed_files, absolute);
 
            notmuch_filenames_move_to_next (db_files);
        }
 
        while (notmuch_filenames_valid (db_subdirs) &&
-              strcmp (notmuch_filenames_get (db_subdirs), entry->d_name) <= 0)
-       {
+              strcmp (notmuch_filenames_get (db_subdirs), entry->d_name) <= 0) {
            const char *filename = notmuch_filenames_get (db_subdirs);
 
-           if (strcmp (filename, entry->d_name) < 0)
-           {
+           if (strcmp (filename, entry->d_name) < 0) {
                char *absolute = talloc_asprintf (state->removed_directories,
                                                  "%s/%s", path, filename);
+               if (state->debug)
+                   printf (
+                       "(D) add_files, pass 2: queuing passed directory %s for deletion from database\n",
+                       absolute);
 
                _filename_list_add (state->removed_directories, absolute);
            }
@@ -469,8 +705,7 @@ add_files (notmuch_database_t *notmuch,
 
        /* Don't add a file that we've added before. */
        if (notmuch_filenames_valid (db_files) &&
-           strcmp (notmuch_filenames_get (db_files), entry->d_name) == 0)
-       {
+           strcmp (notmuch_filenames_get (db_files), entry->d_name) == 0) {
            notmuch_filenames_move_to_next (db_files);
            continue;
        }
@@ -481,76 +716,23 @@ add_files (notmuch_database_t *notmuch,
 
        state->processed_files++;
 
-       if (state->verbose) {
+       if (state->verbosity >= VERBOSITY_VERBOSE) {
            if (state->output_is_a_tty)
-               printf("\r\033[K");
+               printf ("\r\033[K");
 
-           printf ("%i/%i: %s",
-                   state->processed_files,
-                   state->total_files,
+           printf ("%i/%i: %s", state->processed_files, state->total_files,
                    next);
 
-           putchar((state->output_is_a_tty) ? '\r' : '\n');
+           putchar ((state->output_is_a_tty) ? '\r' : '\n');
            fflush (stdout);
        }
 
-       status = notmuch_database_begin_atomic (notmuch);
+       status = add_file (notmuch, next, state);
        if (status) {
            ret = status;
            goto DONE;
        }
 
-       status = notmuch_database_add_message (notmuch, next, &message);
-       switch (status) {
-       /* success */
-       case NOTMUCH_STATUS_SUCCESS:
-           state->added_messages++;
-           notmuch_message_freeze (message);
-           for (tag=state->new_tags; *tag != NULL; tag++)
-               notmuch_message_add_tag (message, *tag);
-           if (state->synchronize_flags == TRUE)
-               notmuch_message_maildir_flags_to_tags (message);
-           notmuch_message_thaw (message);
-           break;
-       /* Non-fatal issues (go on to next file) */
-       case NOTMUCH_STATUS_DUPLICATE_MESSAGE_ID:
-           if (state->synchronize_flags == TRUE)
-               notmuch_message_maildir_flags_to_tags (message);
-           break;
-       case NOTMUCH_STATUS_FILE_NOT_EMAIL:
-           fprintf (stderr, "Note: Ignoring non-mail file: %s\n",
-                    next);
-           break;
-       /* Fatal issues. Don't process anymore. */
-       case NOTMUCH_STATUS_READ_ONLY_DATABASE:
-       case NOTMUCH_STATUS_XAPIAN_EXCEPTION:
-       case NOTMUCH_STATUS_OUT_OF_MEMORY:
-           fprintf (stderr, "Error: %s. Halting processing.\n",
-                    notmuch_status_to_string (status));
-           ret = status;
-           goto DONE;
-       default:
-       case NOTMUCH_STATUS_FILE_ERROR:
-       case NOTMUCH_STATUS_NULL_POINTER:
-       case NOTMUCH_STATUS_TAG_TOO_LONG:
-       case NOTMUCH_STATUS_UNBALANCED_FREEZE_THAW:
-       case NOTMUCH_STATUS_UNBALANCED_ATOMIC:
-       case NOTMUCH_STATUS_LAST_STATUS:
-           INTERNAL_ERROR ("add_message returned unexpected value: %d",  status);
-           goto DONE;
-       }
-
-       status = notmuch_database_end_atomic (notmuch);
-       if (status) {
-           ret = status;
-           goto DONE;
-       }
-
-       if (message) {
-           notmuch_message_destroy (message);
-           message = NULL;
-       }
-
        if (do_print_progress) {
            do_print_progress = 0;
            generic_print_progress ("Processed", "files", state->tv_start,
@@ -566,23 +748,29 @@ add_files (notmuch_database_t *notmuch,
 
     /* Now that we've walked the whole filesystem list, anything left
      * over in the database lists has been deleted. */
-    while (notmuch_filenames_valid (db_files))
-    {
+    while (notmuch_filenames_valid (db_files)) {
        char *absolute = talloc_asprintf (state->removed_files,
                                          "%s/%s", path,
                                          notmuch_filenames_get (db_files));
+       if (state->debug)
+           printf ("(D) add_files, pass 3: queuing leftover file %s for deletion from database\n",
+                   absolute);
 
        _filename_list_add (state->removed_files, absolute);
 
        notmuch_filenames_move_to_next (db_files);
     }
 
-    while (notmuch_filenames_valid (db_subdirs))
-    {
+    while (notmuch_filenames_valid (db_subdirs)) {
        char *absolute = talloc_asprintf (state->removed_directories,
                                          "%s/%s", path,
                                          notmuch_filenames_get (db_subdirs));
 
+       if (state->debug)
+           printf (
+               "(D) add_files, pass 3: queuing leftover directory %s for deletion from database\n",
+               absolute);
+
        _filename_list_add (state->removed_directories, absolute);
 
        notmuch_filenames_move_to_next (db_subdirs);
@@ -599,8 +787,6 @@ add_files (notmuch_database_t *notmuch,
   DONE:
     if (next)
        talloc_free (next);
-    if (dir)
-       closedir (dir);
     if (fs_entries) {
        for (i = 0; i < num_fs_entries; i++)
            free (fs_entries[i]);
@@ -623,7 +809,7 @@ setup_progress_printing_timer (void)
     struct sigaction action;
     struct itimerval timerval;
 
-    /* Setup our handler for SIGALRM */
+    /* Set up our handler for SIGALRM */
     memset (&action, 0, sizeof (struct sigaction));
     action.sa_handler = handle_sigalrm;
     sigemptyset (&action.sa_mask);
@@ -668,10 +854,9 @@ count_files (const char *path, int *count, add_files_state_t *state)
 {
     struct dirent *entry = NULL;
     char *next;
-    struct stat st;
     struct dirent **fs_entries = NULL;
     int num_fs_entries = scandir (path, &fs_entries, 0, dirent_sort_inode);
-    int i = 0;
+    int entry_type, i;
 
     if (num_fs_entries == -1) {
        fprintf (stderr, "Warning: failed to open directory %s: %s\n",
@@ -679,25 +864,23 @@ count_files (const char *path, int *count, add_files_state_t *state)
        goto DONE;
     }
 
-    while (!interrupted) {
-        if (i == num_fs_entries)
-           break;
-
-        entry = fs_entries[i++];
+    for (i = 0; i < num_fs_entries && ! interrupted; i++) {
+       entry = fs_entries[i];
 
        /* Ignore special directories to avoid infinite recursion.
-        * Also ignore the .notmuch directory and files/directories
-        * the user has configured to be ignored.
+        * Also ignore the .notmuch directory.
+        */
+       if (_special_directory (entry->d_name) ||
+           strcmp (entry->d_name, ".notmuch") == 0)
+           continue;
+
+       /* Ignore any files/directories the user has configured to be
+        * ignored
         */
-       if (strcmp (entry->d_name, ".") == 0 ||
-           strcmp (entry->d_name, "..") == 0 ||
-           strcmp (entry->d_name, ".notmuch") == 0 ||
-           _entry_in_ignore_list (entry->d_name, state))
-       {
-           if (_entry_in_ignore_list (entry->d_name, state) && state->debug)
+       if (_entry_in_ignore_list (state, path, entry->d_name)) {
+           if (state->debug)
                printf ("(D) count_files: explicitly ignoring %s/%s\n",
-                       path,
-                       entry->d_name);
+                       path, entry->d_name);
            continue;
        }
 
@@ -708,15 +891,14 @@ count_files (const char *path, int *count, add_files_state_t *state)
            continue;
        }
 
-       stat (next, &st);
-
-       if (S_ISREG (st.st_mode)) {
+       entry_type = dirent_type (path, entry);
+       if (entry_type == S_IFREG) {
            *count = *count + 1;
-           if (*count % 1000 == 0) {
+           if (*count % 1000 == 0 && state->verbosity >= VERBOSITY_NORMAL) {
                printf ("Found %d files so far.\r", *count);
                fflush (stdout);
            }
-       } else if (S_ISDIR (st.st_mode)) {
+       } else if (entry_type == S_IFDIR) {
            count_files (next, count, state);
        }
 
@@ -728,7 +910,7 @@ count_files (const char *path, int *count, add_files_state_t *state)
        for (i = 0; i < num_fs_entries; i++)
            free (fs_entries[i]);
 
-        free (fs_entries);
+       free (fs_entries);
     }
 }
 
@@ -766,6 +948,7 @@ remove_filename (notmuch_database_t *notmuch,
 {
     notmuch_status_t status;
     notmuch_message_t *message;
+
     status = notmuch_database_begin_atomic (notmuch);
     if (status)
        return status;
@@ -776,7 +959,7 @@ remove_filename (notmuch_database_t *notmuch,
     status = notmuch_database_remove_message (notmuch, path);
     if (status == NOTMUCH_STATUS_DUPLICATE_MESSAGE_ID) {
        add_files_state->renamed_messages++;
-       if (add_files_state->synchronize_flags == TRUE)
+       if (add_files_state->synchronize_flags == true)
            notmuch_message_maildir_flags_to_tags (message);
        status = NOTMUCH_STATUS_SUCCESS;
     } else if (status == NOTMUCH_STATUS_SUCCESS) {
@@ -792,25 +975,23 @@ remove_filename (notmuch_database_t *notmuch,
 /* Recursively remove all filenames from the database referring to
  * 'path' (or to any of its children). */
 static notmuch_status_t
-_remove_directory (void *ctx,
-                  notmuch_database_t *notmuch,
+_remove_directory (notmuch_database_t *notmuch,
                   const char *path,
                   add_files_state_t *add_files_state)
 {
-    notmuch_status_t status = NOTMUCH_STATUS_SUCCESS;
+    notmuch_status_t status;
     notmuch_directory_t *directory;
     notmuch_filenames_t *files, *subdirs;
     char *absolute;
 
     status = notmuch_database_get_directory (notmuch, path, &directory);
-    if (status || !directory)
+    if (status || ! directory)
        return status;
 
     for (files = notmuch_directory_get_child_files (directory);
         notmuch_filenames_valid (files);
-        notmuch_filenames_move_to_next (files))
-    {
-       absolute = talloc_asprintf (ctx, "%s/%s", path,
+        notmuch_filenames_move_to_next (files)) {
+       absolute = talloc_asprintf (notmuch, "%s/%s", path,
                                    notmuch_filenames_get (files));
        status = remove_filename (notmuch, absolute, add_files_state);
        talloc_free (absolute);
@@ -820,107 +1001,238 @@ _remove_directory (void *ctx,
 
     for (subdirs = notmuch_directory_get_child_directories (directory);
         notmuch_filenames_valid (subdirs);
-        notmuch_filenames_move_to_next (subdirs))
-    {
-       absolute = talloc_asprintf (ctx, "%s/%s", path,
+        notmuch_filenames_move_to_next (subdirs)) {
+       absolute = talloc_asprintf (notmuch, "%s/%s", path,
                                    notmuch_filenames_get (subdirs));
-       status = _remove_directory (ctx, notmuch, absolute, add_files_state);
+       status = _remove_directory (notmuch, absolute, add_files_state);
        talloc_free (absolute);
        if (status)
            goto DONE;
     }
 
+    status = notmuch_directory_delete (directory);
+
   DONE:
-    notmuch_directory_destroy (directory);
+    if (status)
+       notmuch_directory_destroy (directory);
     return status;
 }
 
-int
-notmuch_new_command (void *ctx, int argc, char *argv[])
+static void
+print_results (const add_files_state_t *state)
 {
-    notmuch_config_t *config;
-    notmuch_database_t *notmuch;
-    add_files_state_t add_files_state;
     double elapsed;
-    struct timeval tv_now, tv_start;
+    struct timeval tv_now;
+
+    gettimeofday (&tv_now, NULL);
+    elapsed = notmuch_time_elapsed (state->tv_start, tv_now);
+
+    if (state->processed_files) {
+       printf ("Processed %d %s in ", state->processed_files,
+               state->processed_files == 1 ? "file" : "total files");
+       notmuch_time_print_formatted_seconds (elapsed);
+       if (elapsed > 1)
+           printf (" (%d files/sec.)",
+                   (int) (state->processed_files / elapsed));
+       printf (".%s\n", (state->output_is_a_tty) ? "\033[K" : "");
+    }
+
+    if (state->added_messages)
+       printf ("Added %d new %s to the database.", state->added_messages,
+               state->added_messages == 1 ? "message" : "messages");
+    else
+       printf ("No new mail.");
+
+    if (state->removed_messages)
+       printf (" Removed %d %s.", state->removed_messages,
+               state->removed_messages == 1 ? "message" : "messages");
+
+    if (state->renamed_messages)
+       printf (" Detected %d file %s.", state->renamed_messages,
+               state->renamed_messages == 1 ? "rename" : "renames");
+
+    printf ("\n");
+}
+
+static int
+_maybe_upgrade (notmuch_database_t *notmuch, add_files_state_t *state)
+{
+    if (notmuch_database_needs_upgrade (notmuch)) {
+       time_t now = time (NULL);
+       struct tm *gm_time = gmtime (&now);
+       int err;
+       notmuch_status_t status;
+       const char *backup_dir = notmuch_config_get (notmuch, NOTMUCH_CONFIG_BACKUP_DIR);
+       const char *backup_name;
+
+       err = mkdir (backup_dir, 0755);
+       if (err && errno != EEXIST) {
+           fprintf (stderr, "Failed to create %s: %s\n", backup_dir, strerror (errno));
+           return EXIT_FAILURE;
+       }
+
+       /* since dump files are written atomically, the amount of
+        * harm from overwriting one within a second seems
+        * relatively small. */
+       backup_name = talloc_asprintf (notmuch, "%s/dump-%04d%02d%02dT%02d%02d%02d.gz",
+                                      backup_dir,
+                                      gm_time->tm_year + 1900,
+                                      gm_time->tm_mon + 1,
+                                      gm_time->tm_mday,
+                                      gm_time->tm_hour,
+                                      gm_time->tm_min,
+                                      gm_time->tm_sec);
+
+       if (state->verbosity >= VERBOSITY_NORMAL) {
+           printf ("Welcome to a new version of notmuch! Your database will now be upgraded.\n");
+           printf ("This process is safe to interrupt.\n");
+           printf ("Backing up tags to %s...\n", backup_name);
+       }
+
+       if (notmuch_database_dump (notmuch, backup_name, "",
+                                  DUMP_FORMAT_BATCH_TAG, DUMP_INCLUDE_DEFAULT, true)) {
+           fprintf (stderr, "Backup failed. Aborting upgrade.");
+           return EXIT_FAILURE;
+       }
+
+       gettimeofday (&state->tv_start, NULL);
+       status = notmuch_database_upgrade (
+           notmuch,
+           state->verbosity >= VERBOSITY_NORMAL ? upgrade_print_progress : NULL,
+           state);
+       if (status) {
+           printf ("Upgrade failed: %s\n",
+                   notmuch_status_to_string (status));
+           notmuch_database_destroy (notmuch);
+           return EXIT_FAILURE;
+       }
+       if (state->verbosity >= VERBOSITY_NORMAL)
+           printf ("Your notmuch database has now been upgraded.\n");
+    }
+    return EXIT_SUCCESS;
+}
+
+int
+notmuch_new_command (notmuch_database_t *notmuch, int argc, char *argv[])
+{
+    add_files_state_t add_files_state = {
+       .verbosity = VERBOSITY_NORMAL,
+       .debug = false,
+       .full_scan = false,
+       .output_is_a_tty = isatty (fileno (stdout)),
+    };
+    struct timeval tv_start;
     int ret = 0;
-    struct stat st;
-    const char *db_path;
-    char *dot_notmuch_path;
+    const char *db_path, *mail_root;
     struct sigaction action;
     _filename_node_t *f;
-    int i;
-    notmuch_bool_t timer_is_active = FALSE;
-    notmuch_bool_t run_hooks = TRUE;
-
-    add_files_state.verbose = 0;
-    add_files_state.debug = 0;
-    add_files_state.output_is_a_tty = isatty (fileno (stdout));
-
-    argc--; argv++; /* skip subcommand argument */
-
-    for (i = 0; i < argc && argv[i][0] == '-'; i++) {
-       if (STRNCMP_LITERAL (argv[i], "--verbose") == 0) {
-           add_files_state.verbose = 1;
-       } else if (strcmp (argv[i], "--debug") == 0) {
-           add_files_state.debug = 1;
-       } else if (strcmp (argv[i], "--no-hooks") == 0) {
-           run_hooks = FALSE;
-       } else {
-           fprintf (stderr, "Unrecognized option: %s\n", argv[i]);
-           return 1;
+    int opt_index;
+    unsigned int i;
+    bool timer_is_active = false;
+    bool hooks = true;
+    bool quiet = false, verbose = false;
+    notmuch_status_t status;
+
+    notmuch_opt_desc_t options[] = {
+       { .opt_bool = &quiet, .name = "quiet" },
+       { .opt_bool = &verbose, .name = "verbose" },
+       { .opt_bool = &add_files_state.debug, .name = "debug" },
+       { .opt_bool = &add_files_state.full_scan, .name = "full-scan" },
+       { .opt_bool = &hooks, .name = "hooks" },
+       { .opt_inherit = notmuch_shared_indexing_options },
+       { .opt_inherit = notmuch_shared_options },
+       { }
+    };
+
+    opt_index = parse_arguments (argc, argv, options, 1);
+    if (opt_index < 0)
+       return EXIT_FAILURE;
+
+    notmuch_process_shared_options (notmuch, argv[0]);
+
+    /* quiet trumps verbose */
+    if (quiet)
+       add_files_state.verbosity = VERBOSITY_QUIET;
+    else if (verbose)
+       add_files_state.verbosity = VERBOSITY_VERBOSE;
+
+    add_files_state.indexopts = notmuch_database_get_default_indexopts (notmuch);
+
+    add_files_state.new_tags = notmuch_config_get_values (notmuch, NOTMUCH_CONFIG_NEW_TAGS);
+
+    if (print_status_database (
+           "notmuch new",
+           notmuch,
+           notmuch_config_get_bool (notmuch, NOTMUCH_CONFIG_SYNC_MAILDIR_FLAGS,
+                                    &add_files_state.synchronize_flags)))
+       return EXIT_FAILURE;
+
+    db_path = notmuch_config_get (notmuch, NOTMUCH_CONFIG_DATABASE_PATH);
+    add_files_state.db_path = db_path;
+
+    mail_root = notmuch_config_get (notmuch, NOTMUCH_CONFIG_MAIL_ROOT);
+    add_files_state.mail_root = mail_root;
+
+    if (! _setup_ignore (notmuch, &add_files_state))
+       return EXIT_FAILURE;
+
+    for (notmuch_config_values_start (add_files_state.new_tags);
+        notmuch_config_values_valid (add_files_state.new_tags);
+        notmuch_config_values_move_to_next (add_files_state.new_tags)) {
+       const char *tag, *error_msg;
+
+       tag = notmuch_config_values_get (add_files_state.new_tags);
+       error_msg = illegal_tag (tag, false);
+       if (error_msg) {
+           fprintf (stderr, "Error: tag '%s' in new.tags: %s\n", tag, error_msg);
+           return EXIT_FAILURE;
        }
     }
-    config = notmuch_config_open (ctx, NULL, NULL);
-    if (config == NULL)
-       return 1;
 
-    add_files_state.new_tags = notmuch_config_get_new_tags (config, &add_files_state.new_tags_length);
-    add_files_state.new_ignore = notmuch_config_get_new_ignore (config, &add_files_state.new_ignore_length);
-    add_files_state.synchronize_flags = notmuch_config_get_maildir_synchronize_flags (config);
-    db_path = notmuch_config_get_database_path (config);
+    if (hooks) {
+       /* Drop write lock to run hook */
+       status = notmuch_database_reopen (notmuch, NOTMUCH_DATABASE_MODE_READ_ONLY);
+       if (print_status_database ("notmuch new", notmuch, status))
+           return EXIT_FAILURE;
 
-    if (run_hooks) {
-       ret = notmuch_run_hook (db_path, "pre-new");
+       ret = notmuch_run_hook (notmuch, "pre-new");
        if (ret)
-           return ret;
-    }
-
-    dot_notmuch_path = talloc_asprintf (ctx, "%s/%s", db_path, ".notmuch");
+           return EXIT_FAILURE;
 
-    if (stat (dot_notmuch_path, &st)) {
-       int count;
+       /* acquire write lock again */
+       status = notmuch_database_reopen (notmuch, NOTMUCH_DATABASE_MODE_READ_WRITE);
+       if (print_status_database ("notmuch new", notmuch, status))
+           return EXIT_FAILURE;
+    }
 
-       count = 0;
-       count_files (db_path, &count, &add_files_state);
+    if (notmuch_database_get_revision (notmuch, NULL) == 0) {
+       int count = 0;
+       count_files (mail_root, &count, &add_files_state);
        if (interrupted)
-           return 1;
+           return EXIT_FAILURE;
+
+       if (add_files_state.verbosity >= VERBOSITY_NORMAL)
+           printf ("Found %d total files (that's not much mail).\n", count);
 
-       printf ("Found %d total files (that's not much mail).\n", count);
-       if (notmuch_database_create (db_path, &notmuch))
-           return 1;
        add_files_state.total_files = count;
     } else {
-       if (notmuch_database_open (db_path, NOTMUCH_DATABASE_MODE_READ_WRITE,
-                                  &notmuch))
-           return 1;
-
-       if (notmuch_database_needs_upgrade (notmuch)) {
-           printf ("Welcome to a new version of notmuch! Your database will now be upgraded.\n");
-           gettimeofday (&add_files_state.tv_start, NULL);
-           notmuch_database_upgrade (notmuch, upgrade_print_progress,
-                                     &add_files_state);
-           printf ("Your notmuch database has now been upgraded to database format version %u.\n",
-                   notmuch_database_get_version (notmuch));
-       }
+       if (_maybe_upgrade (notmuch, &add_files_state))
+           return EXIT_FAILURE;
 
        add_files_state.total_files = 0;
     }
 
     if (notmuch == NULL)
-       return 1;
+       return EXIT_FAILURE;
+
+    status = notmuch_process_shared_indexing_options (add_files_state.indexopts);
+    if (status != NOTMUCH_STATUS_SUCCESS) {
+       fprintf (stderr, "Error: Failed to process index options. (%s)\n",
+                notmuch_status_to_string (status));
+       return EXIT_FAILURE;
+    }
 
-    /* Setup our handler for SIGINT. We do this after having
+    /* Set up our handler for SIGINT. We do this after having
      * potentially done a database upgrade we this interrupt handler
      * won't support. */
     memset (&action, 0, sizeof (struct sigaction));
@@ -929,56 +1241,50 @@ notmuch_new_command (void *ctx, int argc, char *argv[])
     action.sa_flags = SA_RESTART;
     sigaction (SIGINT, &action, NULL);
 
-    talloc_free (dot_notmuch_path);
-    dot_notmuch_path = NULL;
-
-    add_files_state.processed_files = 0;
-    add_files_state.added_messages = 0;
-    add_files_state.removed_messages = add_files_state.renamed_messages = 0;
     gettimeofday (&add_files_state.tv_start, NULL);
 
-    add_files_state.removed_files = _filename_list_create (ctx);
-    add_files_state.removed_directories = _filename_list_create (ctx);
-    add_files_state.directory_mtimes = _filename_list_create (ctx);
+    add_files_state.removed_files = _filename_list_create (notmuch);
+    add_files_state.removed_directories = _filename_list_create (notmuch);
+    add_files_state.directory_mtimes = _filename_list_create (notmuch);
 
-    if (! debugger_is_active () && add_files_state.output_is_a_tty
-       && ! add_files_state.verbose) {
+    if (add_files_state.verbosity == VERBOSITY_NORMAL &&
+       add_files_state.output_is_a_tty && ! debugger_is_active ()) {
        setup_progress_printing_timer ();
-       timer_is_active = TRUE;
+       timer_is_active = true;
     }
 
-    ret = add_files (notmuch, db_path, &add_files_state);
+    ret = add_files (notmuch, mail_root, &add_files_state);
     if (ret)
        goto DONE;
 
     gettimeofday (&tv_start, NULL);
-    for (f = add_files_state.removed_files->head; f && !interrupted; f = f->next) {
+    for (f = add_files_state.removed_files->head; f && ! interrupted; f = f->next) {
        ret = remove_filename (notmuch, f->filename, &add_files_state);
        if (ret)
            goto DONE;
        if (do_print_progress) {
            do_print_progress = 0;
            generic_print_progress ("Cleaned up", "messages",
-               tv_start, add_files_state.removed_messages + add_files_state.renamed_messages,
-               add_files_state.removed_files->count);
+                                   tv_start, add_files_state.removed_messages +
+                                   add_files_state.renamed_messages,
+                                   add_files_state.removed_files->count);
        }
     }
 
     gettimeofday (&tv_start, NULL);
-    for (f = add_files_state.removed_directories->head, i = 0; f && !interrupted; f = f->next, i++) {
-       ret = _remove_directory (ctx, notmuch, f->filename, &add_files_state);
+    for (f = add_files_state.removed_directories->head, i = 0; f && ! interrupted; f = f->next, i++) {
+       ret = _remove_directory (notmuch, f->filename, &add_files_state);
        if (ret)
            goto DONE;
        if (do_print_progress) {
            do_print_progress = 0;
            generic_print_progress ("Cleaned up", "directories",
-               tv_start, i,
-               add_files_state.removed_directories->count);
+                                   tv_start, i,
+                                   add_files_state.removed_directories->count);
        }
     }
 
-    for (f = add_files_state.directory_mtimes->head; f && !interrupted; f = f->next) {
-       notmuch_status_t status;
+    for (f = add_files_state.directory_mtimes->head; f && ! interrupted; f = f->next) {
        notmuch_directory_t *directory;
        status = notmuch_database_get_directory (notmuch, f->filename, &directory);
        if (status == NOTMUCH_STATUS_SUCCESS && directory) {
@@ -995,54 +1301,25 @@ notmuch_new_command (void *ctx, int argc, char *argv[])
     if (timer_is_active)
        stop_progress_printing_timer ();
 
-    gettimeofday (&tv_now, NULL);
-    elapsed = notmuch_time_elapsed (add_files_state.tv_start,
-                                   tv_now);
-
-    if (add_files_state.processed_files) {
-       printf ("Processed %d %s in ", add_files_state.processed_files,
-               add_files_state.processed_files == 1 ?
-               "file" : "total files");
-       notmuch_time_print_formatted_seconds (elapsed);
-       if (elapsed > 1) {
-           printf (" (%d files/sec.).\033[K\n",
-                   (int) (add_files_state.processed_files / elapsed));
-       } else {
-           printf (".\033[K\n");
-       }
-    }
-
-    if (add_files_state.added_messages) {
-       printf ("Added %d new %s to the database.",
-               add_files_state.added_messages,
-               add_files_state.added_messages == 1 ?
-               "message" : "messages");
-    } else {
-       printf ("No new mail.");
-    }
-
-    if (add_files_state.removed_messages) {
-       printf (" Removed %d %s.",
-               add_files_state.removed_messages,
-               add_files_state.removed_messages == 1 ? "message" : "messages");
-    }
-
-    if (add_files_state.renamed_messages) {
-       printf (" Detected %d file %s.",
-               add_files_state.renamed_messages,
-               add_files_state.renamed_messages == 1 ? "rename" : "renames");
-    }
-
-    printf ("\n");
+    if (add_files_state.verbosity >= VERBOSITY_NORMAL)
+       print_results (&add_files_state);
 
     if (ret)
        fprintf (stderr, "Note: A fatal error was encountered: %s\n",
                 notmuch_status_to_string (ret));
 
+    notmuch_database_close (notmuch);
+
+    if (hooks && ! ret && ! interrupted)
+       ret = notmuch_run_hook (notmuch, "post-new");
+
     notmuch_database_destroy (notmuch);
 
-    if (run_hooks && !ret && !interrupted)
-       ret = notmuch_run_hook (db_path, "post-new");
+    if (ret || interrupted)
+       return EXIT_FAILURE;
+
+    if (add_files_state.vanished_files)
+       return NOTMUCH_EXIT_TEMPFAIL;
 
-    return ret || interrupted;
+    return EXIT_SUCCESS;
 }