]> git.notmuchmail.org Git - notmuch/blob - notmuch-new.c
1616ee96aef197c03c07e92bf1b1b090f4af6361
[notmuch] / notmuch-new.c
1 /* notmuch - Not much of an email program, (just index and search)
2  *
3  * Copyright © 2009 Carl Worth
4  *
5  * This program is free software: you can redistribute it and/or modify
6  * it under the terms of the GNU General Public License as published by
7  * the Free Software Foundation, either version 3 of the License, or
8  * (at your option) any later version.
9  *
10  * This program is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13  * GNU General Public License for more details.
14  *
15  * You should have received a copy of the GNU General Public License
16  * along with this program.  If not, see http://www.gnu.org/licenses/ .
17  *
18  * Author: Carl Worth <cworth@cworth.org>
19  */
20
21 #include "notmuch-client.h"
22
23 static volatile sig_atomic_t do_add_files_print_progress = 0;
24
25 static void
26 handle_sigalrm (unused (int signal))
27 {
28     do_add_files_print_progress = 1;
29 }
30
31 static volatile sig_atomic_t interrupted;
32
33 static void
34 handle_sigint (unused (int sig))
35 {
36     static char msg[] = "Stopping...         \n";
37     write(2, msg, sizeof(msg)-1);
38     interrupted = 1;
39 }
40
41 static void
42 tag_inbox_and_unread (notmuch_message_t *message)
43 {
44     notmuch_message_add_tag (message, "inbox");
45     notmuch_message_add_tag (message, "unread");
46 }
47
48 static void
49 add_files_print_progress (add_files_state_t *state)
50 {
51     struct timeval tv_now;
52     double elapsed_overall, rate_overall;
53
54     gettimeofday (&tv_now, NULL);
55
56     elapsed_overall = notmuch_time_elapsed (state->tv_start, tv_now);
57     rate_overall = (state->processed_files) / elapsed_overall;
58
59     printf ("Processed %d", state->processed_files);
60
61     if (state->total_files) {
62         double time_remaining;
63
64         time_remaining = ((state->total_files - state->processed_files) /
65                           rate_overall);
66         printf (" of %d files (", state->total_files);
67         notmuch_time_print_formatted_seconds (time_remaining);
68         printf (" remaining).      \r");
69     } else {
70         printf (" files (%d files/sec.)    \r", (int) rate_overall);
71     }
72
73     fflush (stdout);
74 }
75
76 static int ino_cmp(const struct dirent **a, const struct dirent **b)
77 {
78     return ((*a)->d_ino < (*b)->d_ino) ? -1 : 1;
79 }
80
81 /* Examine 'path' recursively as follows:
82  *
83  *   o Ask the filesystem for the mtime of 'path' (path_mtime)
84  *
85  *   o Ask the database for its timestamp of 'path' (path_dbtime)
86  *
87  *   o If 'path_mtime' > 'path_dbtime'
88  *
89  *       o For each regular file in 'path' with mtime newer than the
90  *         'path_dbtime' call add_message to add the file to the
91  *         database.
92  *
93  *       o For each sub-directory of path, recursively call into this
94  *         same function.
95  *
96  *   o Tell the database to update its time of 'path' to 'path_mtime'
97  *
98  * The 'struct stat *st' must point to a structure that has already
99  * been initialized for 'path' by calling stat().
100  */
101 static notmuch_status_t
102 add_files_recursive (notmuch_database_t *notmuch,
103                      const char *path,
104                      struct stat *st,
105                      add_files_state_t *state)
106 {
107     DIR *dir = NULL;
108     struct dirent *entry = NULL;
109     char *next = NULL;
110     time_t path_mtime, path_dbtime;
111     notmuch_status_t status, ret = NOTMUCH_STATUS_SUCCESS;
112     notmuch_message_t *message = NULL;
113     struct dirent **namelist = NULL;
114     int num_entries;
115
116     /* If we're told to, we bail out on encountering a read-only
117      * directory, (with this being a clear clue from the user to
118      * Notmuch that new mail won't be arriving there and we need not
119      * look. */
120     if (state->ignore_read_only_directories &&
121         (st->st_mode & S_IWUSR) == 0)
122     {
123         state->saw_read_only_directory = TRUE;
124         goto DONE;
125     }
126
127     path_mtime = st->st_mtime;
128
129     path_dbtime = notmuch_database_get_timestamp (notmuch, path);
130     num_entries = scandir (path, &namelist, 0, ino_cmp);
131
132     if (num_entries == -1) {
133         fprintf (stderr, "Error opening directory %s: %s\n",
134                  path, strerror (errno));
135         ret = NOTMUCH_STATUS_FILE_ERROR;
136         goto DONE;
137     }
138
139     int i=0;
140
141     while (!interrupted) {
142         if (i == num_entries)
143             break;
144
145         entry= namelist[i++];
146
147         /* If this directory hasn't been modified since the last
148          * add_files, then we only need to look further for
149          * sub-directories. */
150         if (path_mtime <= path_dbtime && entry->d_type != DT_DIR)
151             continue;
152
153         /* Ignore special directories to avoid infinite recursion.
154          * Also ignore the .notmuch directory.
155          */
156         /* XXX: Eventually we'll want more sophistication to let the
157          * user specify files to be ignored. */
158         if (strcmp (entry->d_name, ".") == 0 ||
159             strcmp (entry->d_name, "..") == 0 ||
160             strcmp (entry->d_name, ".notmuch") ==0)
161         {
162             continue;
163         }
164
165         next = talloc_asprintf (notmuch, "%s/%s", path, entry->d_name);
166
167         if (stat (next, st)) {
168             fprintf (stderr, "Error reading %s: %s\n",
169                      next, strerror (errno));
170             ret = NOTMUCH_STATUS_FILE_ERROR;
171             continue;
172         }
173
174         if (S_ISREG (st->st_mode)) {
175             /* If the file hasn't been modified since the last
176              * add_files, then we need not look at it. */
177             if (path_dbtime == 0 || st->st_mtime > path_dbtime) {
178                 state->processed_files++;
179
180                 status = notmuch_database_add_message (notmuch, next, &message);
181                 switch (status) {
182                     /* success */
183                     case NOTMUCH_STATUS_SUCCESS:
184                         state->added_messages++;
185                         tag_inbox_and_unread (message);
186                         break;
187                     /* Non-fatal issues (go on to next file) */
188                     case NOTMUCH_STATUS_DUPLICATE_MESSAGE_ID:
189                         /* Stay silent on this one. */
190                         break;
191                     case NOTMUCH_STATUS_FILE_NOT_EMAIL:
192                         fprintf (stderr, "Note: Ignoring non-mail file: %s\n",
193                                  next);
194                         break;
195                     /* Fatal issues. Don't process anymore. */
196                     case NOTMUCH_STATUS_READONLY_DATABASE:
197                     case NOTMUCH_STATUS_XAPIAN_EXCEPTION:
198                     case NOTMUCH_STATUS_OUT_OF_MEMORY:
199                         fprintf (stderr, "Error: %s. Halting processing.\n",
200                                  notmuch_status_to_string (status));
201                         ret = status;
202                         goto DONE;
203                     default:
204                     case NOTMUCH_STATUS_FILE_ERROR:
205                     case NOTMUCH_STATUS_NULL_POINTER:
206                     case NOTMUCH_STATUS_TAG_TOO_LONG:
207                     case NOTMUCH_STATUS_UNBALANCED_FREEZE_THAW:
208                     case NOTMUCH_STATUS_LAST_STATUS:
209                         INTERNAL_ERROR ("add_message returned unexpected value: %d",  status);
210                         goto DONE;
211                 }
212
213                 if (message) {
214                     notmuch_message_destroy (message);
215                     message = NULL;
216                 }
217
218                 if (do_add_files_print_progress) {
219                     do_add_files_print_progress = 0;
220                     add_files_print_progress (state);
221                 }
222             }
223         } else if (S_ISDIR (st->st_mode)) {
224             status = add_files_recursive (notmuch, next, st, state);
225             if (status && ret == NOTMUCH_STATUS_SUCCESS)
226                 ret = status;
227         }
228
229         talloc_free (next);
230         next = NULL;
231     }
232
233     status = notmuch_database_set_timestamp (notmuch, path, path_mtime);
234     if (status && ret == NOTMUCH_STATUS_SUCCESS)
235         ret = status;
236
237   DONE:
238     if (next)
239         talloc_free (next);
240     if (entry)
241         free (entry);
242     if (dir)
243         closedir (dir);
244     if (namelist)
245         free (namelist);
246
247     return ret;
248 }
249
250 /* This is the top-level entry point for add_files. It does a couple
251  * of error checks, sets up the progress-printing timer and then calls
252  * into the recursive function. */
253 notmuch_status_t
254 add_files (notmuch_database_t *notmuch,
255            const char *path,
256            add_files_state_t *state)
257 {
258     struct stat st;
259     notmuch_status_t status;
260     struct sigaction action;
261     struct itimerval timerval;
262     notmuch_bool_t timer_is_active = FALSE;
263
264     if (stat (path, &st)) {
265         fprintf (stderr, "Error reading directory %s: %s\n",
266                  path, strerror (errno));
267         return NOTMUCH_STATUS_FILE_ERROR;
268     }
269
270     if (! S_ISDIR (st.st_mode)) {
271         fprintf (stderr, "Error: %s is not a directory.\n", path);
272         return NOTMUCH_STATUS_FILE_ERROR;
273     }
274
275     /* Setup our handler for SIGALRM */
276     if (! debugger_is_active ()) {
277         memset (&action, 0, sizeof (struct sigaction));
278         action.sa_handler = handle_sigalrm;
279         sigemptyset (&action.sa_mask);
280         action.sa_flags = SA_RESTART;
281         sigaction (SIGALRM, &action, NULL);
282
283         /* Then start a timer to send SIGALRM once per second. */
284         timerval.it_interval.tv_sec = 1;
285         timerval.it_interval.tv_usec = 0;
286         timerval.it_value.tv_sec = 1;
287         timerval.it_value.tv_usec = 0;
288         setitimer (ITIMER_REAL, &timerval, NULL);
289
290         timer_is_active = TRUE;
291     }
292
293     status = add_files_recursive (notmuch, path, &st, state);
294
295     /* Now stop the timer. */
296     if (timer_is_active) {
297         timerval.it_interval.tv_sec = 0;
298         timerval.it_interval.tv_usec = 0;
299         timerval.it_value.tv_sec = 0;
300         timerval.it_value.tv_usec = 0;
301         setitimer (ITIMER_REAL, &timerval, NULL);
302
303         /* And disable the signal handler. */
304         action.sa_handler = SIG_IGN;
305         sigaction (SIGALRM, &action, NULL);
306     }
307
308     return status;
309 }
310
311 /* XXX: This should be merged with the add_files function since it
312  * shares a lot of logic with it. */
313 /* Recursively count all regular files in path and all sub-directories
314  * of path.  The result is added to *count (which should be
315  * initialized to zero by the top-level caller before calling
316  * count_files). */
317 static void
318 count_files (const char *path, int *count)
319 {
320     struct dirent *entry = NULL;
321     char *next;
322     struct stat st;
323     struct dirent **namelist = NULL;
324     int n_entries = scandir (path, &namelist, 0, ino_cmp);
325     int i = 0;
326
327     if (n_entries == -1) {
328         fprintf (stderr, "Warning: failed to open directory %s: %s\n",
329                  path, strerror (errno));
330         goto DONE;
331     }
332
333     while (!interrupted) {
334         if (i == n_entries)
335             break;
336
337         entry= namelist[i++];
338
339         /* Ignore special directories to avoid infinite recursion.
340          * Also ignore the .notmuch directory.
341          */
342         /* XXX: Eventually we'll want more sophistication to let the
343          * user specify files to be ignored. */
344         if (strcmp (entry->d_name, ".") == 0 ||
345             strcmp (entry->d_name, "..") == 0 ||
346             strcmp (entry->d_name, ".notmuch") == 0)
347         {
348             continue;
349         }
350
351         if (asprintf (&next, "%s/%s", path, entry->d_name) == -1) {
352             next = NULL;
353             fprintf (stderr, "Error descending from %s to %s: Out of memory\n",
354                      path, entry->d_name);
355             continue;
356         }
357
358         stat (next, &st);
359
360         if (S_ISREG (st.st_mode)) {
361             *count = *count + 1;
362             if (*count % 1000 == 0) {
363                 printf ("Found %d files so far.\r", *count);
364                 fflush (stdout);
365             }
366         } else if (S_ISDIR (st.st_mode)) {
367             count_files (next, count);
368         }
369
370         free (next);
371     }
372
373   DONE:
374     if (entry)
375         free (entry);
376     if (namelist)
377         free (namelist);
378 }
379
380 int
381 notmuch_new_command (void *ctx,
382                      unused (int argc), unused (char *argv[]))
383 {
384     notmuch_config_t *config;
385     notmuch_database_t *notmuch;
386     add_files_state_t add_files_state;
387     double elapsed;
388     struct timeval tv_now;
389     int ret = 0;
390     struct stat st;
391     const char *db_path;
392     char *dot_notmuch_path;
393     struct sigaction action;
394
395     /* Setup our handler for SIGINT */
396     memset (&action, 0, sizeof (struct sigaction));
397     action.sa_handler = handle_sigint;
398     sigemptyset (&action.sa_mask);
399     action.sa_flags = SA_RESTART;
400     sigaction (SIGINT, &action, NULL);
401
402     config = notmuch_config_open (ctx, NULL, NULL);
403     if (config == NULL)
404         return 1;
405
406     db_path = notmuch_config_get_database_path (config);
407
408     dot_notmuch_path = talloc_asprintf (ctx, "%s/%s", db_path, ".notmuch");
409
410     if (stat (dot_notmuch_path, &st)) {
411         int count;
412
413         count = 0;
414         count_files (db_path, &count);
415         if (interrupted)
416             return 1;
417
418         printf ("Found %d total files.     \n", count);
419         notmuch = notmuch_database_create (db_path);
420         add_files_state.ignore_read_only_directories = FALSE;
421         add_files_state.total_files = count;
422     } else {
423         notmuch = notmuch_database_open (db_path,
424                                          NOTMUCH_DATABASE_MODE_READ_WRITE);
425         add_files_state.ignore_read_only_directories = TRUE;
426         add_files_state.total_files = 0;
427     }
428
429     if (notmuch == NULL)
430         return 1;
431
432     talloc_free (dot_notmuch_path);
433     dot_notmuch_path = NULL;
434
435     add_files_state.saw_read_only_directory = FALSE;
436     add_files_state.processed_files = 0;
437     add_files_state.added_messages = 0;
438     gettimeofday (&add_files_state.tv_start, NULL);
439
440     ret = add_files (notmuch, db_path, &add_files_state);
441
442     gettimeofday (&tv_now, NULL);
443     elapsed = notmuch_time_elapsed (add_files_state.tv_start,
444                                     tv_now);
445     if (add_files_state.processed_files) {
446         printf ("Processed %d %s in ", add_files_state.processed_files,
447                 add_files_state.processed_files == 1 ?
448                 "file" : "total files");
449         notmuch_time_print_formatted_seconds (elapsed);
450         if (elapsed > 1) {
451             printf (" (%d files/sec.).                 \n",
452                     (int) (add_files_state.processed_files / elapsed));
453         } else {
454             printf (".                    \n");
455         }
456     }
457     if (add_files_state.added_messages) {
458         printf ("Added %d new %s to the database (not much, really).\n",
459                 add_files_state.added_messages,
460                 add_files_state.added_messages == 1 ?
461                 "message" : "messages");
462     } else {
463         printf ("No new mail---and that's not much.\n");
464     }
465
466     if (elapsed > 1 && ! add_files_state.saw_read_only_directory) {
467         printf ("\nTip: If you have any sub-directories that are archives (that is,\n"
468                 "they will never receive new mail), marking these directories as\n"
469                 "read-only (chmod u-w /path/to/dir) will make \"notmuch new\"\n"
470                 "much more efficient (it won't even look in those directories).\n");
471     }
472
473     if (ret) {
474         printf ("\nNote: At least one error was encountered: %s\n",
475                 notmuch_status_to_string (ret));
476     }
477
478     notmuch_database_close (notmuch);
479
480     return ret || interrupted;
481 }