]> git.notmuchmail.org Git - notmuch/commitdiff
util: add strsplit_len: simplified strtok with delimiter escaping
authorDavid Bremner <david@tethera.net>
Sat, 8 Aug 2020 14:16:48 +0000 (11:16 -0300)
committerDavid Bremner <david@tethera.net>
Sat, 6 Feb 2021 23:06:49 +0000 (19:06 -0400)
This will be used to make iterators for configuration values.

util/string-util.c
util/string-util.h

index de8430b2add34dea3fdf52507cf442c420cd170f..27f8a26b4938c4c770486e504b62f168db64f582 100644 (file)
@@ -24,6 +24,7 @@
 
 #include <ctype.h>
 #include <errno.h>
+#include <stdbool.h>
 
 char *
 strtok_len (char *s, const char *delim, size_t *len)
@@ -37,6 +38,28 @@ strtok_len (char *s, const char *delim, size_t *len)
     return *len ? s : NULL;
 }
 
+const char *
+strsplit_len (const char *s, char delim, size_t *len)
+{
+    bool escaping = false;
+    size_t count = 0;
+
+    /* Skip initial unescaped delimiters */
+    while (*s && *s == delim)
+       s++;
+
+    while (s[count] && (escaping || s[count] != delim)) {
+       escaping = (s[count] == '\\');
+       count++;
+    }
+
+    if (count==0)
+       return NULL;
+
+    *len = count;
+    return s;
+}
+
 const char *
 strtok_len_c (const char *s, const char *delim, size_t *len)
 {
index fb95a7402c892ebd95374148073796701ecc3a7c..80647c5febd692ac0d33b3cac5d46da85fdfd67a 100644 (file)
@@ -26,6 +26,20 @@ char *strtok_len (char *s, const char *delim, size_t *len);
 /* Const version of strtok_len. */
 const char *strtok_len_c (const char *s, const char *delim, size_t *len);
 
+/* Simplified version of strtok_len, with a single delimiter.
+ * Handles escaping delimiters with \
+ * Usage pattern:
+ *
+ * const char *tok = input;
+ * const char *delim = ';';
+ * size_t tok_len = 0;
+ *
+ * while ((tok = strsplit_len (tok + tok_len, delim, &tok_len)) != NULL) {
+ *     // do stuff with string tok of length tok_len
+ * }
+ */
+const char *strsplit_len (const char *s, char delim, size_t *len);
+
 /* Return a talloced string with str sanitized.
  *
  * Whitespace characters (tabs and newlines) are replaced with spaces,