00001
00002
00003
00004
00005
00006
00007
00008
00009
00010
00011
00012
00013
00014
00015
00016
00017
00018
00019
00020
00021
00022
00023
00024
00025
00026
00027
00028
00029
00030
00031
00032
00033
00034
00035
00036
00037
00038
00039
00040
00041
00042
00043
00044
00045
00046
00047
00048
00049
00050
00051
00052
00053
00054
00055
00056
00057
00058
00059
00060
00061
00062
00063
00064
00065
00066
00067
00068
00069
00070
00071
00072
00073
00074
00075
00076
00077
00078
00079
00080
00081
00082
00083
00084
00085
00086
00087
00088
00089
00090
00091
00092
00093
00094
00095
00096
00097
00098
00099
00100
00101
00102
00103
00104
00105
00106
00107
00108
00109
00110
00111
00112
00113
00114
00115
00116
00117
00118
00119
00120
00121
00122
00123
00124
00125
00126
00127
00128
00129
00130
00131
00132
00133
00134
00135
00136
00137
00138
00139
00140
00141
00142
00143
00144
00145 #ifndef _MBCHAR_H
00146 #define _MBCHAR_H 1
00147
00148 #include <stdbool.h>
00149 #include <string.h>
00150
00151
00152
00153
00154
00155 #include <stdio.h>
00156 #include <time.h>
00157 #include <wchar.h>
00158
00159 #include <wctype.h>
00160
00161 #define MBCHAR_BUF_SIZE 24
00162
00163 struct mbchar
00164 {
00165 const char *ptr;
00166 size_t bytes;
00167 bool wc_valid;
00168 wchar_t wc;
00169 char buf[MBCHAR_BUF_SIZE];
00170 };
00171
00172
00173
00174
00175 typedef struct mbchar mbchar_t;
00176
00177
00178 #define mb_ptr(mbc) ((mbc).ptr)
00179 #define mb_len(mbc) ((mbc).bytes)
00180
00181
00182 #define mb_iseq(mbc, sc) ((mbc).wc_valid && (mbc).wc == (sc))
00183 #define mb_isnul(mbc) ((mbc).wc_valid && (mbc).wc == 0)
00184 #define mb_cmp(mbc1, mbc2) \
00185 ((mbc1).wc_valid \
00186 ? ((mbc2).wc_valid \
00187 ? (int) (mbc1).wc - (int) (mbc2).wc \
00188 : -1) \
00189 : ((mbc2).wc_valid \
00190 ? 1 \
00191 : (mbc1).bytes == (mbc2).bytes \
00192 ? memcmp ((mbc1).ptr, (mbc2).ptr, (mbc1).bytes) \
00193 : (mbc1).bytes < (mbc2).bytes \
00194 ? (memcmp ((mbc1).ptr, (mbc2).ptr, (mbc1).bytes) > 0 ? 1 : -1) \
00195 : (memcmp ((mbc1).ptr, (mbc2).ptr, (mbc2).bytes) >= 0 ? 1 : -1)))
00196 #define mb_casecmp(mbc1, mbc2) \
00197 ((mbc1).wc_valid \
00198 ? ((mbc2).wc_valid \
00199 ? (int) towlower ((mbc1).wc) - (int) towlower ((mbc2).wc) \
00200 : -1) \
00201 : ((mbc2).wc_valid \
00202 ? 1 \
00203 : (mbc1).bytes == (mbc2).bytes \
00204 ? memcmp ((mbc1).ptr, (mbc2).ptr, (mbc1).bytes) \
00205 : (mbc1).bytes < (mbc2).bytes \
00206 ? (memcmp ((mbc1).ptr, (mbc2).ptr, (mbc1).bytes) > 0 ? 1 : -1) \
00207 : (memcmp ((mbc1).ptr, (mbc2).ptr, (mbc2).bytes) >= 0 ? 1 : -1)))
00208 #define mb_equal(mbc1, mbc2) \
00209 ((mbc1).wc_valid && (mbc2).wc_valid \
00210 ? (mbc1).wc == (mbc2).wc \
00211 : (mbc1).bytes == (mbc2).bytes \
00212 && memcmp ((mbc1).ptr, (mbc2).ptr, (mbc1).bytes) == 0)
00213 #define mb_caseequal(mbc1, mbc2) \
00214 ((mbc1).wc_valid && (mbc2).wc_valid \
00215 ? towlower ((mbc1).wc) == towlower ((mbc2).wc) \
00216 : (mbc1).bytes == (mbc2).bytes \
00217 && memcmp ((mbc1).ptr, (mbc2).ptr, (mbc1).bytes) == 0)
00218
00219
00220 #define mb_isascii(mbc) \
00221 ((mbc).wc_valid && (mbc).wc >= 0 && (mbc).wc <= 127)
00222 #define mb_isalnum(mbc) ((mbc).wc_valid && iswalnum ((mbc).wc))
00223 #define mb_isalpha(mbc) ((mbc).wc_valid && iswalpha ((mbc).wc))
00224 #define mb_isblank(mbc) ((mbc).wc_valid && iswblank ((mbc).wc))
00225 #define mb_iscntrl(mbc) ((mbc).wc_valid && iswcntrl ((mbc).wc))
00226 #define mb_isdigit(mbc) ((mbc).wc_valid && iswdigit ((mbc).wc))
00227 #define mb_isgraph(mbc) ((mbc).wc_valid && iswgraph ((mbc).wc))
00228 #define mb_islower(mbc) ((mbc).wc_valid && iswlower ((mbc).wc))
00229 #define mb_isprint(mbc) ((mbc).wc_valid && iswprint ((mbc).wc))
00230 #define mb_ispunct(mbc) ((mbc).wc_valid && iswpunct ((mbc).wc))
00231 #define mb_isspace(mbc) ((mbc).wc_valid && iswspace ((mbc).wc))
00232 #define mb_isupper(mbc) ((mbc).wc_valid && iswupper ((mbc).wc))
00233 #define mb_isxdigit(mbc) ((mbc).wc_valid && iswxdigit ((mbc).wc))
00234
00235
00236
00237
00238 #define MB_UNPRINTABLE_WIDTH 1
00239
00240 static inline int
00241 mb_width_aux (wint_t wc)
00242 {
00243 int w = wcwidth (wc);
00244
00245
00246 return (w >= 0 ? w : iswcntrl (wc) ? 0 : MB_UNPRINTABLE_WIDTH);
00247 }
00248
00249 #define mb_width(mbc) \
00250 ((mbc).wc_valid ? mb_width_aux ((mbc).wc) : MB_UNPRINTABLE_WIDTH)
00251
00252
00253 #define mb_putc(mbc, stream) fwrite ((mbc).ptr, 1, (mbc).bytes, (stream))
00254
00255
00256 #define mb_setascii(mbc, sc) \
00257 ((mbc)->ptr = (mbc)->buf, (mbc)->bytes = 1, (mbc)->wc_valid = 1, \
00258 (mbc)->wc = (mbc)->buf[0] = (sc))
00259
00260
00261 static inline void
00262 mb_copy (mbchar_t *new, const mbchar_t *old)
00263 {
00264 if (old->ptr == &old->buf[0])
00265 {
00266 memcpy (&new->buf[0], &old->buf[0], old->bytes);
00267 new->ptr = &new->buf[0];
00268 }
00269 else
00270 new->ptr = old->ptr;
00271 new->bytes = old->bytes;
00272 if ((new->wc_valid = old->wc_valid))
00273 new->wc = old->wc;
00274 }
00275
00276
00277
00278
00279
00280
00281 #if (' ' == 32) && ('!' == 33) && ('"' == 34) && ('#' == 35) \
00282 && ('%' == 37) && ('&' == 38) && ('\'' == 39) && ('(' == 40) \
00283 && (')' == 41) && ('*' == 42) && ('+' == 43) && (',' == 44) \
00284 && ('-' == 45) && ('.' == 46) && ('/' == 47) && ('0' == 48) \
00285 && ('1' == 49) && ('2' == 50) && ('3' == 51) && ('4' == 52) \
00286 && ('5' == 53) && ('6' == 54) && ('7' == 55) && ('8' == 56) \
00287 && ('9' == 57) && (':' == 58) && (';' == 59) && ('<' == 60) \
00288 && ('=' == 61) && ('>' == 62) && ('?' == 63) && ('A' == 65) \
00289 && ('B' == 66) && ('C' == 67) && ('D' == 68) && ('E' == 69) \
00290 && ('F' == 70) && ('G' == 71) && ('H' == 72) && ('I' == 73) \
00291 && ('J' == 74) && ('K' == 75) && ('L' == 76) && ('M' == 77) \
00292 && ('N' == 78) && ('O' == 79) && ('P' == 80) && ('Q' == 81) \
00293 && ('R' == 82) && ('S' == 83) && ('T' == 84) && ('U' == 85) \
00294 && ('V' == 86) && ('W' == 87) && ('X' == 88) && ('Y' == 89) \
00295 && ('Z' == 90) && ('[' == 91) && ('\\' == 92) && (']' == 93) \
00296 && ('^' == 94) && ('_' == 95) && ('a' == 97) && ('b' == 98) \
00297 && ('c' == 99) && ('d' == 100) && ('e' == 101) && ('f' == 102) \
00298 && ('g' == 103) && ('h' == 104) && ('i' == 105) && ('j' == 106) \
00299 && ('k' == 107) && ('l' == 108) && ('m' == 109) && ('n' == 110) \
00300 && ('o' == 111) && ('p' == 112) && ('q' == 113) && ('r' == 114) \
00301 && ('s' == 115) && ('t' == 116) && ('u' == 117) && ('v' == 118) \
00302 && ('w' == 119) && ('x' == 120) && ('y' == 121) && ('z' == 122) \
00303 && ('{' == 123) && ('|' == 124) && ('}' == 125) && ('~' == 126)
00304
00305 # define IS_BASIC_ASCII 1
00306
00307 extern unsigned int is_basic_table[];
00308
00309 static inline bool
00310 is_basic (char c)
00311 {
00312 return (is_basic_table [(unsigned char) c >> 5] >> ((unsigned char) c & 31))
00313 & 1;
00314 }
00315
00316 #else
00317
00318 static inline bool
00319 is_basic (char c)
00320 {
00321 switch (c)
00322 {
00323 case '\t': case '\v': case '\f':
00324 case ' ': case '!': case '"': case '#': case '%':
00325 case '&': case '\'': case '(': case ')': case '*':
00326 case '+': case ',': case '-': case '.': case '/':
00327 case '0': case '1': case '2': case '3': case '4':
00328 case '5': case '6': case '7': case '8': case '9':
00329 case ':': case ';': case '<': case '=': case '>':
00330 case '?':
00331 case 'A': case 'B': case 'C': case 'D': case 'E':
00332 case 'F': case 'G': case 'H': case 'I': case 'J':
00333 case 'K': case 'L': case 'M': case 'N': case 'O':
00334 case 'P': case 'Q': case 'R': case 'S': case 'T':
00335 case 'U': case 'V': case 'W': case 'X': case 'Y':
00336 case 'Z':
00337 case '[': case '\\': case ']': case '^': case '_':
00338 case 'a': case 'b': case 'c': case 'd': case 'e':
00339 case 'f': case 'g': case 'h': case 'i': case 'j':
00340 case 'k': case 'l': case 'm': case 'n': case 'o':
00341 case 'p': case 'q': case 'r': case 's': case 't':
00342 case 'u': case 'v': case 'w': case 'x': case 'y':
00343 case 'z': case '{': case '|': case '}': case '~':
00344 return 1;
00345 default:
00346 return 0;
00347 }
00348 }
00349
00350 #endif
00351
00352 #endif