Line data Source code
1 : /*-------------------------------------------------------------------------
2 : *
3 : * isn.c
4 : * PostgreSQL type definitions for ISNs (ISBN, ISMN, ISSN, EAN13, UPC)
5 : *
6 : * Author: German Mendez Bravo (Kronuz)
7 : * Portions Copyright (c) 1996-2025, PostgreSQL Global Development Group
8 : *
9 : * IDENTIFICATION
10 : * contrib/isn/isn.c
11 : *
12 : *-------------------------------------------------------------------------
13 : */
14 :
15 : #include "postgres.h"
16 :
17 : #include "EAN13.h"
18 : #include "ISBN.h"
19 : #include "ISMN.h"
20 : #include "ISSN.h"
21 : #include "UPC.h"
22 : #include "fmgr.h"
23 : #include "isn.h"
24 : #include "utils/guc.h"
25 :
26 2 : PG_MODULE_MAGIC_EXT(
27 : .name = "isn",
28 : .version = PG_VERSION
29 : );
30 :
31 : #ifdef USE_ASSERT_CHECKING
32 : #define ISN_DEBUG 1
33 : #else
34 : #define ISN_DEBUG 0
35 : #endif
36 :
37 : #define MAXEAN13LEN 18
38 :
39 : enum isn_type
40 : {
41 : INVALID, ANY, EAN13, ISBN, ISMN, ISSN, UPC
42 : };
43 :
44 : static const char *const isn_names[] = {"EAN13/UPC/ISxN", "EAN13/UPC/ISxN", "EAN13", "ISBN", "ISMN", "ISSN", "UPC"};
45 :
46 : /* GUC value */
47 : static bool g_weak = false;
48 :
49 :
50 : /***********************************************************************
51 : **
52 : ** Routines for EAN13/UPC/ISxNs.
53 : **
54 : ** Note:
55 : ** In this code, a normalized string is one that is known to be a valid
56 : ** ISxN number containing only digits and hyphens and with enough space
57 : ** to hold the full 13 digits plus the maximum of four hyphens.
58 : ***********************************************************************/
59 :
60 : /*----------------------------------------------------------
61 : * Debugging routines.
62 : *---------------------------------------------------------*/
63 :
64 : /*
65 : * Check if the table and its index is correct (just for debugging)
66 : */
67 : pg_attribute_unused()
68 : static bool
69 0 : check_table(const char *(*TABLE)[2], const unsigned TABLE_index[10][2])
70 : {
71 : const char *aux1,
72 : *aux2;
73 : int a,
74 : b,
75 0 : x = 0,
76 0 : y = -1,
77 0 : i = 0,
78 : j,
79 0 : init = 0;
80 :
81 0 : if (TABLE == NULL || TABLE_index == NULL)
82 0 : return true;
83 :
84 0 : while (TABLE[i][0] && TABLE[i][1])
85 : {
86 0 : aux1 = TABLE[i][0];
87 0 : aux2 = TABLE[i][1];
88 :
89 : /* must always start with a digit: */
90 0 : if (!isdigit((unsigned char) *aux1) || !isdigit((unsigned char) *aux2))
91 0 : goto invalidtable;
92 0 : a = *aux1 - '0';
93 0 : b = *aux2 - '0';
94 :
95 : /* must always have the same format and length: */
96 0 : while (*aux1 && *aux2)
97 : {
98 0 : if (!(isdigit((unsigned char) *aux1) &&
99 0 : isdigit((unsigned char) *aux2)) &&
100 0 : (*aux1 != *aux2 || *aux1 != '-'))
101 0 : goto invalidtable;
102 0 : aux1++;
103 0 : aux2++;
104 : }
105 0 : if (*aux1 != *aux2)
106 0 : goto invalidtable;
107 :
108 : /* found a new range */
109 0 : if (a > y)
110 : {
111 : /* check current range in the index: */
112 0 : for (j = x; j <= y; j++)
113 : {
114 0 : if (TABLE_index[j][0] != init)
115 0 : goto invalidindex;
116 0 : if (TABLE_index[j][1] != i - init)
117 0 : goto invalidindex;
118 : }
119 0 : init = i;
120 0 : x = a;
121 : }
122 :
123 : /* Always get the new limit */
124 0 : y = b;
125 0 : if (y < x)
126 0 : goto invalidtable;
127 0 : i++;
128 : }
129 :
130 0 : return true;
131 :
132 0 : invalidtable:
133 0 : elog(DEBUG1, "invalid table near {\"%s\", \"%s\"} (pos: %d)",
134 : TABLE[i][0], TABLE[i][1], i);
135 0 : return false;
136 :
137 0 : invalidindex:
138 0 : elog(DEBUG1, "index %d is invalid", j);
139 0 : return false;
140 : }
141 :
142 : /*----------------------------------------------------------
143 : * Formatting and conversion routines.
144 : *---------------------------------------------------------*/
145 :
146 : static unsigned
147 4 : dehyphenate(char *bufO, char *bufI)
148 : {
149 4 : unsigned ret = 0;
150 :
151 60 : while (*bufI)
152 : {
153 56 : if (isdigit((unsigned char) *bufI))
154 : {
155 48 : *bufO++ = *bufI;
156 48 : ret++;
157 : }
158 56 : bufI++;
159 : }
160 4 : *bufO = '\0';
161 4 : return ret;
162 : }
163 :
164 : /*
165 : * hyphenate --- Try to hyphenate, in-place, the string starting at bufI
166 : * into bufO using the given hyphenation range TABLE.
167 : * Assumes the input string to be used is of only digits.
168 : *
169 : * Returns the number of characters actually hyphenated.
170 : */
171 : static unsigned
172 174 : hyphenate(char *bufO, char *bufI, const char *(*TABLE)[2], const unsigned TABLE_index[10][2])
173 : {
174 174 : unsigned ret = 0;
175 : const char *ean_aux1,
176 : *ean_aux2,
177 : *ean_p;
178 : char *firstdig,
179 : *aux1,
180 : *aux2;
181 : unsigned search,
182 : upper,
183 : lower,
184 : step;
185 : bool ean_in1,
186 : ean_in2;
187 :
188 : /* just compress the string if no further hyphenation is required */
189 174 : if (TABLE == NULL || TABLE_index == NULL)
190 : {
191 570 : while (*bufI)
192 : {
193 526 : *bufO++ = *bufI++;
194 526 : ret++;
195 : }
196 44 : *bufO = '\0';
197 44 : return (ret + 1);
198 : }
199 :
200 : /* add remaining hyphenations */
201 :
202 130 : search = *bufI - '0';
203 130 : upper = lower = TABLE_index[search][0];
204 130 : upper += TABLE_index[search][1];
205 130 : lower--;
206 :
207 130 : step = (upper - lower) / 2;
208 130 : if (step == 0)
209 6 : return 0;
210 124 : search = lower + step;
211 :
212 124 : firstdig = bufI;
213 124 : ean_in1 = ean_in2 = false;
214 124 : ean_aux1 = TABLE[search][0];
215 124 : ean_aux2 = TABLE[search][1];
216 : do
217 : {
218 720 : if ((ean_in1 || *firstdig >= *ean_aux1) && (ean_in2 || *firstdig <= *ean_aux2))
219 : {
220 530 : if (*firstdig > *ean_aux1)
221 72 : ean_in1 = true;
222 530 : if (*firstdig < *ean_aux2)
223 72 : ean_in2 = true;
224 530 : if (ean_in1 && ean_in2)
225 56 : break;
226 :
227 474 : firstdig++, ean_aux1++, ean_aux2++;
228 474 : if (!(*ean_aux1 && *ean_aux2 && *firstdig))
229 : break;
230 418 : if (!isdigit((unsigned char) *ean_aux1))
231 80 : ean_aux1++, ean_aux2++;
232 : }
233 : else
234 : {
235 : /*
236 : * check in what direction we should go and move the pointer
237 : * accordingly
238 : */
239 190 : if (*firstdig < *ean_aux1 && !ean_in1)
240 64 : upper = search;
241 : else
242 126 : lower = search;
243 :
244 190 : step = (upper - lower) / 2;
245 190 : search = lower + step;
246 :
247 : /* Initialize stuff again: */
248 190 : firstdig = bufI;
249 190 : ean_in1 = ean_in2 = false;
250 190 : ean_aux1 = TABLE[search][0];
251 190 : ean_aux2 = TABLE[search][1];
252 : }
253 608 : } while (step);
254 :
255 124 : if (step)
256 : {
257 112 : aux1 = bufO;
258 112 : aux2 = bufI;
259 112 : ean_p = TABLE[search][0];
260 584 : while (*ean_p && *aux2)
261 : {
262 472 : if (*ean_p++ != '-')
263 428 : *aux1++ = *aux2++;
264 : else
265 44 : *aux1++ = '-';
266 472 : ret++;
267 : }
268 112 : *aux1++ = '-';
269 112 : *aux1 = *aux2; /* add a lookahead char */
270 112 : return (ret + 1);
271 : }
272 12 : return ret;
273 : }
274 :
275 : /*
276 : * weight_checkdig -- Receives a buffer with a normalized ISxN string number,
277 : * and the length to weight.
278 : *
279 : * Returns the weight of the number (the check digit value, 0-10)
280 : */
281 : static unsigned
282 28 : weight_checkdig(char *isn, unsigned size)
283 : {
284 28 : unsigned weight = 0;
285 :
286 276 : while (*isn && size > 1)
287 : {
288 248 : if (isdigit((unsigned char) *isn))
289 : {
290 228 : weight += size-- * (*isn - '0');
291 : }
292 248 : isn++;
293 : }
294 28 : weight = weight % 11;
295 28 : if (weight != 0)
296 28 : weight = 11 - weight;
297 28 : return weight;
298 : }
299 :
300 :
301 : /*
302 : * checkdig --- Receives a buffer with a normalized ISxN string number,
303 : * and the length to check.
304 : *
305 : * Returns the check digit value (0-9)
306 : */
307 : static unsigned
308 228 : checkdig(char *num, unsigned size)
309 : {
310 228 : unsigned check = 0,
311 228 : check3 = 0;
312 228 : unsigned pos = 0;
313 :
314 228 : if (*num == 'M')
315 : { /* ISMN start with 'M' */
316 0 : check3 = 3;
317 0 : pos = 1;
318 : }
319 2964 : while (*num && size > 1)
320 : {
321 2736 : if (isdigit((unsigned char) *num))
322 : {
323 2736 : if (pos++ % 2)
324 1368 : check3 += *num - '0';
325 : else
326 1368 : check += *num - '0';
327 2736 : size--;
328 : }
329 2736 : num++;
330 : }
331 228 : check = (check + 3 * check3) % 10;
332 228 : if (check != 0)
333 228 : check = 10 - check;
334 228 : return check;
335 : }
336 :
337 : /*
338 : * ean2isn --- Try to convert an ean13 number to a UPC/ISxN number.
339 : * This doesn't verify for a valid check digit.
340 : *
341 : * If errorOK is false, ereport a useful error message if the ean13 is bad.
342 : * If errorOK is true, just return "false" for bad input.
343 : */
344 : static bool
345 12 : ean2isn(ean13 ean, bool errorOK, ean13 *result, enum isn_type accept)
346 : {
347 12 : enum isn_type type = INVALID;
348 :
349 : char buf[MAXEAN13LEN + 1];
350 : char *aux;
351 : unsigned digval;
352 : unsigned search;
353 12 : ean13 ret = ean;
354 :
355 12 : ean >>= 1;
356 : /* verify it's in the EAN13 range */
357 12 : if (ean > UINT64CONST(9999999999999))
358 0 : goto eantoobig;
359 :
360 : /* convert the number */
361 12 : search = 0;
362 12 : aux = buf + 13;
363 12 : *aux = '\0'; /* terminate string; aux points to last digit */
364 : do
365 : {
366 154 : digval = (unsigned) (ean % 10); /* get the decimal value */
367 154 : ean /= 10; /* get next digit */
368 154 : *--aux = (char) (digval + '0'); /* convert to ascii and store */
369 154 : } while (ean && search++ < 12);
370 14 : while (search++ < 12)
371 2 : *--aux = '0'; /* fill the remaining EAN13 with '0' */
372 :
373 : /* find out the data type: */
374 12 : if (strncmp("978", buf, 3) == 0)
375 : { /* ISBN */
376 2 : type = ISBN;
377 : }
378 10 : else if (strncmp("977", buf, 3) == 0)
379 : { /* ISSN */
380 2 : type = ISSN;
381 : }
382 8 : else if (strncmp("9790", buf, 4) == 0)
383 : { /* ISMN */
384 2 : type = ISMN;
385 : }
386 6 : else if (strncmp("979", buf, 3) == 0)
387 : { /* ISBN-13 */
388 4 : type = ISBN;
389 : }
390 2 : else if (*buf == '0')
391 : { /* UPC */
392 2 : type = UPC;
393 : }
394 : else
395 : {
396 0 : type = EAN13;
397 : }
398 12 : if (accept != ANY && accept != EAN13 && accept != type)
399 0 : goto eanwrongtype;
400 :
401 12 : *result = ret;
402 12 : return true;
403 :
404 0 : eanwrongtype:
405 0 : if (!errorOK)
406 : {
407 0 : if (type != EAN13)
408 : {
409 0 : ereport(ERROR,
410 : (errcode(ERRCODE_INVALID_TEXT_REPRESENTATION),
411 : errmsg("cannot cast EAN13(%s) to %s for number: \"%s\"",
412 : isn_names[type], isn_names[accept], buf)));
413 : }
414 : else
415 : {
416 0 : ereport(ERROR,
417 : (errcode(ERRCODE_INVALID_TEXT_REPRESENTATION),
418 : errmsg("cannot cast %s to %s for number: \"%s\"",
419 : isn_names[type], isn_names[accept], buf)));
420 : }
421 : }
422 0 : return false;
423 :
424 0 : eantoobig:
425 0 : if (!errorOK)
426 0 : ereport(ERROR,
427 : (errcode(ERRCODE_NUMERIC_VALUE_OUT_OF_RANGE),
428 : errmsg("value \"%" PRIu64 "\" is out of range for %s type",
429 : ean, isn_names[type])));
430 0 : return false;
431 : }
432 :
433 : /*
434 : * ean2UPC/ISxN --- Convert in-place a normalized EAN13 string to the corresponding
435 : * UPC/ISxN string number. Assumes the input string is normalized.
436 : */
437 : static inline void
438 14 : ean2ISBN(char *isn)
439 : {
440 : char *aux;
441 : unsigned check;
442 :
443 : /*
444 : * The number should come in this format: 978-0-000-00000-0 or may be an
445 : * ISBN-13 number, 979-..., which does not have a short representation. Do
446 : * the short output version if possible.
447 : */
448 14 : if (strncmp("978-", isn, 4) == 0)
449 : {
450 : /* Strip the first part and calculate the new check digit */
451 8 : hyphenate(isn, isn + 4, NULL, NULL);
452 8 : check = weight_checkdig(isn, 10);
453 8 : aux = strchr(isn, '\0');
454 8 : while (!isdigit((unsigned char) *--aux));
455 8 : if (check == 10)
456 2 : *aux = 'X';
457 : else
458 6 : *aux = check + '0';
459 : }
460 14 : }
461 :
462 : static inline void
463 8 : ean2ISMN(char *isn)
464 : {
465 : /* the number should come in this format: 979-0-000-00000-0 */
466 : /* Just strip the first part and change the first digit ('0') to 'M' */
467 8 : hyphenate(isn, isn + 4, NULL, NULL);
468 8 : isn[0] = 'M';
469 8 : }
470 :
471 : static inline void
472 4 : ean2ISSN(char *isn)
473 : {
474 : unsigned check;
475 :
476 : /* the number should come in this format: 977-0000-000-00-0 */
477 : /* Strip the first part, crop, and calculate the new check digit */
478 4 : hyphenate(isn, isn + 4, NULL, NULL);
479 4 : check = weight_checkdig(isn, 8);
480 4 : if (check == 10)
481 0 : isn[8] = 'X';
482 : else
483 4 : isn[8] = check + '0';
484 4 : isn[9] = '\0';
485 4 : }
486 :
487 : static inline void
488 4 : ean2UPC(char *isn)
489 : {
490 : /* the number should come in this format: 000-000000000-0 */
491 : /* Strip the first part, crop, and dehyphenate */
492 4 : dehyphenate(isn, isn + 1);
493 4 : isn[12] = '\0';
494 4 : }
495 :
496 : /*
497 : * ean2* --- Converts a string of digits into an ean13 number.
498 : * Assumes the input string is a string with only digits
499 : * on it, and that it's within the range of ean13.
500 : *
501 : * Returns the ean13 value of the string.
502 : */
503 : static ean13
504 86 : str2ean(const char *num)
505 : {
506 86 : ean13 ean = 0; /* current ean */
507 :
508 1204 : while (*num)
509 : {
510 1118 : if (isdigit((unsigned char) *num))
511 1118 : ean = 10 * ean + (*num - '0');
512 1118 : num++;
513 : }
514 86 : return (ean << 1); /* also give room to a flag */
515 : }
516 :
517 : /*
518 : * ean2string --- Try to convert an ean13 number to a hyphenated string.
519 : * Assumes there's enough space in result to hold
520 : * the string (maximum MAXEAN13LEN+1 bytes)
521 : * This doesn't verify for a valid check digit.
522 : *
523 : * If shortType is true, the returned string is in the old ISxN short format.
524 : * If errorOK is false, ereport a useful error message if the string is bad.
525 : * If errorOK is true, just return "false" for bad input.
526 : */
527 : static bool
528 68 : ean2string(ean13 ean, bool errorOK, char *result, bool shortType)
529 : {
530 : const char *(*TABLE)[2];
531 : const unsigned (*TABLE_index)[2];
532 68 : enum isn_type type = INVALID;
533 :
534 : char *aux;
535 : unsigned digval;
536 : unsigned search;
537 68 : char valid = '\0'; /* was the number initially written with a
538 : * valid check digit? */
539 :
540 68 : TABLE_index = ISBN_index;
541 :
542 68 : if ((ean & 1) != 0)
543 2 : valid = '!';
544 68 : ean >>= 1;
545 : /* verify it's in the EAN13 range */
546 68 : if (ean > UINT64CONST(9999999999999))
547 0 : goto eantoobig;
548 :
549 : /* convert the number */
550 68 : search = 0;
551 68 : aux = result + MAXEAN13LEN;
552 68 : *aux = '\0'; /* terminate string; aux points to last digit */
553 68 : *--aux = valid; /* append '!' for numbers with invalid but
554 : * corrected check digit */
555 : do
556 : {
557 878 : digval = (unsigned) (ean % 10); /* get the decimal value */
558 878 : ean /= 10; /* get next digit */
559 878 : *--aux = (char) (digval + '0'); /* convert to ascii and store */
560 878 : if (search == 0)
561 68 : *--aux = '-'; /* the check digit is always there */
562 878 : } while (ean && search++ < 13);
563 142 : while (search++ < 13)
564 74 : *--aux = '0'; /* fill the remaining EAN13 with '0' */
565 :
566 : /* The string should be in this form: ???DDDDDDDDDDDD-D" */
567 68 : search = hyphenate(result, result + 3, EAN13_range, EAN13_index);
568 :
569 : /* verify it's a logically valid EAN13 */
570 68 : if (search == 0)
571 : {
572 0 : search = hyphenate(result, result + 3, NULL, NULL);
573 0 : goto okay;
574 : }
575 :
576 : /* find out what type of hyphenation is needed: */
577 68 : if (strncmp("978-", result, search) == 0)
578 : { /* ISBN -13 978-range */
579 : /* The string should be in this form: 978-??000000000-0" */
580 14 : type = ISBN;
581 14 : TABLE = ISBN_range;
582 14 : TABLE_index = ISBN_index;
583 : }
584 54 : else if (strncmp("977-", result, search) == 0)
585 : { /* ISSN */
586 : /* The string should be in this form: 977-??000000000-0" */
587 14 : type = ISSN;
588 14 : TABLE = ISSN_range;
589 14 : TABLE_index = ISSN_index;
590 : }
591 40 : else if (strncmp("979-0", result, search + 1) == 0)
592 : { /* ISMN */
593 : /* The string should be in this form: 979-0?000000000-0" */
594 16 : type = ISMN;
595 16 : TABLE = ISMN_range;
596 16 : TABLE_index = ISMN_index;
597 : }
598 24 : else if (strncmp("979-", result, search) == 0)
599 : { /* ISBN-13 979-range */
600 : /* The string should be in this form: 979-??000000000-0" */
601 12 : type = ISBN;
602 12 : TABLE = ISBN_range_new;
603 12 : TABLE_index = ISBN_index_new;
604 : }
605 12 : else if (*result == '0')
606 : { /* UPC */
607 : /* The string should be in this form: 000-00000000000-0" */
608 6 : type = UPC;
609 6 : TABLE = UPC_range;
610 6 : TABLE_index = UPC_index;
611 : }
612 : else
613 : {
614 6 : type = EAN13;
615 6 : TABLE = NULL;
616 6 : TABLE_index = NULL;
617 : }
618 :
619 : /* verify it's a logically valid EAN13/UPC/ISxN */
620 68 : digval = search;
621 68 : search = hyphenate(result + digval, result + digval + 2, TABLE, TABLE_index);
622 :
623 : /* verify it's a valid EAN13 */
624 68 : if (search == 0)
625 : {
626 18 : search = hyphenate(result + digval, result + digval + 2, NULL, NULL);
627 18 : goto okay;
628 : }
629 :
630 50 : okay:
631 : /* convert to the old short type: */
632 68 : if (shortType)
633 30 : switch (type)
634 : {
635 14 : case ISBN:
636 14 : ean2ISBN(result);
637 14 : break;
638 8 : case ISMN:
639 8 : ean2ISMN(result);
640 8 : break;
641 4 : case ISSN:
642 4 : ean2ISSN(result);
643 4 : break;
644 4 : case UPC:
645 4 : ean2UPC(result);
646 4 : break;
647 0 : default:
648 0 : break;
649 : }
650 68 : return true;
651 :
652 0 : eantoobig:
653 0 : if (!errorOK)
654 0 : ereport(ERROR,
655 : (errcode(ERRCODE_NUMERIC_VALUE_OUT_OF_RANGE),
656 : errmsg("value \"%" PRIu64 "\" is out of range for %s type",
657 : ean, isn_names[type])));
658 0 : return false;
659 : }
660 :
661 : /*
662 : * string2ean --- try to parse a string into an ean13.
663 : *
664 : * ereturn false with a useful error message if the string is bad.
665 : * Otherwise return true.
666 : *
667 : * if the input string ends with '!' it will always be treated as invalid
668 : * (even if the check digit is valid)
669 : */
670 : static bool
671 150 : string2ean(const char *str, struct Node *escontext, ean13 *result,
672 : enum isn_type accept)
673 : {
674 : bool digit,
675 : last;
676 150 : char buf[17] = " ";
677 150 : char *aux1 = buf + 3; /* leave space for the first part, in case
678 : * it's needed */
679 150 : const char *aux2 = str;
680 150 : enum isn_type type = INVALID;
681 150 : unsigned check = 0,
682 150 : rcheck = (unsigned) -1;
683 150 : unsigned length = 0;
684 150 : bool magic = false,
685 150 : valid = true;
686 :
687 : /* recognize and validate the number: */
688 1914 : while (*aux2 && length <= 13)
689 : {
690 1772 : last = (*(aux2 + 1) == '!' || *(aux2 + 1) == '\0'); /* is the last character */
691 1772 : digit = (isdigit((unsigned char) *aux2) != 0); /* is current character
692 : * a digit? */
693 1772 : if (*aux2 == '?' && last) /* automagically calculate check digit if
694 : * it's '?' */
695 0 : magic = digit = true;
696 1772 : if (length == 0 && (*aux2 == 'M' || *aux2 == 'm'))
697 : {
698 : /* only ISMN can be here */
699 12 : if (type != INVALID)
700 0 : goto eaninvalid;
701 12 : type = ISMN;
702 12 : *aux1++ = 'M';
703 12 : length++;
704 : }
705 1760 : else if (length == 7 && (digit || *aux2 == 'X' || *aux2 == 'x') && last)
706 : {
707 : /* only ISSN can be here */
708 8 : if (type != INVALID)
709 0 : goto eaninvalid;
710 8 : type = ISSN;
711 8 : *aux1++ = pg_ascii_toupper((unsigned char) *aux2);
712 8 : length++;
713 : }
714 1752 : else if (length == 9 && (digit || *aux2 == 'X' || *aux2 == 'x') && last)
715 : {
716 : /* only ISBN and ISMN can be here */
717 20 : if (type != INVALID && type != ISMN)
718 0 : goto eaninvalid;
719 20 : if (type == INVALID)
720 8 : type = ISBN; /* ISMN must start with 'M' */
721 20 : *aux1++ = pg_ascii_toupper((unsigned char) *aux2);
722 20 : length++;
723 : }
724 1732 : else if (length == 11 && digit && last)
725 : {
726 : /* only UPC can be here */
727 0 : if (type != INVALID)
728 0 : goto eaninvalid;
729 0 : type = UPC;
730 0 : *aux1++ = *aux2;
731 0 : length++;
732 : }
733 1732 : else if (*aux2 == '-' || *aux2 == ' ')
734 : {
735 : /* skip, we could validate but I think it's worthless */
736 : }
737 1714 : else if (*aux2 == '!' && *(aux2 + 1) == '\0')
738 : {
739 : /* the invalid check digit suffix was found, set it */
740 0 : if (!magic)
741 0 : valid = false;
742 0 : magic = true;
743 : }
744 1714 : else if (!digit)
745 : {
746 8 : goto eaninvalid;
747 : }
748 : else
749 : {
750 1706 : *aux1++ = *aux2;
751 1706 : if (++length > 13)
752 0 : goto eantoobig;
753 : }
754 1764 : aux2++;
755 : }
756 142 : *aux1 = '\0'; /* terminate the string */
757 :
758 : /* find the current check digit value */
759 142 : if (length == 13)
760 : {
761 : /* only EAN13 can be here */
762 114 : if (type != INVALID)
763 0 : goto eaninvalid;
764 114 : type = EAN13;
765 114 : check = buf[15] - '0';
766 : }
767 28 : else if (length == 12)
768 : {
769 : /* only UPC can be here */
770 0 : if (type != UPC)
771 0 : goto eaninvalid;
772 0 : check = buf[14] - '0';
773 : }
774 28 : else if (length == 10)
775 : {
776 20 : if (type != ISBN && type != ISMN)
777 0 : goto eaninvalid;
778 20 : if (buf[12] == 'X')
779 6 : check = 10;
780 : else
781 14 : check = buf[12] - '0';
782 : }
783 8 : else if (length == 8)
784 : {
785 8 : if (type != INVALID && type != ISSN)
786 0 : goto eaninvalid;
787 8 : type = ISSN;
788 8 : if (buf[10] == 'X')
789 0 : check = 10;
790 : else
791 8 : check = buf[10] - '0';
792 : }
793 : else
794 0 : goto eaninvalid;
795 :
796 142 : if (type == INVALID)
797 0 : goto eaninvalid;
798 :
799 : /* obtain the real check digit value, validate, and convert to ean13: */
800 142 : if (accept == EAN13 && type != accept)
801 0 : goto eanwrongtype;
802 142 : if (accept != ANY && type != EAN13 && type != accept)
803 0 : goto eanwrongtype;
804 142 : switch (type)
805 : {
806 114 : case EAN13:
807 114 : valid = (valid && ((rcheck = checkdig(buf + 3, 13)) == check || magic));
808 : /* now get the subtype of EAN13: */
809 114 : if (buf[3] == '0')
810 16 : type = UPC;
811 98 : else if (strncmp("977", buf + 3, 3) == 0)
812 24 : type = ISSN;
813 74 : else if (strncmp("978", buf + 3, 3) == 0)
814 22 : type = ISBN;
815 52 : else if (strncmp("9790", buf + 3, 4) == 0)
816 18 : type = ISMN;
817 34 : else if (strncmp("979", buf + 3, 3) == 0)
818 22 : type = ISBN;
819 114 : if (accept != EAN13 && accept != ANY && type != accept)
820 40 : goto eanwrongtype;
821 74 : break;
822 12 : case ISMN:
823 12 : memcpy(buf, "9790", 4); /* this isn't for sure yet, for now ISMN
824 : * it's only 9790 */
825 12 : valid = (valid && ((rcheck = checkdig(buf, 13)) == check || magic));
826 12 : break;
827 8 : case ISBN:
828 8 : memcpy(buf, "978", 3);
829 8 : valid = (valid && ((rcheck = weight_checkdig(buf + 3, 10)) == check || magic));
830 8 : break;
831 8 : case ISSN:
832 8 : memcpy(buf + 10, "00", 2); /* append 00 as the normal issue
833 : * publication code */
834 8 : memcpy(buf, "977", 3);
835 8 : valid = (valid && ((rcheck = weight_checkdig(buf + 3, 8)) == check || magic));
836 8 : break;
837 0 : case UPC:
838 0 : buf[2] = '0';
839 0 : valid = (valid && ((rcheck = checkdig(buf + 2, 13)) == check || magic));
840 0 : default:
841 0 : break;
842 : }
843 :
844 : /* fix the check digit: */
845 324 : for (aux1 = buf; *aux1 && *aux1 <= ' '; aux1++);
846 102 : aux1[12] = checkdig(aux1, 13) + '0';
847 102 : aux1[13] = '\0';
848 :
849 102 : if (!valid && !magic)
850 22 : goto eanbadcheck;
851 :
852 80 : *result = str2ean(aux1);
853 80 : *result |= valid ? 0 : 1;
854 80 : return true;
855 :
856 22 : eanbadcheck:
857 22 : if (g_weak)
858 : { /* weak input mode is activated: */
859 : /* set the "invalid-check-digit-on-input" flag */
860 6 : *result = str2ean(aux1);
861 6 : *result |= 1;
862 6 : return true;
863 : }
864 :
865 16 : if (rcheck == (unsigned) -1)
866 : {
867 0 : ereturn(escontext, false,
868 : (errcode(ERRCODE_INVALID_TEXT_REPRESENTATION),
869 : errmsg("invalid %s number: \"%s\"",
870 : isn_names[accept], str)));
871 : }
872 : else
873 : {
874 16 : ereturn(escontext, false,
875 : (errcode(ERRCODE_INVALID_TEXT_REPRESENTATION),
876 : errmsg("invalid check digit for %s number: \"%s\", should be %c",
877 : isn_names[accept], str, (rcheck == 10) ? ('X') : (rcheck + '0'))));
878 : }
879 :
880 8 : eaninvalid:
881 8 : ereturn(escontext, false,
882 : (errcode(ERRCODE_INVALID_TEXT_REPRESENTATION),
883 : errmsg("invalid input syntax for %s number: \"%s\"",
884 : isn_names[accept], str)));
885 :
886 40 : eanwrongtype:
887 40 : ereturn(escontext, false,
888 : (errcode(ERRCODE_INVALID_TEXT_REPRESENTATION),
889 : errmsg("cannot cast %s to %s for number: \"%s\"",
890 : isn_names[type], isn_names[accept], str)));
891 :
892 0 : eantoobig:
893 0 : ereturn(escontext, false,
894 : (errcode(ERRCODE_NUMERIC_VALUE_OUT_OF_RANGE),
895 : errmsg("value \"%s\" is out of range for %s type",
896 : str, isn_names[accept])));
897 : }
898 :
899 : /*----------------------------------------------------------
900 : * Exported routines.
901 : *---------------------------------------------------------*/
902 :
903 : void
904 2 : _PG_init(void)
905 : {
906 : if (ISN_DEBUG)
907 : {
908 : if (!check_table(EAN13_range, EAN13_index))
909 : elog(ERROR, "EAN13 failed check");
910 : if (!check_table(ISBN_range, ISBN_index))
911 : elog(ERROR, "ISBN failed check");
912 : if (!check_table(ISMN_range, ISMN_index))
913 : elog(ERROR, "ISMN failed check");
914 : if (!check_table(ISSN_range, ISSN_index))
915 : elog(ERROR, "ISSN failed check");
916 : if (!check_table(UPC_range, UPC_index))
917 : elog(ERROR, "UPC failed check");
918 : }
919 :
920 : /* Define a GUC variable for weak mode. */
921 2 : DefineCustomBoolVariable("isn.weak",
922 : "Accept input with invalid ISN check digits.",
923 : NULL,
924 : &g_weak,
925 : false,
926 : PGC_USERSET,
927 : 0,
928 : NULL,
929 : NULL,
930 : NULL);
931 :
932 2 : MarkGUCPrefixReserved("isn");
933 2 : }
934 :
935 : /* isn_out
936 : */
937 16 : PG_FUNCTION_INFO_V1(isn_out);
938 : Datum
939 30 : isn_out(PG_FUNCTION_ARGS)
940 : {
941 30 : ean13 val = PG_GETARG_EAN13(0);
942 : char *result;
943 : char buf[MAXEAN13LEN + 1];
944 :
945 30 : (void) ean2string(val, false, buf, true);
946 :
947 30 : result = pstrdup(buf);
948 30 : PG_RETURN_CSTRING(result);
949 : }
950 :
951 : /* ean13_out
952 : */
953 16 : PG_FUNCTION_INFO_V1(ean13_out);
954 : Datum
955 38 : ean13_out(PG_FUNCTION_ARGS)
956 : {
957 38 : ean13 val = PG_GETARG_EAN13(0);
958 : char *result;
959 : char buf[MAXEAN13LEN + 1];
960 :
961 38 : (void) ean2string(val, false, buf, false);
962 :
963 38 : result = pstrdup(buf);
964 38 : PG_RETURN_CSTRING(result);
965 : }
966 :
967 : /* ean13_in
968 : */
969 4 : PG_FUNCTION_INFO_V1(ean13_in);
970 : Datum
971 46 : ean13_in(PG_FUNCTION_ARGS)
972 : {
973 46 : const char *str = PG_GETARG_CSTRING(0);
974 : ean13 result;
975 :
976 46 : if (!string2ean(str, fcinfo->context, &result, EAN13))
977 4 : PG_RETURN_NULL();
978 36 : PG_RETURN_EAN13(result);
979 : }
980 :
981 : /* isbn_in
982 : */
983 8 : PG_FUNCTION_INFO_V1(isbn_in);
984 : Datum
985 38 : isbn_in(PG_FUNCTION_ARGS)
986 : {
987 38 : const char *str = PG_GETARG_CSTRING(0);
988 : ean13 result;
989 :
990 38 : if (!string2ean(str, fcinfo->context, &result, ISBN))
991 0 : PG_RETURN_NULL();
992 18 : PG_RETURN_EAN13(result);
993 : }
994 :
995 : /* ismn_in
996 : */
997 8 : PG_FUNCTION_INFO_V1(ismn_in);
998 : Datum
999 24 : ismn_in(PG_FUNCTION_ARGS)
1000 : {
1001 24 : const char *str = PG_GETARG_CSTRING(0);
1002 : ean13 result;
1003 :
1004 24 : if (!string2ean(str, fcinfo->context, &result, ISMN))
1005 0 : PG_RETURN_NULL();
1006 14 : PG_RETURN_EAN13(result);
1007 : }
1008 :
1009 : /* issn_in
1010 : */
1011 8 : PG_FUNCTION_INFO_V1(issn_in);
1012 : Datum
1013 26 : issn_in(PG_FUNCTION_ARGS)
1014 : {
1015 26 : const char *str = PG_GETARG_CSTRING(0);
1016 : ean13 result;
1017 :
1018 26 : if (!string2ean(str, fcinfo->context, &result, ISSN))
1019 0 : PG_RETURN_NULL();
1020 16 : PG_RETURN_EAN13(result);
1021 : }
1022 :
1023 : /* upc_in
1024 : */
1025 4 : PG_FUNCTION_INFO_V1(upc_in);
1026 : Datum
1027 16 : upc_in(PG_FUNCTION_ARGS)
1028 : {
1029 16 : const char *str = PG_GETARG_CSTRING(0);
1030 : ean13 result;
1031 :
1032 16 : if (!string2ean(str, fcinfo->context, &result, UPC))
1033 4 : PG_RETURN_NULL();
1034 2 : PG_RETURN_EAN13(result);
1035 : }
1036 :
1037 : /* casting functions
1038 : */
1039 8 : PG_FUNCTION_INFO_V1(isbn_cast_from_ean13);
1040 : Datum
1041 6 : isbn_cast_from_ean13(PG_FUNCTION_ARGS)
1042 : {
1043 6 : ean13 val = PG_GETARG_EAN13(0);
1044 : ean13 result;
1045 :
1046 6 : (void) ean2isn(val, false, &result, ISBN);
1047 :
1048 6 : PG_RETURN_EAN13(result);
1049 : }
1050 :
1051 6 : PG_FUNCTION_INFO_V1(ismn_cast_from_ean13);
1052 : Datum
1053 2 : ismn_cast_from_ean13(PG_FUNCTION_ARGS)
1054 : {
1055 2 : ean13 val = PG_GETARG_EAN13(0);
1056 : ean13 result;
1057 :
1058 2 : (void) ean2isn(val, false, &result, ISMN);
1059 :
1060 2 : PG_RETURN_EAN13(result);
1061 : }
1062 :
1063 6 : PG_FUNCTION_INFO_V1(issn_cast_from_ean13);
1064 : Datum
1065 2 : issn_cast_from_ean13(PG_FUNCTION_ARGS)
1066 : {
1067 2 : ean13 val = PG_GETARG_EAN13(0);
1068 : ean13 result;
1069 :
1070 2 : (void) ean2isn(val, false, &result, ISSN);
1071 :
1072 2 : PG_RETURN_EAN13(result);
1073 : }
1074 :
1075 4 : PG_FUNCTION_INFO_V1(upc_cast_from_ean13);
1076 : Datum
1077 2 : upc_cast_from_ean13(PG_FUNCTION_ARGS)
1078 : {
1079 2 : ean13 val = PG_GETARG_EAN13(0);
1080 : ean13 result;
1081 :
1082 2 : (void) ean2isn(val, false, &result, UPC);
1083 :
1084 2 : PG_RETURN_EAN13(result);
1085 : }
1086 :
1087 :
1088 : /* is_valid - returns false if the "invalid-check-digit-on-input" is set
1089 : */
1090 18 : PG_FUNCTION_INFO_V1(is_valid);
1091 : Datum
1092 2 : is_valid(PG_FUNCTION_ARGS)
1093 : {
1094 2 : ean13 val = PG_GETARG_EAN13(0);
1095 :
1096 2 : PG_RETURN_BOOL((val & 1) == 0);
1097 : }
1098 :
1099 : /* make_valid - unsets the "invalid-check-digit-on-input" flag
1100 : */
1101 18 : PG_FUNCTION_INFO_V1(make_valid);
1102 : Datum
1103 2 : make_valid(PG_FUNCTION_ARGS)
1104 : {
1105 2 : ean13 val = PG_GETARG_EAN13(0);
1106 :
1107 2 : val &= ~((ean13) 1);
1108 2 : PG_RETURN_EAN13(val);
1109 : }
1110 :
1111 : /* this function temporarily sets weak input flag
1112 : * (to lose the strictness of check digit acceptance)
1113 : */
1114 4 : PG_FUNCTION_INFO_V1(accept_weak_input);
1115 : Datum
1116 2 : accept_weak_input(PG_FUNCTION_ARGS)
1117 : {
1118 2 : bool newvalue = PG_GETARG_BOOL(0);
1119 :
1120 2 : (void) set_config_option("isn.weak", newvalue ? "on" : "off",
1121 : PGC_USERSET, PGC_S_SESSION,
1122 : GUC_ACTION_SET, true, 0, false);
1123 2 : PG_RETURN_BOOL(g_weak);
1124 : }
1125 :
1126 4 : PG_FUNCTION_INFO_V1(weak_input_status);
1127 : Datum
1128 2 : weak_input_status(PG_FUNCTION_ARGS)
1129 : {
1130 2 : PG_RETURN_BOOL(g_weak);
1131 : }
|