LCOV - code coverage report
Current view: top level - src/backend/tsearch - ts_parse.c (source / functions) Coverage Total Hit
Test: PostgreSQL 19devel Lines: 92.8 % 276 256
Test Date: 2026-04-18 20:16:25 Functions: 100.0 % 15 15
Legend: Lines:     hit not hit

            Line data    Source code
       1              : /*-------------------------------------------------------------------------
       2              :  *
       3              :  * ts_parse.c
       4              :  *      main parse functions for tsearch
       5              :  *
       6              :  * Portions Copyright (c) 1996-2026, PostgreSQL Global Development Group
       7              :  *
       8              :  *
       9              :  * IDENTIFICATION
      10              :  *    src/backend/tsearch/ts_parse.c
      11              :  *
      12              :  *-------------------------------------------------------------------------
      13              :  */
      14              : 
      15              : #include "postgres.h"
      16              : 
      17              : #include "tsearch/ts_cache.h"
      18              : #include "tsearch/ts_utils.h"
      19              : #include "varatt.h"
      20              : 
      21              : #define IGNORE_LONGLEXEME   1
      22              : 
      23              : /*
      24              :  * Lexize subsystem
      25              :  */
      26              : 
      27              : typedef struct ParsedLex
      28              : {
      29              :     int         type;
      30              :     char       *lemm;
      31              :     int         lenlemm;
      32              :     struct ParsedLex *next;
      33              : } ParsedLex;
      34              : 
      35              : typedef struct ListParsedLex
      36              : {
      37              :     ParsedLex  *head;
      38              :     ParsedLex  *tail;
      39              : } ListParsedLex;
      40              : 
      41              : typedef struct
      42              : {
      43              :     TSConfigCacheEntry *cfg;
      44              :     Oid         curDictId;
      45              :     int         posDict;
      46              :     DictSubState dictState;
      47              :     ParsedLex  *curSub;
      48              :     ListParsedLex towork;       /* current list to work */
      49              :     ListParsedLex waste;        /* list of lexemes that already lexized */
      50              : 
      51              :     /*
      52              :      * fields to store last variant to lexize (basically, thesaurus or similar
      53              :      * to, which wants several lexemes
      54              :      */
      55              : 
      56              :     ParsedLex  *lastRes;
      57              :     TSLexeme   *tmpRes;
      58              : } LexizeData;
      59              : 
      60              : static void
      61         3860 : LexizeInit(LexizeData *ld, TSConfigCacheEntry *cfg)
      62              : {
      63         3860 :     ld->cfg = cfg;
      64         3860 :     ld->curDictId = InvalidOid;
      65         3860 :     ld->posDict = 0;
      66         3860 :     ld->towork.head = ld->towork.tail = ld->curSub = NULL;
      67         3860 :     ld->waste.head = ld->waste.tail = NULL;
      68         3860 :     ld->lastRes = NULL;
      69         3860 :     ld->tmpRes = NULL;
      70         3860 : }
      71              : 
      72              : static void
      73        45616 : LPLAddTail(ListParsedLex *list, ParsedLex *newpl)
      74              : {
      75        45616 :     if (list->tail)
      76              :     {
      77          185 :         list->tail->next = newpl;
      78          185 :         list->tail = newpl;
      79              :     }
      80              :     else
      81        45431 :         list->head = list->tail = newpl;
      82        45616 :     newpl->next = NULL;
      83        45616 : }
      84              : 
      85              : static ParsedLex *
      86        22808 : LPLRemoveHead(ListParsedLex *list)
      87              : {
      88        22808 :     ParsedLex  *res = list->head;
      89              : 
      90        22808 :     if (list->head)
      91        22808 :         list->head = list->head->next;
      92              : 
      93        22808 :     if (list->head == NULL)
      94        22703 :         list->tail = NULL;
      95              : 
      96        22808 :     return res;
      97              : }
      98              : 
      99              : static void
     100        22808 : LexizeAddLemm(LexizeData *ld, int type, char *lemm, int lenlemm)
     101              : {
     102        22808 :     ParsedLex  *newpl = palloc_object(ParsedLex);
     103              : 
     104        22808 :     newpl->type = type;
     105        22808 :     newpl->lemm = lemm;
     106        22808 :     newpl->lenlemm = lenlemm;
     107        22808 :     LPLAddTail(&ld->towork, newpl);
     108        22808 :     ld->curSub = ld->towork.tail;
     109        22808 : }
     110              : 
     111              : static void
     112        22808 : RemoveHead(LexizeData *ld)
     113              : {
     114        22808 :     LPLAddTail(&ld->waste, LPLRemoveHead(&ld->towork));
     115              : 
     116        22808 :     ld->posDict = 0;
     117        22808 : }
     118              : 
     119              : static void
     120        33920 : setCorrLex(LexizeData *ld, ParsedLex **correspondLexem)
     121              : {
     122        33920 :     if (correspondLexem)
     123              :     {
     124        12427 :         *correspondLexem = ld->waste.head;
     125              :     }
     126              :     else
     127              :     {
     128              :         ParsedLex  *tmp,
     129        21493 :                    *ptr = ld->waste.head;
     130              : 
     131        35948 :         while (ptr)
     132              :         {
     133        14455 :             tmp = ptr->next;
     134        14455 :             pfree(ptr);
     135        14455 :             ptr = tmp;
     136              :         }
     137              :     }
     138        33920 :     ld->waste.head = ld->waste.tail = NULL;
     139        33920 : }
     140              : 
     141              : static void
     142           40 : moveToWaste(LexizeData *ld, ParsedLex *stop)
     143              : {
     144           40 :     bool        go = true;
     145              : 
     146          150 :     while (ld->towork.head && go)
     147              :     {
     148          110 :         if (ld->towork.head == stop)
     149              :         {
     150           40 :             ld->curSub = stop->next;
     151           40 :             go = false;
     152              :         }
     153          110 :         RemoveHead(ld);
     154              :     }
     155           40 : }
     156              : 
     157              : static void
     158           40 : setNewTmpRes(LexizeData *ld, ParsedLex *lex, TSLexeme *res)
     159              : {
     160           40 :     if (ld->tmpRes)
     161              :     {
     162              :         TSLexeme   *ptr;
     163              : 
     164           20 :         for (ptr = ld->tmpRes; ptr->lexeme; ptr++)
     165           10 :             pfree(ptr->lexeme);
     166           10 :         pfree(ld->tmpRes);
     167              :     }
     168           40 :     ld->tmpRes = res;
     169           40 :     ld->lastRes = lex;
     170           40 : }
     171              : 
     172              : static TSLexeme *
     173        33960 : LexizeExec(LexizeData *ld, ParsedLex **correspondLexem)
     174              : {
     175              :     int         i;
     176              :     ListDictionary *map;
     177              :     TSDictionaryCacheEntry *dict;
     178              :     TSLexeme   *res;
     179              : 
     180        33960 :     if (ld->curDictId == InvalidOid)
     181              :     {
     182              :         /*
     183              :          * usual mode: dictionary wants only one word, but we should keep in
     184              :          * mind that we should go through all stack
     185              :          */
     186              : 
     187        45441 :         while (ld->towork.head)
     188              :         {
     189        22738 :             ParsedLex  *curVal = ld->towork.head;
     190        22738 :             char       *curValLemm = curVal->lemm;
     191        22738 :             int         curValLenLemm = curVal->lenlemm;
     192              : 
     193        22738 :             map = ld->cfg->map + curVal->type;
     194              : 
     195        22738 :             if (curVal->type == 0 || curVal->type >= ld->cfg->lenmap || map->len == 0)
     196              :             {
     197              :                 /* skip this type of lexeme */
     198        11626 :                 RemoveHead(ld);
     199        11626 :                 continue;
     200              :             }
     201              : 
     202        11522 :             for (i = ld->posDict; i < map->len; i++)
     203              :             {
     204        11522 :                 dict = lookup_ts_dictionary_cache(map->dictIds[i]);
     205              : 
     206        11522 :                 ld->dictState.isend = ld->dictState.getnext = false;
     207        11522 :                 ld->dictState.private_state = NULL;
     208        11522 :                 res = (TSLexeme *) DatumGetPointer(FunctionCall4(&(dict->lexize),
     209              :                                                                  PointerGetDatum(dict->dictData),
     210              :                                                                  PointerGetDatum(curValLemm),
     211              :                                                                  Int32GetDatum(curValLenLemm),
     212              :                                                                  PointerGetDatum(&ld->dictState)));
     213              : 
     214        11522 :                 if (ld->dictState.getnext)
     215              :                 {
     216              :                     /*
     217              :                      * dictionary wants next word, so setup and store current
     218              :                      * position and go to multiword mode
     219              :                      */
     220              : 
     221           40 :                     ld->curDictId = map->dictIds[i];
     222           40 :                     ld->posDict = i + 1;
     223           40 :                     ld->curSub = curVal->next;
     224           40 :                     if (res)
     225           30 :                         setNewTmpRes(ld, curVal, res);
     226           40 :                     return LexizeExec(ld, correspondLexem);
     227              :                 }
     228              : 
     229        11482 :                 if (!res)       /* dictionary doesn't know this lexeme */
     230          410 :                     continue;
     231              : 
     232        11072 :                 if (res->flags & TSL_FILTER)
     233              :                 {
     234            0 :                     curValLemm = res->lexeme;
     235            0 :                     curValLenLemm = strlen(res->lexeme);
     236            0 :                     continue;
     237              :                 }
     238              : 
     239        11072 :                 RemoveHead(ld);
     240        11072 :                 setCorrLex(ld, correspondLexem);
     241        11072 :                 return res;
     242              :             }
     243              : 
     244            0 :             RemoveHead(ld);
     245              :         }
     246              :     }
     247              :     else
     248              :     {                           /* curDictId is valid */
     249          145 :         dict = lookup_ts_dictionary_cache(ld->curDictId);
     250              : 
     251              :         /*
     252              :          * Dictionary ld->curDictId asks us about following words
     253              :          */
     254              : 
     255          210 :         while (ld->curSub)
     256              :         {
     257          105 :             ParsedLex  *curVal = ld->curSub;
     258              : 
     259          105 :             map = ld->cfg->map + curVal->type;
     260              : 
     261          105 :             if (curVal->type != 0)
     262              :             {
     263          100 :                 bool        dictExists = false;
     264              : 
     265          100 :                 if (curVal->type >= ld->cfg->lenmap || map->len == 0)
     266              :                 {
     267              :                     /* skip this type of lexeme */
     268           50 :                     ld->curSub = curVal->next;
     269           50 :                     continue;
     270              :                 }
     271              : 
     272              :                 /*
     273              :                  * We should be sure that current type of lexeme is recognized
     274              :                  * by our dictionary: we just check is it exist in list of
     275              :                  * dictionaries ?
     276              :                  */
     277          150 :                 for (i = 0; i < map->len && !dictExists; i++)
     278          100 :                     if (ld->curDictId == map->dictIds[i])
     279           50 :                         dictExists = true;
     280              : 
     281           50 :                 if (!dictExists)
     282              :                 {
     283              :                     /*
     284              :                      * Dictionary can't work with current type of lexeme,
     285              :                      * return to basic mode and redo all stored lexemes
     286              :                      */
     287            0 :                     ld->curDictId = InvalidOid;
     288            0 :                     return LexizeExec(ld, correspondLexem);
     289              :                 }
     290              :             }
     291              : 
     292           55 :             ld->dictState.isend = (curVal->type == 0);
     293           55 :             ld->dictState.getnext = false;
     294              : 
     295           55 :             res = (TSLexeme *) DatumGetPointer(FunctionCall4(&(dict->lexize),
     296              :                                                              PointerGetDatum(dict->dictData),
     297              :                                                              PointerGetDatum(curVal->lemm),
     298              :                                                              Int32GetDatum(curVal->lenlemm),
     299              :                                                              PointerGetDatum(&ld->dictState)));
     300              : 
     301           55 :             if (ld->dictState.getnext)
     302              :             {
     303              :                 /* Dictionary wants one more */
     304           15 :                 ld->curSub = curVal->next;
     305           15 :                 if (res)
     306           10 :                     setNewTmpRes(ld, curVal, res);
     307           15 :                 continue;
     308              :             }
     309              : 
     310           40 :             if (res || ld->tmpRes)
     311              :             {
     312              :                 /*
     313              :                  * Dictionary normalizes lexemes, so we remove from stack all
     314              :                  * used lexemes, return to basic mode and redo end of stack
     315              :                  * (if it exists)
     316              :                  */
     317           40 :                 if (res)
     318              :                 {
     319           20 :                     moveToWaste(ld, ld->curSub);
     320              :                 }
     321              :                 else
     322              :                 {
     323           20 :                     res = ld->tmpRes;
     324           20 :                     moveToWaste(ld, ld->lastRes);
     325              :                 }
     326              : 
     327              :                 /* reset to initial state */
     328           40 :                 ld->curDictId = InvalidOid;
     329           40 :                 ld->posDict = 0;
     330           40 :                 ld->lastRes = NULL;
     331           40 :                 ld->tmpRes = NULL;
     332           40 :                 setCorrLex(ld, correspondLexem);
     333           40 :                 return res;
     334              :             }
     335              : 
     336              :             /*
     337              :              * Dict don't want next lexem and didn't recognize anything, redo
     338              :              * from ld->towork.head
     339              :              */
     340            0 :             ld->curDictId = InvalidOid;
     341            0 :             return LexizeExec(ld, correspondLexem);
     342              :         }
     343              :     }
     344              : 
     345        22808 :     setCorrLex(ld, correspondLexem);
     346        22808 :     return NULL;
     347              : }
     348              : 
     349              : /*
     350              :  * Parse string and lexize words.
     351              :  *
     352              :  * prs will be filled in.
     353              :  */
     354              : void
     355         3569 : parsetext(Oid cfgId, ParsedText *prs, char *buf, int buflen)
     356              : {
     357              :     int         type,
     358         3569 :                 lenlemm = 0;    /* silence compiler warning */
     359         3569 :     char       *lemm = NULL;
     360              :     LexizeData  ldata;
     361              :     TSLexeme   *norms;
     362              :     TSConfigCacheEntry *cfg;
     363              :     TSParserCacheEntry *prsobj;
     364              :     void       *prsdata;
     365              : 
     366         3569 :     cfg = lookup_ts_config_cache(cfgId);
     367         3569 :     prsobj = lookup_ts_parser_cache(cfg->prsId);
     368              : 
     369         3569 :     prsdata = DatumGetPointer(FunctionCall2(&prsobj->prsstart,
     370              :                                             PointerGetDatum(buf),
     371              :                                             Int32GetDatum(buflen)));
     372              : 
     373         3569 :     LexizeInit(&ldata, cfg);
     374              : 
     375              :     do
     376              :     {
     377        14455 :         type = DatumGetInt32(FunctionCall3(&(prsobj->prstoken),
     378              :                                            PointerGetDatum(prsdata),
     379              :                                            PointerGetDatum(&lemm),
     380              :                                            PointerGetDatum(&lenlemm)));
     381              : 
     382        14455 :         if (type > 0 && lenlemm >= MAXSTRLEN)
     383              :         {
     384              : #ifdef IGNORE_LONGLEXEME
     385            0 :             ereport(NOTICE,
     386              :                     (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),
     387              :                      errmsg("word is too long to be indexed"),
     388              :                      errdetail("Words longer than %d characters are ignored.",
     389              :                                MAXSTRLEN)));
     390            0 :             continue;
     391              : #else
     392              :             ereport(ERROR,
     393              :                     (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),
     394              :                      errmsg("word is too long to be indexed"),
     395              :                      errdetail("Words longer than %d characters are ignored.",
     396              :                                MAXSTRLEN)));
     397              : #endif
     398              :         }
     399              : 
     400        14455 :         LexizeAddLemm(&ldata, type, lemm, lenlemm);
     401              : 
     402        21493 :         while ((norms = LexizeExec(&ldata, NULL)) != NULL)
     403              :         {
     404         7038 :             TSLexeme   *ptr = norms;
     405              : 
     406         7038 :             prs->pos++;          /* set pos */
     407              : 
     408        13076 :             while (ptr->lexeme)
     409              :             {
     410         6038 :                 if (prs->curwords == prs->lenwords)
     411              :                 {
     412          275 :                     prs->lenwords *= 2;
     413          275 :                     prs->words = (ParsedWord *) repalloc(prs->words, prs->lenwords * sizeof(ParsedWord));
     414              :                 }
     415              : 
     416         6038 :                 if (ptr->flags & TSL_ADDPOS)
     417           20 :                     prs->pos++;
     418         6038 :                 prs->words[prs->curwords].len = strlen(ptr->lexeme);
     419         6038 :                 prs->words[prs->curwords].word = ptr->lexeme;
     420         6038 :                 prs->words[prs->curwords].nvariant = ptr->nvariant;
     421         6038 :                 prs->words[prs->curwords].flags = ptr->flags & TSL_PREFIX;
     422         6038 :                 prs->words[prs->curwords].alen = 0;
     423         6038 :                 prs->words[prs->curwords].pos.pos = LIMITPOS(prs->pos);
     424         6038 :                 ptr++;
     425         6038 :                 prs->curwords++;
     426              :             }
     427         7038 :             pfree(norms);
     428              :         }
     429        14455 :     } while (type > 0);
     430              : 
     431         3569 :     FunctionCall1(&(prsobj->prsend), PointerGetDatum(prsdata));
     432         3569 : }
     433              : 
     434              : /*
     435              :  * Headline framework
     436              :  */
     437              : 
     438              : /* Add a word to prs->words[] */
     439              : static void
     440         8062 : hladdword(HeadlineParsedText *prs, char *buf, int buflen, int type)
     441              : {
     442         8062 :     if (prs->curwords >= prs->lenwords)
     443              :     {
     444           45 :         prs->lenwords *= 2;
     445           45 :         prs->words = (HeadlineWordEntry *) repalloc(prs->words, prs->lenwords * sizeof(HeadlineWordEntry));
     446              :     }
     447         8062 :     memset(&(prs->words[prs->curwords]), 0, sizeof(HeadlineWordEntry));
     448         8062 :     prs->words[prs->curwords].type = (uint8) type;
     449         8062 :     prs->words[prs->curwords].len = buflen;
     450         8062 :     prs->words[prs->curwords].word = palloc(buflen);
     451         8062 :     memcpy(prs->words[prs->curwords].word, buf, buflen);
     452         8062 :     prs->curwords++;
     453         8062 : }
     454              : 
     455              : /*
     456              :  * Add pos and matching-query-item data to the just-added word.
     457              :  * Here, buf/buflen represent a processed lexeme, not raw token text.
     458              :  *
     459              :  * If the query contains more than one matching item, we replicate
     460              :  * the last-added word so that each item can be pointed to.  The
     461              :  * duplicate entries are marked with repeated = 1.
     462              :  */
     463              : static void
     464         2574 : hlfinditem(HeadlineParsedText *prs, TSQuery query, int32 pos, char *buf, int buflen)
     465              : {
     466              :     int         i;
     467         2574 :     QueryItem  *item = GETQUERY(query);
     468              :     HeadlineWordEntry *word;
     469              : 
     470         2684 :     while (prs->curwords + query->size >= prs->lenwords)
     471              :     {
     472          110 :         prs->lenwords *= 2;
     473          110 :         prs->words = (HeadlineWordEntry *) repalloc(prs->words, prs->lenwords * sizeof(HeadlineWordEntry));
     474              :     }
     475              : 
     476         2574 :     word = &(prs->words[prs->curwords - 1]);
     477         2574 :     word->pos = LIMITPOS(pos);
     478        12182 :     for (i = 0; i < query->size; i++)
     479              :     {
     480        15564 :         if (item->type == QI_VAL &&
     481         5956 :             tsCompareString(GETOPERAND(query) + item->qoperand.distance, item->qoperand.length,
     482         5956 :                             buf, buflen, item->qoperand.prefix) == 0)
     483              :         {
     484          499 :             if (word->item)
     485              :             {
     486            0 :                 memcpy(&(prs->words[prs->curwords]), word, sizeof(HeadlineWordEntry));
     487            0 :                 prs->words[prs->curwords].item = &item->qoperand;
     488            0 :                 prs->words[prs->curwords].repeated = 1;
     489            0 :                 prs->curwords++;
     490              :             }
     491              :             else
     492          499 :                 word->item = &item->qoperand;
     493              :         }
     494         9608 :         item++;
     495              :     }
     496         2574 : }
     497              : 
     498              : static void
     499        12427 : addHLParsedLex(HeadlineParsedText *prs, TSQuery query, ParsedLex *lexs, TSLexeme *norms)
     500              : {
     501              :     ParsedLex  *tmplexs;
     502              :     TSLexeme   *ptr;
     503              :     int32       savedpos;
     504              : 
     505        20780 :     while (lexs)
     506              :     {
     507         8353 :         if (lexs->type > 0)
     508         8062 :             hladdword(prs, lexs->lemm, lexs->lenlemm, lexs->type);
     509              : 
     510         8353 :         ptr = norms;
     511         8353 :         savedpos = prs->vectorpos;
     512        10927 :         while (ptr && ptr->lexeme)
     513              :         {
     514         2574 :             if (ptr->flags & TSL_ADDPOS)
     515            0 :                 savedpos++;
     516         2574 :             hlfinditem(prs, query, savedpos, ptr->lexeme, strlen(ptr->lexeme));
     517         2574 :             ptr++;
     518              :         }
     519              : 
     520         8353 :         tmplexs = lexs->next;
     521         8353 :         pfree(lexs);
     522         8353 :         lexs = tmplexs;
     523              :     }
     524              : 
     525        12427 :     if (norms)
     526              :     {
     527         4074 :         ptr = norms;
     528         6648 :         while (ptr->lexeme)
     529              :         {
     530         2574 :             if (ptr->flags & TSL_ADDPOS)
     531            0 :                 prs->vectorpos++;
     532         2574 :             pfree(ptr->lexeme);
     533         2574 :             ptr++;
     534              :         }
     535         4074 :         pfree(norms);
     536              :     }
     537        12427 : }
     538              : 
     539              : void
     540          291 : hlparsetext(Oid cfgId, HeadlineParsedText *prs, TSQuery query, char *buf, int buflen)
     541              : {
     542              :     int         type,
     543          291 :                 lenlemm = 0;    /* silence compiler warning */
     544          291 :     char       *lemm = NULL;
     545              :     LexizeData  ldata;
     546              :     TSLexeme   *norms;
     547              :     ParsedLex  *lexs;
     548              :     TSConfigCacheEntry *cfg;
     549              :     TSParserCacheEntry *prsobj;
     550              :     void       *prsdata;
     551              : 
     552          291 :     cfg = lookup_ts_config_cache(cfgId);
     553          291 :     prsobj = lookup_ts_parser_cache(cfg->prsId);
     554              : 
     555          291 :     prsdata = DatumGetPointer(FunctionCall2(&(prsobj->prsstart),
     556              :                                             PointerGetDatum(buf),
     557              :                                             Int32GetDatum(buflen)));
     558              : 
     559          291 :     LexizeInit(&ldata, cfg);
     560              : 
     561              :     do
     562              :     {
     563         8353 :         type = DatumGetInt32(FunctionCall3(&(prsobj->prstoken),
     564              :                                            PointerGetDatum(prsdata),
     565              :                                            PointerGetDatum(&lemm),
     566              :                                            PointerGetDatum(&lenlemm)));
     567              : 
     568         8353 :         if (type > 0 && lenlemm >= MAXSTRLEN)
     569              :         {
     570              : #ifdef IGNORE_LONGLEXEME
     571            0 :             ereport(NOTICE,
     572              :                     (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),
     573              :                      errmsg("word is too long to be indexed"),
     574              :                      errdetail("Words longer than %d characters are ignored.",
     575              :                                MAXSTRLEN)));
     576            0 :             continue;
     577              : #else
     578              :             ereport(ERROR,
     579              :                     (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),
     580              :                      errmsg("word is too long to be indexed"),
     581              :                      errdetail("Words longer than %d characters are ignored.",
     582              :                                MAXSTRLEN)));
     583              : #endif
     584              :         }
     585              : 
     586         8353 :         LexizeAddLemm(&ldata, type, lemm, lenlemm);
     587              : 
     588              :         do
     589              :         {
     590        12427 :             if ((norms = LexizeExec(&ldata, &lexs)) != NULL)
     591              :             {
     592         4074 :                 prs->vectorpos++;
     593         4074 :                 addHLParsedLex(prs, query, lexs, norms);
     594              :             }
     595              :             else
     596         8353 :                 addHLParsedLex(prs, query, lexs, NULL);
     597        12427 :         } while (norms);
     598         8353 :     } while (type > 0);
     599              : 
     600          291 :     FunctionCall1(&(prsobj->prsend), PointerGetDatum(prsdata));
     601          291 : }
     602              : 
     603              : /*
     604              :  * Generate the headline, as a text object, from HeadlineParsedText.
     605              :  */
     606              : text *
     607          291 : generateHeadline(HeadlineParsedText *prs)
     608              : {
     609              :     text       *out;
     610              :     char       *ptr;
     611          291 :     int         len = 128;
     612          291 :     int         numfragments = 0;
     613          291 :     int16       infrag = 0;
     614              : 
     615          291 :     HeadlineWordEntry *wrd = prs->words;
     616              : 
     617          291 :     out = (text *) palloc(len);
     618          291 :     ptr = ((char *) out) + VARHDRSZ;
     619              : 
     620         8353 :     while (wrd - prs->words < prs->curwords)
     621              :     {
     622         8142 :         while (wrd->len + prs->stopsellen + prs->startsellen + prs->fragdelimlen + (ptr - ((char *) out)) >= len)
     623              :         {
     624           80 :             int         dist = ptr - ((char *) out);
     625              : 
     626           80 :             len *= 2;
     627           80 :             out = (text *) repalloc(out, len);
     628           80 :             ptr = ((char *) out) + dist;
     629              :         }
     630              : 
     631         8062 :         if (wrd->in && !wrd->repeated)
     632              :         {
     633         4312 :             if (!infrag)
     634              :             {
     635              : 
     636              :                 /* start of a new fragment */
     637          296 :                 infrag = 1;
     638          296 :                 numfragments++;
     639              :                 /* add a fragment delimiter if this is after the first one */
     640          296 :                 if (numfragments > 1)
     641              :                 {
     642           10 :                     memcpy(ptr, prs->fragdelim, prs->fragdelimlen);
     643           10 :                     ptr += prs->fragdelimlen;
     644              :                 }
     645              :             }
     646         4312 :             if (wrd->replace)
     647              :             {
     648            0 :                 *ptr = ' ';
     649            0 :                 ptr++;
     650              :             }
     651         4312 :             else if (!wrd->skip)
     652              :             {
     653         4307 :                 if (wrd->selected)
     654              :                 {
     655          404 :                     memcpy(ptr, prs->startsel, prs->startsellen);
     656          404 :                     ptr += prs->startsellen;
     657              :                 }
     658         4307 :                 memcpy(ptr, wrd->word, wrd->len);
     659         4307 :                 ptr += wrd->len;
     660         4307 :                 if (wrd->selected)
     661              :                 {
     662          404 :                     memcpy(ptr, prs->stopsel, prs->stopsellen);
     663          404 :                     ptr += prs->stopsellen;
     664              :                 }
     665              :             }
     666              :         }
     667         3750 :         else if (!wrd->repeated)
     668              :         {
     669         3750 :             if (infrag)
     670          100 :                 infrag = 0;
     671         3750 :             pfree(wrd->word);
     672              :         }
     673              : 
     674         8062 :         wrd++;
     675              :     }
     676              : 
     677          291 :     SET_VARSIZE(out, ptr - ((char *) out));
     678          291 :     return out;
     679              : }
        

Generated by: LCOV version 2.0-1