LCOV - code coverage report
Current view: top level - src/backend/tsearch - to_tsany.c (source / functions) Coverage Total Hit
Test: Code coverage Lines: 96.7 % 364 352
Test Date: 2026-01-26 10:56:24 Functions: 92.3 % 26 24
Legend: Lines:     hit not hit
Branches: + taken - not taken # not executed
Branches: 70.6 % 126 89

             Branch data     Line data    Source code
       1                 :             : /*-------------------------------------------------------------------------
       2                 :             :  *
       3                 :             :  * to_tsany.c
       4                 :             :  *              to_ts* function definitions
       5                 :             :  *
       6                 :             :  * Portions Copyright (c) 1996-2026, PostgreSQL Global Development Group
       7                 :             :  *
       8                 :             :  *
       9                 :             :  * IDENTIFICATION
      10                 :             :  *        src/backend/tsearch/to_tsany.c
      11                 :             :  *
      12                 :             :  *-------------------------------------------------------------------------
      13                 :             :  */
      14                 :             : #include "postgres.h"
      15                 :             : 
      16                 :             : #include "tsearch/ts_cache.h"
      17                 :             : #include "tsearch/ts_utils.h"
      18                 :             : #include "utils/builtins.h"
      19                 :             : #include "utils/jsonfuncs.h"
      20                 :             : 
      21                 :             : 
      22                 :             : /*
      23                 :             :  * Opaque data structure, which is passed by parse_tsquery() to pushval_morph().
      24                 :             :  */
      25                 :             : typedef struct MorphOpaque
      26                 :             : {
      27                 :             :         Oid                     cfg_id;
      28                 :             : 
      29                 :             :         /*
      30                 :             :          * Single tsquery morph could be parsed into multiple words.  When these
      31                 :             :          * words reside in adjacent positions, they are connected using this
      32                 :             :          * operator.  Usually, that is OP_PHRASE, which requires word positions of
      33                 :             :          * a complex morph to exactly match the tsvector.
      34                 :             :          */
      35                 :             :         int                     qoperator;
      36                 :             : } MorphOpaque;
      37                 :             : 
      38                 :             : typedef struct TSVectorBuildState
      39                 :             : {
      40                 :             :         ParsedText *prs;
      41                 :             :         Oid                     cfgId;
      42                 :             : } TSVectorBuildState;
      43                 :             : 
      44                 :             : static void add_to_tsvector(void *_state, char *elem_value, int elem_len);
      45                 :             : 
      46                 :             : 
      47                 :             : Datum
      48                 :           0 : get_current_ts_config(PG_FUNCTION_ARGS)
      49                 :             : {
      50                 :           0 :         PG_RETURN_OID(getTSCurrentConfig(true));
      51                 :             : }
      52                 :             : 
      53                 :             : /*
      54                 :             :  * to_tsvector
      55                 :             :  */
      56                 :             : static int
      57                 :        2074 : compareWORD(const void *a, const void *b)
      58                 :             : {
      59                 :        2074 :         int                     res;
      60                 :             : 
      61                 :        4148 :         res = tsCompareString(((const ParsedWord *) a)->word, ((const ParsedWord *) a)->len,
      62                 :        2074 :                                                   ((const ParsedWord *) b)->word, ((const ParsedWord *) b)->len,
      63                 :             :                                                   false);
      64                 :             : 
      65         [ +  + ]:        2074 :         if (res == 0)
      66                 :             :         {
      67         [ +  + ]:         175 :                 if (((const ParsedWord *) a)->pos.pos == ((const ParsedWord *) b)->pos.pos)
      68                 :           4 :                         return 0;
      69                 :             : 
      70                 :         171 :                 res = (((const ParsedWord *) a)->pos.pos > ((const ParsedWord *) b)->pos.pos) ? 1 : -1;
      71                 :         171 :         }
      72                 :             : 
      73                 :        2070 :         return res;
      74                 :        2074 : }
      75                 :             : 
      76                 :             : static int
      77                 :         111 : uniqueWORD(ParsedWord *a, int32 l)
      78                 :             : {
      79                 :         111 :         ParsedWord *ptr,
      80                 :             :                            *res;
      81                 :         111 :         int                     tmppos;
      82                 :             : 
      83         [ +  + ]:         111 :         if (l == 1)
      84                 :             :         {
      85         [ -  + ]:           3 :                 tmppos = LIMITPOS(a->pos.pos);
      86                 :           3 :                 a->alen = 2;
      87                 :           3 :                 a->pos.apos = palloc_array(uint16, a->alen);
      88                 :           3 :                 a->pos.apos[0] = 1;
      89                 :           3 :                 a->pos.apos[1] = tmppos;
      90                 :           3 :                 return l;
      91                 :             :         }
      92                 :             : 
      93                 :         108 :         res = a;
      94                 :         108 :         ptr = a + 1;
      95                 :             : 
      96                 :             :         /*
      97                 :             :          * Sort words with its positions
      98                 :             :          */
      99                 :         108 :         qsort(a, l, sizeof(ParsedWord), compareWORD);
     100                 :             : 
     101                 :             :         /*
     102                 :             :          * Initialize first word and its first position
     103                 :             :          */
     104         [ -  + ]:         108 :         tmppos = LIMITPOS(a->pos.pos);
     105                 :         108 :         a->alen = 2;
     106                 :         108 :         a->pos.apos = palloc_array(uint16, a->alen);
     107                 :         108 :         a->pos.apos[0] = 1;
     108                 :         108 :         a->pos.apos[1] = tmppos;
     109                 :             : 
     110                 :             :         /*
     111                 :             :          * Summarize position information for each word
     112                 :             :          */
     113         [ +  + ]:         697 :         while (ptr - a < l)
     114                 :             :         {
     115   [ +  +  +  + ]:         589 :                 if (!(ptr->len == res->len &&
     116                 :         338 :                           strncmp(ptr->word, res->word, res->len) == 0))
     117                 :             :                 {
     118                 :             :                         /*
     119                 :             :                          * Got a new word, so put it in result
     120                 :             :                          */
     121                 :         480 :                         res++;
     122                 :         480 :                         res->len = ptr->len;
     123                 :         480 :                         res->word = ptr->word;
     124         [ -  + ]:         480 :                         tmppos = LIMITPOS(ptr->pos.pos);
     125                 :         480 :                         res->alen = 2;
     126                 :         480 :                         res->pos.apos = palloc_array(uint16, res->alen);
     127                 :         480 :                         res->pos.apos[0] = 1;
     128                 :         480 :                         res->pos.apos[1] = tmppos;
     129                 :         480 :                 }
     130                 :             :                 else
     131                 :             :                 {
     132                 :             :                         /*
     133                 :             :                          * The word already exists, so adjust position information. But
     134                 :             :                          * before we should check size of position's array, max allowed
     135                 :             :                          * value for position and uniqueness of position
     136                 :             :                          */
     137                 :         109 :                         pfree(ptr->word);
     138   [ +  -  -  +  :         218 :                         if (res->pos.apos[0] < MAXNUMPOS - 1 && res->pos.apos[res->pos.apos[0]] != MAXENTRYPOS - 1 &&
                   +  + ]
     139         [ -  + ]:         109 :                                 res->pos.apos[res->pos.apos[0]] != LIMITPOS(ptr->pos.pos))
     140                 :             :                         {
     141         [ +  + ]:         105 :                                 if (res->pos.apos[0] + 1 >= res->alen)
     142                 :             :                                 {
     143                 :          84 :                                         res->alen *= 2;
     144                 :          84 :                                         res->pos.apos = repalloc_array(res->pos.apos, uint16, res->alen);
     145                 :          84 :                                 }
     146   [ -  +  -  +  :         105 :                                 if (res->pos.apos[0] == 0 || res->pos.apos[res->pos.apos[0]] != LIMITPOS(ptr->pos.pos))
                   +  - ]
     147                 :             :                                 {
     148         [ -  + ]:         105 :                                         res->pos.apos[res->pos.apos[0] + 1] = LIMITPOS(ptr->pos.pos);
     149                 :         105 :                                         res->pos.apos[0]++;
     150                 :         105 :                                 }
     151                 :         105 :                         }
     152                 :             :                 }
     153                 :         589 :                 ptr++;
     154                 :             :         }
     155                 :             : 
     156                 :         108 :         return res + 1 - a;
     157                 :         111 : }
     158                 :             : 
     159                 :             : /*
     160                 :             :  * make value of tsvector, given parsed text
     161                 :             :  *
     162                 :             :  * Note: frees prs->words and subsidiary data.
     163                 :             :  */
     164                 :             : TSVector
     165                 :         131 : make_tsvector(ParsedText *prs)
     166                 :             : {
     167                 :         262 :         int                     i,
     168                 :             :                                 j,
     169                 :         131 :                                 lenstr = 0,
     170                 :             :                                 totallen;
     171                 :         131 :         TSVector        in;
     172                 :         131 :         WordEntry  *ptr;
     173                 :         131 :         char       *str;
     174                 :         131 :         int                     stroff;
     175                 :             : 
     176                 :             :         /* Merge duplicate words */
     177         [ +  + ]:         131 :         if (prs->curwords > 0)
     178                 :         111 :                 prs->curwords = uniqueWORD(prs->words, prs->curwords);
     179                 :             : 
     180                 :             :         /* Determine space needed */
     181         [ +  + ]:         722 :         for (i = 0; i < prs->curwords; i++)
     182                 :             :         {
     183                 :         591 :                 lenstr += prs->words[i].len;
     184         [ +  - ]:         591 :                 if (prs->words[i].alen)
     185                 :             :                 {
     186                 :         591 :                         lenstr = SHORTALIGN(lenstr);
     187                 :         591 :                         lenstr += sizeof(uint16) + prs->words[i].pos.apos[0] * sizeof(WordEntryPos);
     188                 :         591 :                 }
     189                 :         591 :         }
     190                 :             : 
     191         [ +  - ]:         131 :         if (lenstr > MAXSTRPOS)
     192   [ #  #  #  # ]:           0 :                 ereport(ERROR,
     193                 :             :                                 (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),
     194                 :             :                                  errmsg("string is too long for tsvector (%d bytes, max %d bytes)", lenstr, MAXSTRPOS)));
     195                 :             : 
     196                 :         131 :         totallen = CALCDATASIZE(prs->curwords, lenstr);
     197                 :         131 :         in = (TSVector) palloc0(totallen);
     198                 :         131 :         SET_VARSIZE(in, totallen);
     199                 :         131 :         in->size = prs->curwords;
     200                 :             : 
     201                 :         131 :         ptr = ARRPTR(in);
     202                 :         131 :         str = STRPTR(in);
     203                 :         131 :         stroff = 0;
     204         [ +  + ]:         722 :         for (i = 0; i < prs->curwords; i++)
     205                 :             :         {
     206                 :         591 :                 ptr->len = prs->words[i].len;
     207                 :         591 :                 ptr->pos = stroff;
     208                 :         591 :                 memcpy(str + stroff, prs->words[i].word, prs->words[i].len);
     209                 :         591 :                 stroff += prs->words[i].len;
     210                 :         591 :                 pfree(prs->words[i].word);
     211         [ +  - ]:         591 :                 if (prs->words[i].alen)
     212                 :             :                 {
     213                 :         591 :                         int                     k = prs->words[i].pos.apos[0];
     214                 :         591 :                         WordEntryPos *wptr;
     215                 :             : 
     216         [ +  - ]:         591 :                         if (k > 0xFFFF)
     217   [ #  #  #  # ]:           0 :                                 elog(ERROR, "positions array too long");
     218                 :             : 
     219                 :         591 :                         ptr->haspos = 1;
     220                 :         591 :                         stroff = SHORTALIGN(stroff);
     221                 :         591 :                         *(uint16 *) (str + stroff) = (uint16) k;
     222                 :         591 :                         wptr = POSDATAPTR(in, ptr);
     223         [ +  + ]:        1287 :                         for (j = 0; j < k; j++)
     224                 :             :                         {
     225                 :         696 :                                 WEP_SETWEIGHT(wptr[j], 0);
     226                 :         696 :                                 WEP_SETPOS(wptr[j], prs->words[i].pos.apos[j + 1]);
     227                 :         696 :                         }
     228                 :         591 :                         stroff += sizeof(uint16) + k * sizeof(WordEntryPos);
     229                 :         591 :                         pfree(prs->words[i].pos.apos);
     230                 :         591 :                 }
     231                 :             :                 else
     232                 :           0 :                         ptr->haspos = 0;
     233                 :         591 :                 ptr++;
     234                 :         591 :         }
     235                 :             : 
     236         [ +  + ]:         131 :         if (prs->words)
     237                 :         117 :                 pfree(prs->words);
     238                 :             : 
     239                 :         262 :         return in;
     240                 :         131 : }
     241                 :             : 
     242                 :             : Datum
     243                 :          78 : to_tsvector_byid(PG_FUNCTION_ARGS)
     244                 :             : {
     245                 :          78 :         Oid                     cfgId = PG_GETARG_OID(0);
     246                 :          78 :         text       *in = PG_GETARG_TEXT_PP(1);
     247                 :          78 :         ParsedText      prs;
     248                 :          78 :         TSVector        out;
     249                 :             : 
     250                 :          78 :         prs.lenwords = VARSIZE_ANY_EXHDR(in) / 6;       /* just estimation of word's
     251                 :             :                                                                                                  * number */
     252         [ +  + ]:          78 :         if (prs.lenwords < 2)
     253                 :          55 :                 prs.lenwords = 2;
     254         [ +  - ]:          23 :         else if (prs.lenwords > MaxAllocSize / sizeof(ParsedWord))
     255                 :           0 :                 prs.lenwords = MaxAllocSize / sizeof(ParsedWord);
     256                 :          78 :         prs.curwords = 0;
     257                 :          78 :         prs.pos = 0;
     258                 :          78 :         prs.words = palloc_array(ParsedWord, prs.lenwords);
     259                 :             : 
     260                 :          78 :         parsetext(cfgId, &prs, VARDATA_ANY(in), VARSIZE_ANY_EXHDR(in));
     261                 :             : 
     262         [ +  - ]:          78 :         PG_FREE_IF_COPY(in, 1);
     263                 :             : 
     264                 :          78 :         out = make_tsvector(&prs);
     265                 :             : 
     266                 :         156 :         PG_RETURN_TSVECTOR(out);
     267                 :          78 : }
     268                 :             : 
     269                 :             : Datum
     270                 :           9 : to_tsvector(PG_FUNCTION_ARGS)
     271                 :             : {
     272                 :           9 :         text       *in = PG_GETARG_TEXT_PP(0);
     273                 :           9 :         Oid                     cfgId;
     274                 :             : 
     275                 :           9 :         cfgId = getTSCurrentConfig(true);
     276                 :          18 :         PG_RETURN_DATUM(DirectFunctionCall2(to_tsvector_byid,
     277                 :             :                                                                                 ObjectIdGetDatum(cfgId),
     278                 :             :                                                                                 PointerGetDatum(in)));
     279                 :           9 : }
     280                 :             : 
     281                 :             : /*
     282                 :             :  * Worker function for jsonb(_string)_to_tsvector(_byid)
     283                 :             :  */
     284                 :             : static TSVector
     285                 :          25 : jsonb_to_tsvector_worker(Oid cfgId, Jsonb *jb, uint32 flags)
     286                 :             : {
     287                 :          25 :         TSVectorBuildState state;
     288                 :          25 :         ParsedText      prs;
     289                 :             : 
     290                 :          25 :         prs.words = NULL;
     291                 :          25 :         prs.curwords = 0;
     292                 :          25 :         state.prs = &prs;
     293                 :          25 :         state.cfgId = cfgId;
     294                 :             : 
     295                 :          25 :         iterate_jsonb_values(jb, flags, &state, add_to_tsvector);
     296                 :             : 
     297                 :          50 :         return make_tsvector(&prs);
     298                 :          25 : }
     299                 :             : 
     300                 :             : Datum
     301                 :           3 : jsonb_string_to_tsvector_byid(PG_FUNCTION_ARGS)
     302                 :             : {
     303                 :           3 :         Oid                     cfgId = PG_GETARG_OID(0);
     304                 :           3 :         Jsonb      *jb = PG_GETARG_JSONB_P(1);
     305                 :           3 :         TSVector        result;
     306                 :             : 
     307                 :           3 :         result = jsonb_to_tsvector_worker(cfgId, jb, jtiString);
     308         [ +  - ]:           3 :         PG_FREE_IF_COPY(jb, 1);
     309                 :             : 
     310                 :           6 :         PG_RETURN_TSVECTOR(result);
     311                 :           3 : }
     312                 :             : 
     313                 :             : Datum
     314                 :           5 : jsonb_string_to_tsvector(PG_FUNCTION_ARGS)
     315                 :             : {
     316                 :           5 :         Jsonb      *jb = PG_GETARG_JSONB_P(0);
     317                 :           5 :         Oid                     cfgId;
     318                 :           5 :         TSVector        result;
     319                 :             : 
     320                 :           5 :         cfgId = getTSCurrentConfig(true);
     321                 :           5 :         result = jsonb_to_tsvector_worker(cfgId, jb, jtiString);
     322         [ +  - ]:           5 :         PG_FREE_IF_COPY(jb, 0);
     323                 :             : 
     324                 :          10 :         PG_RETURN_TSVECTOR(result);
     325                 :           5 : }
     326                 :             : 
     327                 :             : Datum
     328                 :          13 : jsonb_to_tsvector_byid(PG_FUNCTION_ARGS)
     329                 :             : {
     330                 :          13 :         Oid                     cfgId = PG_GETARG_OID(0);
     331                 :          13 :         Jsonb      *jb = PG_GETARG_JSONB_P(1);
     332                 :          13 :         Jsonb      *jbFlags = PG_GETARG_JSONB_P(2);
     333                 :          13 :         TSVector        result;
     334                 :          13 :         uint32          flags = parse_jsonb_index_flags(jbFlags);
     335                 :             : 
     336                 :          13 :         result = jsonb_to_tsvector_worker(cfgId, jb, flags);
     337         [ +  - ]:          13 :         PG_FREE_IF_COPY(jb, 1);
     338         [ +  - ]:          13 :         PG_FREE_IF_COPY(jbFlags, 2);
     339                 :             : 
     340                 :          26 :         PG_RETURN_TSVECTOR(result);
     341                 :          13 : }
     342                 :             : 
     343                 :             : Datum
     344                 :           4 : jsonb_to_tsvector(PG_FUNCTION_ARGS)
     345                 :             : {
     346                 :           4 :         Jsonb      *jb = PG_GETARG_JSONB_P(0);
     347                 :           4 :         Jsonb      *jbFlags = PG_GETARG_JSONB_P(1);
     348                 :           4 :         Oid                     cfgId;
     349                 :           4 :         TSVector        result;
     350                 :           4 :         uint32          flags = parse_jsonb_index_flags(jbFlags);
     351                 :             : 
     352                 :           4 :         cfgId = getTSCurrentConfig(true);
     353                 :           4 :         result = jsonb_to_tsvector_worker(cfgId, jb, flags);
     354         [ +  - ]:           4 :         PG_FREE_IF_COPY(jb, 0);
     355         [ +  - ]:           4 :         PG_FREE_IF_COPY(jbFlags, 1);
     356                 :             : 
     357                 :           8 :         PG_RETURN_TSVECTOR(result);
     358                 :           4 : }
     359                 :             : 
     360                 :             : /*
     361                 :             :  * Worker function for json(_string)_to_tsvector(_byid)
     362                 :             :  */
     363                 :             : static TSVector
     364                 :          25 : json_to_tsvector_worker(Oid cfgId, text *json, uint32 flags)
     365                 :             : {
     366                 :          25 :         TSVectorBuildState state;
     367                 :          25 :         ParsedText      prs;
     368                 :             : 
     369                 :          25 :         prs.words = NULL;
     370                 :          25 :         prs.curwords = 0;
     371                 :          25 :         state.prs = &prs;
     372                 :          25 :         state.cfgId = cfgId;
     373                 :             : 
     374                 :          25 :         iterate_json_values(json, flags, &state, add_to_tsvector);
     375                 :             : 
     376                 :          50 :         return make_tsvector(&prs);
     377                 :          25 : }
     378                 :             : 
     379                 :             : Datum
     380                 :           3 : json_string_to_tsvector_byid(PG_FUNCTION_ARGS)
     381                 :             : {
     382                 :           3 :         Oid                     cfgId = PG_GETARG_OID(0);
     383                 :           3 :         text       *json = PG_GETARG_TEXT_P(1);
     384                 :           3 :         TSVector        result;
     385                 :             : 
     386                 :           3 :         result = json_to_tsvector_worker(cfgId, json, jtiString);
     387         [ +  - ]:           3 :         PG_FREE_IF_COPY(json, 1);
     388                 :             : 
     389                 :           6 :         PG_RETURN_TSVECTOR(result);
     390                 :           3 : }
     391                 :             : 
     392                 :             : Datum
     393                 :           5 : json_string_to_tsvector(PG_FUNCTION_ARGS)
     394                 :             : {
     395                 :           5 :         text       *json = PG_GETARG_TEXT_P(0);
     396                 :           5 :         Oid                     cfgId;
     397                 :           5 :         TSVector        result;
     398                 :             : 
     399                 :           5 :         cfgId = getTSCurrentConfig(true);
     400                 :           5 :         result = json_to_tsvector_worker(cfgId, json, jtiString);
     401         [ +  - ]:           5 :         PG_FREE_IF_COPY(json, 0);
     402                 :             : 
     403                 :          10 :         PG_RETURN_TSVECTOR(result);
     404                 :           5 : }
     405                 :             : 
     406                 :             : Datum
     407                 :          13 : json_to_tsvector_byid(PG_FUNCTION_ARGS)
     408                 :             : {
     409                 :          13 :         Oid                     cfgId = PG_GETARG_OID(0);
     410                 :          13 :         text       *json = PG_GETARG_TEXT_P(1);
     411                 :          13 :         Jsonb      *jbFlags = PG_GETARG_JSONB_P(2);
     412                 :          13 :         TSVector        result;
     413                 :          13 :         uint32          flags = parse_jsonb_index_flags(jbFlags);
     414                 :             : 
     415                 :          13 :         result = json_to_tsvector_worker(cfgId, json, flags);
     416         [ +  - ]:          13 :         PG_FREE_IF_COPY(json, 1);
     417         [ +  - ]:          13 :         PG_FREE_IF_COPY(jbFlags, 2);
     418                 :             : 
     419                 :          26 :         PG_RETURN_TSVECTOR(result);
     420                 :          13 : }
     421                 :             : 
     422                 :             : Datum
     423                 :           4 : json_to_tsvector(PG_FUNCTION_ARGS)
     424                 :             : {
     425                 :           4 :         text       *json = PG_GETARG_TEXT_P(0);
     426                 :           4 :         Jsonb      *jbFlags = PG_GETARG_JSONB_P(1);
     427                 :           4 :         Oid                     cfgId;
     428                 :           4 :         TSVector        result;
     429                 :           4 :         uint32          flags = parse_jsonb_index_flags(jbFlags);
     430                 :             : 
     431                 :           4 :         cfgId = getTSCurrentConfig(true);
     432                 :           4 :         result = json_to_tsvector_worker(cfgId, json, flags);
     433         [ +  - ]:           4 :         PG_FREE_IF_COPY(json, 0);
     434         [ +  - ]:           4 :         PG_FREE_IF_COPY(jbFlags, 1);
     435                 :             : 
     436                 :           8 :         PG_RETURN_TSVECTOR(result);
     437                 :           4 : }
     438                 :             : 
     439                 :             : /*
     440                 :             :  * Parse lexemes in an element of a json(b) value, add to TSVectorBuildState.
     441                 :             :  */
     442                 :             : static void
     443                 :         124 : add_to_tsvector(void *_state, char *elem_value, int elem_len)
     444                 :             : {
     445                 :         124 :         TSVectorBuildState *state = (TSVectorBuildState *) _state;
     446                 :         124 :         ParsedText *prs = state->prs;
     447                 :         124 :         int32           prevwords;
     448                 :             : 
     449         [ +  + ]:         124 :         if (prs->words == NULL)
     450                 :             :         {
     451                 :             :                 /*
     452                 :             :                  * First time through: initialize words array to a reasonable size.
     453                 :             :                  * (parsetext() will realloc it bigger as needed.)
     454                 :             :                  */
     455                 :          36 :                 prs->lenwords = 16;
     456                 :          36 :                 prs->words = palloc_array(ParsedWord, prs->lenwords);
     457                 :          36 :                 prs->curwords = 0;
     458                 :          36 :                 prs->pos = 0;
     459                 :          36 :         }
     460                 :             : 
     461                 :         124 :         prevwords = prs->curwords;
     462                 :             : 
     463                 :         124 :         parsetext(state->cfgId, prs, elem_value, elem_len);
     464                 :             : 
     465                 :             :         /*
     466                 :             :          * If we extracted any words from this JSON element, advance pos to create
     467                 :             :          * an artificial break between elements.  This is because we don't want
     468                 :             :          * phrase searches to think that the last word in this element is adjacent
     469                 :             :          * to the first word in the next one.
     470                 :             :          */
     471         [ +  + ]:         124 :         if (prs->curwords > prevwords)
     472                 :         112 :                 prs->pos += 1;
     473                 :         124 : }
     474                 :             : 
     475                 :             : 
     476                 :             : /*
     477                 :             :  * to_tsquery
     478                 :             :  */
     479                 :             : 
     480                 :             : 
     481                 :             : /*
     482                 :             :  * This function is used for morph parsing.
     483                 :             :  *
     484                 :             :  * The value is passed to parsetext which will call the right dictionary to
     485                 :             :  * lexize the word. If it turns out to be a stopword, we push a QI_VALSTOP
     486                 :             :  * to the stack.
     487                 :             :  *
     488                 :             :  * All words belonging to the same variant are pushed as an ANDed list,
     489                 :             :  * and different variants are ORed together.
     490                 :             :  */
     491                 :             : static void
     492                 :         518 : pushval_morph(void *opaque, TSQueryParserState state, char *strval, int lenval, int16 weight, bool prefix)
     493                 :             : {
     494                 :         518 :         int32           count = 0;
     495                 :         518 :         ParsedText      prs;
     496                 :        2072 :         uint32          variant,
     497                 :         518 :                                 pos = 0,
     498                 :         518 :                                 cntvar = 0,
     499                 :         518 :                                 cntpos = 0,
     500                 :         518 :                                 cnt = 0;
     501                 :         518 :         MorphOpaque *data = opaque;
     502                 :             : 
     503                 :         518 :         prs.lenwords = 4;
     504                 :         518 :         prs.curwords = 0;
     505                 :         518 :         prs.pos = 0;
     506                 :         518 :         prs.words = palloc_array(ParsedWord, prs.lenwords);
     507                 :             : 
     508                 :         518 :         parsetext(data->cfg_id, &prs, strval, lenval);
     509                 :             : 
     510         [ +  + ]:         518 :         if (prs.curwords > 0)
     511                 :             :         {
     512         [ +  + ]:         898 :                 while (count < prs.curwords)
     513                 :             :                 {
     514                 :             :                         /*
     515                 :             :                          * Were any stop words removed? If so, fill empty positions with
     516                 :             :                          * placeholders linked by an appropriate operator.
     517                 :             :                          */
     518   [ +  +  +  + ]:         483 :                         if (pos > 0 && pos + 1 < prs.words[count].pos.pos)
     519                 :             :                         {
     520         [ +  + ]:          13 :                                 while (pos + 1 < prs.words[count].pos.pos)
     521                 :             :                                 {
     522                 :             :                                         /* put placeholders for each missing stop word */
     523                 :           8 :                                         pushStop(state);
     524         [ -  + ]:           8 :                                         if (cntpos)
     525                 :           8 :                                                 pushOperator(state, data->qoperator, 1);
     526                 :           8 :                                         cntpos++;
     527                 :           8 :                                         pos++;
     528                 :             :                                 }
     529                 :           5 :                         }
     530                 :             : 
     531                 :             :                         /* save current word's position */
     532                 :         483 :                         pos = prs.words[count].pos.pos;
     533                 :             : 
     534                 :             :                         /* Go through all variants obtained from this token */
     535                 :         483 :                         cntvar = 0;
     536   [ +  +  +  + ]:         978 :                         while (count < prs.curwords && pos == prs.words[count].pos.pos)
     537                 :             :                         {
     538                 :         495 :                                 variant = prs.words[count].nvariant;
     539                 :             : 
     540                 :             :                                 /* Push all words belonging to the same variant */
     541                 :         495 :                                 cnt = 0;
     542   [ +  +  +  + ]:        1613 :                                 while (count < prs.curwords &&
     543         [ +  + ]:         599 :                                            pos == prs.words[count].pos.pos &&
     544                 :         531 :                                            variant == prs.words[count].nvariant)
     545                 :             :                                 {
     546                 :        1037 :                                         pushValue(state,
     547                 :         519 :                                                           prs.words[count].word,
     548                 :         519 :                                                           prs.words[count].len,
     549                 :         519 :                                                           weight,
     550         [ +  + ]:         519 :                                                           ((prs.words[count].flags & TSL_PREFIX) || prefix));
     551                 :         519 :                                         pfree(prs.words[count].word);
     552         [ +  + ]:         519 :                                         if (cnt)
     553                 :          24 :                                                 pushOperator(state, OP_AND, 0);
     554                 :         519 :                                         cnt++;
     555                 :         519 :                                         count++;
     556                 :             :                                 }
     557                 :             : 
     558         [ +  + ]:         495 :                                 if (cntvar)
     559                 :          12 :                                         pushOperator(state, OP_OR, 0);
     560                 :         495 :                                 cntvar++;
     561                 :             :                         }
     562                 :             : 
     563         [ +  + ]:         483 :                         if (cntpos)
     564                 :             :                         {
     565                 :             :                                 /* distance may be useful */
     566                 :          68 :                                 pushOperator(state, data->qoperator, 1);
     567                 :          68 :                         }
     568                 :             : 
     569                 :         483 :                         cntpos++;
     570                 :             :                 }
     571                 :             : 
     572                 :         415 :                 pfree(prs.words);
     573                 :         415 :         }
     574                 :             :         else
     575                 :         103 :                 pushStop(state);
     576                 :         518 : }
     577                 :             : 
     578                 :             : Datum
     579                 :         125 : to_tsquery_byid(PG_FUNCTION_ARGS)
     580                 :             : {
     581                 :         125 :         text       *in = PG_GETARG_TEXT_PP(1);
     582                 :         125 :         TSQuery         query;
     583                 :         125 :         MorphOpaque data;
     584                 :             : 
     585                 :         125 :         data.cfg_id = PG_GETARG_OID(0);
     586                 :             : 
     587                 :             :         /*
     588                 :             :          * Passing OP_PHRASE as a qoperator makes tsquery require matching of word
     589                 :             :          * positions of a complex morph exactly match the tsvector.  Also, when
     590                 :             :          * the complex morphs are connected with OP_PHRASE operator, we connect
     591                 :             :          * all their words into the OP_PHRASE sequence.
     592                 :             :          */
     593                 :         125 :         data.qoperator = OP_PHRASE;
     594                 :             : 
     595                 :         125 :         query = parse_tsquery(text_to_cstring(in),
     596                 :             :                                                   pushval_morph,
     597                 :             :                                                   &data,
     598                 :             :                                                   0,
     599                 :             :                                                   NULL);
     600                 :             : 
     601                 :         250 :         PG_RETURN_TSQUERY(query);
     602                 :         125 : }
     603                 :             : 
     604                 :             : Datum
     605                 :          22 : to_tsquery(PG_FUNCTION_ARGS)
     606                 :             : {
     607                 :          22 :         text       *in = PG_GETARG_TEXT_PP(0);
     608                 :          22 :         Oid                     cfgId;
     609                 :             : 
     610                 :          22 :         cfgId = getTSCurrentConfig(true);
     611                 :          44 :         PG_RETURN_DATUM(DirectFunctionCall2(to_tsquery_byid,
     612                 :             :                                                                                 ObjectIdGetDatum(cfgId),
     613                 :             :                                                                                 PointerGetDatum(in)));
     614                 :          22 : }
     615                 :             : 
     616                 :             : Datum
     617                 :          10 : plainto_tsquery_byid(PG_FUNCTION_ARGS)
     618                 :             : {
     619                 :          10 :         text       *in = PG_GETARG_TEXT_PP(1);
     620                 :          10 :         TSQuery         query;
     621                 :          10 :         MorphOpaque data;
     622                 :             : 
     623                 :          10 :         data.cfg_id = PG_GETARG_OID(0);
     624                 :             : 
     625                 :             :         /*
     626                 :             :          * parse_tsquery() with P_TSQ_PLAIN flag takes the whole input text as a
     627                 :             :          * single morph.  Passing OP_PHRASE as a qoperator makes tsquery require
     628                 :             :          * matching of all words independently on their positions.
     629                 :             :          */
     630                 :          10 :         data.qoperator = OP_AND;
     631                 :             : 
     632                 :          10 :         query = parse_tsquery(text_to_cstring(in),
     633                 :             :                                                   pushval_morph,
     634                 :             :                                                   &data,
     635                 :             :                                                   P_TSQ_PLAIN,
     636                 :             :                                                   NULL);
     637                 :             : 
     638                 :          20 :         PG_RETURN_POINTER(query);
     639                 :          10 : }
     640                 :             : 
     641                 :             : Datum
     642                 :           2 : plainto_tsquery(PG_FUNCTION_ARGS)
     643                 :             : {
     644                 :           2 :         text       *in = PG_GETARG_TEXT_PP(0);
     645                 :           2 :         Oid                     cfgId;
     646                 :             : 
     647                 :           2 :         cfgId = getTSCurrentConfig(true);
     648                 :           4 :         PG_RETURN_DATUM(DirectFunctionCall2(plainto_tsquery_byid,
     649                 :             :                                                                                 ObjectIdGetDatum(cfgId),
     650                 :             :                                                                                 PointerGetDatum(in)));
     651                 :           2 : }
     652                 :             : 
     653                 :             : 
     654                 :             : Datum
     655                 :           8 : phraseto_tsquery_byid(PG_FUNCTION_ARGS)
     656                 :             : {
     657                 :           8 :         text       *in = PG_GETARG_TEXT_PP(1);
     658                 :           8 :         TSQuery         query;
     659                 :           8 :         MorphOpaque data;
     660                 :             : 
     661                 :           8 :         data.cfg_id = PG_GETARG_OID(0);
     662                 :             : 
     663                 :             :         /*
     664                 :             :          * parse_tsquery() with P_TSQ_PLAIN flag takes the whole input text as a
     665                 :             :          * single morph.  Passing OP_PHRASE as a qoperator makes tsquery require
     666                 :             :          * matching of word positions.
     667                 :             :          */
     668                 :           8 :         data.qoperator = OP_PHRASE;
     669                 :             : 
     670                 :           8 :         query = parse_tsquery(text_to_cstring(in),
     671                 :             :                                                   pushval_morph,
     672                 :             :                                                   &data,
     673                 :             :                                                   P_TSQ_PLAIN,
     674                 :             :                                                   NULL);
     675                 :             : 
     676                 :          16 :         PG_RETURN_TSQUERY(query);
     677                 :           8 : }
     678                 :             : 
     679                 :             : Datum
     680                 :           0 : phraseto_tsquery(PG_FUNCTION_ARGS)
     681                 :             : {
     682                 :           0 :         text       *in = PG_GETARG_TEXT_PP(0);
     683                 :           0 :         Oid                     cfgId;
     684                 :             : 
     685                 :           0 :         cfgId = getTSCurrentConfig(true);
     686                 :           0 :         PG_RETURN_DATUM(DirectFunctionCall2(phraseto_tsquery_byid,
     687                 :             :                                                                                 ObjectIdGetDatum(cfgId),
     688                 :             :                                                                                 PointerGetDatum(in)));
     689                 :           0 : }
     690                 :             : 
     691                 :             : Datum
     692                 :          69 : websearch_to_tsquery_byid(PG_FUNCTION_ARGS)
     693                 :             : {
     694                 :          69 :         text       *in = PG_GETARG_TEXT_PP(1);
     695                 :          69 :         MorphOpaque data;
     696                 :          69 :         TSQuery         query = NULL;
     697                 :             : 
     698                 :          69 :         data.cfg_id = PG_GETARG_OID(0);
     699                 :             : 
     700                 :             :         /*
     701                 :             :          * Passing OP_PHRASE as a qoperator makes tsquery require matching of word
     702                 :             :          * positions of a complex morph exactly match the tsvector.  Also, when
     703                 :             :          * the complex morphs are given in quotes, we connect all their words into
     704                 :             :          * the OP_PHRASE sequence.
     705                 :             :          */
     706                 :          69 :         data.qoperator = OP_PHRASE;
     707                 :             : 
     708                 :          69 :         query = parse_tsquery(text_to_cstring(in),
     709                 :             :                                                   pushval_morph,
     710                 :             :                                                   &data,
     711                 :             :                                                   P_TSQ_WEB,
     712                 :             :                                                   NULL);
     713                 :             : 
     714                 :         138 :         PG_RETURN_TSQUERY(query);
     715                 :          69 : }
     716                 :             : 
     717                 :             : Datum
     718                 :           4 : websearch_to_tsquery(PG_FUNCTION_ARGS)
     719                 :             : {
     720                 :           4 :         text       *in = PG_GETARG_TEXT_PP(0);
     721                 :           4 :         Oid                     cfgId;
     722                 :             : 
     723                 :           4 :         cfgId = getTSCurrentConfig(true);
     724                 :           8 :         PG_RETURN_DATUM(DirectFunctionCall2(websearch_to_tsquery_byid,
     725                 :             :                                                                                 ObjectIdGetDatum(cfgId),
     726                 :             :                                                                                 PointerGetDatum(in)));
     727                 :           4 : }
        

Generated by: LCOV version 2.3.2-1