LCOV - code coverage report
Current view: top level - backends/honey - honey_spelling.cc (source / functions) Hit Total Coverage
Test: Test Coverage for xapian-core 7822d31adece Lines: 0 232 0.0 %
Date: 2019-05-23 11:15:29 Functions: 0 18 0.0 %
Branches: 0 374 0.0 %

           Branch data     Line data    Source code
       1                 :            : /** @file honey_spelling.cc
       2                 :            :  * @brief Spelling correction data for a honey database.
       3                 :            :  */
       4                 :            : /* Copyright (C) 2004,2005,2006,2007,2008,2009,2010,2011,2015,2017,2018 Olly Betts
       5                 :            :  *
       6                 :            :  * This program is free software; you can redistribute it and/or modify
       7                 :            :  * it under the terms of the GNU General Public License as published by
       8                 :            :  * the Free Software Foundation; either version 2 of the License, or
       9                 :            :  * (at your option) any later version.
      10                 :            :  *
      11                 :            :  * This program is distributed in the hope that it will be useful,
      12                 :            :  * but WITHOUT ANY WARRANTY; without even the implied warranty of
      13                 :            :  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
      14                 :            :  * GNU General Public License for more details.
      15                 :            :  *
      16                 :            :  * You should have received a copy of the GNU General Public License
      17                 :            :  * along with this program; if not, write to the Free Software
      18                 :            :  * Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301 USA
      19                 :            :  */
      20                 :            : 
      21                 :            : #include <config.h>
      22                 :            : 
      23                 :            : #include <xapian/error.h>
      24                 :            : #include <xapian/types.h>
      25                 :            : 
      26                 :            : #include "expand/expandweight.h"
      27                 :            : #include "honey_spelling.h"
      28                 :            : #include "omassert.h"
      29                 :            : #include "expand/ortermlist.h"
      30                 :            : #include "pack.h"
      31                 :            : 
      32                 :            : #include "../prefix_compressed_strings.h"
      33                 :            : 
      34                 :            : #include <algorithm>
      35                 :            : #include <map>
      36                 :            : #include <queue>
      37                 :            : #include <vector>
      38                 :            : #include <set>
      39                 :            : #include <string>
      40                 :            : 
      41                 :            : using namespace Honey;
      42                 :            : using namespace std;
      43                 :            : 
      44                 :            : void
      45                 :          0 : HoneySpellingTable::merge_changes()
      46                 :            : {
      47 [ #  # ][ #  # ]:          0 :     for (auto i : termlist_deltas) {
      48 [ #  # ][ #  # ]:          0 :         const string& key = i.first;
      49                 :          0 :         const set<string>& changes = i.second;
      50                 :            : 
      51                 :          0 :         auto d = changes.begin();
      52         [ #  # ]:          0 :         if (d == changes.end()) continue;
      53                 :            : 
      54 [ #  # ][ #  # ]:          0 :         string updated;
      55         [ #  # ]:          0 :         string current;
      56         [ #  # ]:          0 :         PrefixCompressedStringWriter out(updated);
      57 [ #  # ][ #  # ]:          0 :         if (get_exact_entry(key, current)) {
      58         [ #  # ]:          0 :             PrefixCompressedStringItor in(current, key);
      59         [ #  # ]:          0 :             updated.reserve(current.size()); // FIXME plus some?
      60 [ #  # ][ #  # ]:          0 :             while (!in.at_end() && d != changes.end()) {
         [ #  # ][ #  # ]
      61                 :          0 :                 const string & word = *in;
      62                 :            :                 Assert(d != changes.end());
      63         [ #  # ]:          0 :                 int cmp = word.compare(*d);
      64         [ #  # ]:          0 :                 if (cmp < 0) {
      65         [ #  # ]:          0 :                     out.append(word);
      66         [ #  # ]:          0 :                     ++in;
      67         [ #  # ]:          0 :                 } else if (cmp > 0) {
      68         [ #  # ]:          0 :                     out.append(*d);
      69                 :          0 :                     ++d;
      70                 :            :                 } else {
      71                 :            :                     // If an existing entry is in the changes list, that means
      72                 :            :                     // we should remove it.
      73         [ #  # ]:          0 :                     ++in;
      74                 :          0 :                     ++d;
      75                 :            :                 }
      76                 :            :             }
      77         [ #  # ]:          0 :             if (!in.at_end()) {
      78                 :            :                 // FIXME : easy to optimise this to a fix-up and substring copy.
      79         [ #  # ]:          0 :                 while (!in.at_end()) {
      80 [ #  # ][ #  # ]:          0 :                     out.append(*in++);
      81                 :            :                 }
      82                 :          0 :             }
      83                 :            :         }
      84         [ #  # ]:          0 :         while (d != changes.end()) {
      85         [ #  # ]:          0 :             out.append(*d++);
      86                 :            :         }
      87         [ #  # ]:          0 :         if (!updated.empty()) {
      88         [ #  # ]:          0 :             add(key, updated);
      89                 :            :         } else {
      90                 :          0 :             del(key);
      91                 :            :         }
      92                 :          0 :     }
      93                 :          0 :     termlist_deltas.clear();
      94                 :            : 
      95                 :          0 :     map<string, Xapian::termcount>::const_iterator j;
      96         [ #  # ]:          0 :     for (j = wordfreq_changes.begin(); j != wordfreq_changes.end(); ++j) {
      97         [ #  # ]:          0 :         const string& key = make_spelling_wordlist_key(j->first);
      98                 :          0 :         Xapian::termcount wordfreq = j->second;
      99         [ #  # ]:          0 :         if (wordfreq) {
     100         [ #  # ]:          0 :             string tag;
     101         [ #  # ]:          0 :             pack_uint_last(tag, wordfreq);
     102         [ #  # ]:          0 :             add(key, tag);
     103         [ #  # ]:          0 :             if (wordfreq > wordfreq_upper_bound)
     104                 :          0 :                 wordfreq_upper_bound = wordfreq;
     105                 :            :         } else {
     106                 :          0 :             del(key);
     107                 :            :         }
     108                 :          0 :     }
     109                 :          0 :     wordfreq_changes.clear();
     110                 :          0 : }
     111                 :            : 
     112                 :            : void
     113                 :          0 : HoneySpellingTable::toggle_fragment(fragment frag, const string & word)
     114                 :            : {
     115         [ #  # ]:          0 :     auto i = termlist_deltas.find(frag);
     116         [ #  # ]:          0 :     if (i == termlist_deltas.end()) {
     117 [ #  # ][ #  # ]:          0 :         i = termlist_deltas.insert(make_pair(frag, set<string>())).first;
     118                 :            :     }
     119                 :            :     // The commonest case is that we're adding lots of words, so try insert
     120                 :            :     // first and if that reports that the word already exists, remove it.
     121         [ #  # ]:          0 :     auto res = i->second.insert(word);
     122         [ #  # ]:          0 :     if (!res.second) {
     123                 :            :         // word is already in the set, so remove it.
     124         [ #  # ]:          0 :         i->second.erase(res.first);
     125                 :            :     }
     126                 :          0 : }
     127                 :            : 
     128                 :            : void
     129                 :          0 : HoneySpellingTable::add_word(const string & word, Xapian::termcount freqinc)
     130                 :            : {
     131         [ #  # ]:          0 :     if (word.size() <= 1) return;
     132                 :            : 
     133         [ #  # ]:          0 :     map<string, Xapian::termcount>::iterator i = wordfreq_changes.find(word);
     134         [ #  # ]:          0 :     if (i != wordfreq_changes.end()) {
     135                 :            :         // Word "word" already exists and has been modified.
     136         [ #  # ]:          0 :         if (i->second) {
     137                 :          0 :             i->second += freqinc;
     138                 :          0 :             return;
     139                 :            :         }
     140                 :            :         // If "word" is currently modified such that it no longer exists, so
     141                 :            :         // we need to execute the code below to re-add trigrams for it.
     142                 :          0 :         i->second = freqinc;
     143                 :            :     } else {
     144         [ #  # ]:          0 :         string data;
     145 [ #  # ][ #  # ]:          0 :         if (get_exact_entry(make_spelling_wordlist_key(word), data)) {
                 [ #  # ]
     146                 :            :             // Word "word" already exists, so increment its count.
     147                 :            :             Xapian::termcount freq;
     148                 :          0 :             const char * p = data.data();
     149 [ #  # ][ #  # ]:          0 :             if (!unpack_uint_last(&p, p + data.size(), &freq) || freq == 0) {
                 [ #  # ]
     150 [ #  # ][ #  # ]:          0 :                 throw Xapian::DatabaseCorruptError("Bad spelling word freq");
                 [ #  # ]
     151                 :            :             }
     152         [ #  # ]:          0 :             wordfreq_changes[word] = freq + freqinc;
     153                 :          0 :             return;
     154                 :            :         }
     155 [ #  # ][ #  # ]:          0 :         wordfreq_changes[word] = freqinc;
     156                 :            :     }
     157                 :            : 
     158                 :            :     // Add trigrams for word.
     159         [ #  # ]:          0 :     toggle_word(word);
     160                 :            : }
     161                 :            : 
     162                 :            : Xapian::termcount
     163                 :          0 : HoneySpellingTable::remove_word(const string & word, Xapian::termcount freqdec)
     164                 :            : {
     165         [ #  # ]:          0 :     if (word.size() <= 1) return freqdec;
     166                 :            : 
     167         [ #  # ]:          0 :     map<string, Xapian::termcount>::iterator i = wordfreq_changes.find(word);
     168         [ #  # ]:          0 :     if (i != wordfreq_changes.end()) {
     169         [ #  # ]:          0 :         if (i->second == 0) {
     170                 :            :             // Word has already been deleted.
     171                 :          0 :             return freqdec;
     172                 :            :         }
     173                 :            :         // Word "word" exists and has been modified.
     174         [ #  # ]:          0 :         if (freqdec < i->second) {
     175                 :          0 :             i->second -= freqdec;
     176                 :          0 :             return 0;
     177                 :            :         }
     178                 :          0 :         freqdec -= i->second;
     179                 :            : 
     180                 :            :         // Mark word as deleted.
     181                 :          0 :         i->second = 0;
     182                 :            :     } else {
     183         [ #  # ]:          0 :         string data;
     184 [ #  # ][ #  # ]:          0 :         if (!get_exact_entry(make_spelling_wordlist_key(word), data)) {
                 [ #  # ]
     185                 :            :             // This word doesn't exist.
     186                 :          0 :             return freqdec;
     187                 :            :         }
     188                 :            : 
     189                 :            :         Xapian::termcount freq;
     190                 :          0 :         const char *p = data.data();
     191         [ #  # ]:          0 :         if (!unpack_uint_last(&p, p + data.size(), &freq)) {
     192 [ #  # ][ #  # ]:          0 :             throw Xapian::DatabaseCorruptError("Bad spelling word freq");
                 [ #  # ]
     193                 :            :         }
     194         [ #  # ]:          0 :         if (freqdec < freq) {
     195         [ #  # ]:          0 :             wordfreq_changes[word] = freq - freqdec;
     196                 :          0 :             return 0;
     197                 :            :         }
     198                 :          0 :         freqdec -= freq;
     199                 :            : 
     200                 :            :         // Mark word as deleted.
     201 [ #  # ][ #  # ]:          0 :         wordfreq_changes[word] = 0;
     202                 :            :     }
     203                 :            : 
     204                 :            :     // Remove trigrams for word.
     205         [ #  # ]:          0 :     toggle_word(word);
     206                 :            : 
     207                 :          0 :     return freqdec;
     208                 :            : }
     209                 :            : 
     210                 :            : void
     211                 :          0 : HoneySpellingTable::toggle_word(const string & word)
     212                 :            : {
     213                 :          0 :     fragment buf(0);
     214                 :            : 
     215         [ #  # ]:          0 :     if (word.size() <= 4) {
     216                 :            :         // We also generate 'bookends' for two, three, and four character
     217                 :            :         // terms so we can handle transposition of the middle two characters
     218                 :            :         // of a four character word, substitution or deletion of the middle
     219                 :            :         // character of a three character word, or insertion in the middle of a
     220                 :            :         // two character word.
     221                 :            :         // 'Bookends':
     222                 :          0 :         buf[0] = KEY_PREFIX_BOOKEND;
     223                 :          0 :         buf[1] = word[0];
     224                 :          0 :         buf[2] = word[word.size() - 1];
     225         [ #  # ]:          0 :         toggle_fragment(buf, word);
     226                 :            :     }
     227                 :            : 
     228                 :            :     // Head:
     229                 :          0 :     buf[0] = KEY_PREFIX_HEAD;
     230                 :          0 :     buf[1] = word[0];
     231                 :          0 :     buf[2] = word[1];
     232         [ #  # ]:          0 :     toggle_fragment(buf, word);
     233                 :            : 
     234                 :            :     // Tail:
     235                 :          0 :     buf[0] = KEY_PREFIX_TAIL;
     236                 :          0 :     buf[1] = word[word.size() - 2];
     237                 :          0 :     buf[2] = word[word.size() - 1];
     238         [ #  # ]:          0 :     toggle_fragment(buf, word);
     239                 :            : 
     240         [ #  # ]:          0 :     if (word.size() > 2) {
     241         [ #  # ]:          0 :         set<fragment> done;
     242                 :            :         // Middles:
     243                 :          0 :         buf[0] = KEY_PREFIX_MIDDLE;
     244         [ #  # ]:          0 :         for (size_t start = 0; start <= word.size() - 3; ++start) {
     245                 :          0 :             memcpy(buf.data + 1, word.data() + start, 3);
     246                 :            :             // Don't toggle the same fragment twice or it will cancel out.
     247                 :            :             // Bug fixed in 1.2.6.
     248 [ #  # ][ #  # ]:          0 :             if (done.insert(buf).second)
     249         [ #  # ]:          0 :                 toggle_fragment(buf, word);
     250                 :          0 :         }
     251                 :            :     }
     252                 :          0 : }
     253                 :            : 
     254                 :            : struct TermListGreaterApproxSize {
     255                 :          0 :     bool operator()(const TermList *a, const TermList *b) const {
     256                 :          0 :         return a->get_approx_size() > b->get_approx_size();
     257                 :            :     }
     258                 :            : };
     259                 :            : 
     260                 :            : TermList *
     261                 :          0 : HoneySpellingTable::open_termlist(const string & word)
     262                 :            : {
     263                 :            :     // This should have been handled by Database::get_spelling_suggestion().
     264                 :            :     AssertRel(word.size(),>,1);
     265                 :            : 
     266                 :            :     // Merge any pending changes to disk, but don't call commit() so they
     267                 :            :     // won't be switched live.
     268 [ #  # ][ #  # ]:          0 :     if (!wordfreq_changes.empty()) merge_changes();
     269                 :            : 
     270                 :            :     // Build a priority queue of TermList objects which returns those of
     271                 :            :     // greatest approximate size first.
     272         [ #  # ]:          0 :     priority_queue<TermList*, vector<TermList*>, TermListGreaterApproxSize> pq;
     273                 :            :     try {
     274         [ #  # ]:          0 :         string data;
     275                 :          0 :         fragment buf(0);
     276                 :            : 
     277         [ #  # ]:          0 :         if (word.size() <= 4) {
     278                 :            :             // We also generate 'bookends' for two, three, and four character
     279                 :            :             // terms so we can handle transposition of the middle two
     280                 :            :             // characters of a four character word, substitution or deletion of
     281                 :            :             // the middle character of a three character word, or insertion in
     282                 :            :             // the middle of a two character word.
     283                 :          0 :             buf[0] = KEY_PREFIX_BOOKEND;
     284                 :          0 :             buf[1] = word[0];
     285                 :          0 :             buf[2] = word[word.size() - 1];
     286 [ #  # ][ #  # ]:          0 :             if (get_exact_entry(string(buf), data))
                 [ #  # ]
     287 [ #  # ][ #  # ]:          0 :                 pq.push(new HoneySpellingTermList(data, buf.data));
                 [ #  # ]
     288                 :            :         }
     289                 :            : 
     290                 :            :         // Head:
     291                 :          0 :         buf[0] = KEY_PREFIX_HEAD;
     292                 :          0 :         buf[1] = word[0];
     293                 :          0 :         buf[2] = word[1];
     294 [ #  # ][ #  # ]:          0 :         if (get_exact_entry(string(buf), data))
                 [ #  # ]
     295 [ #  # ][ #  # ]:          0 :             pq.push(new HoneySpellingTermList(data, buf.data));
                 [ #  # ]
     296                 :            : 
     297         [ #  # ]:          0 :         if (word.size() == 2) {
     298                 :            :             // For two letter words, we generate H and T terms for the
     299                 :            :             // transposed form so that we can produce good spelling
     300                 :            :             // suggestions.
     301                 :            :             // AB -> BA
     302                 :          0 :             buf[1] = word[1];
     303                 :          0 :             buf[2] = word[0];
     304 [ #  # ][ #  # ]:          0 :             if (get_exact_entry(string(buf), data))
                 [ #  # ]
     305 [ #  # ][ #  # ]:          0 :                 pq.push(new HoneySpellingTermList(data, buf.data));
                 [ #  # ]
     306                 :          0 :             buf[0] = KEY_PREFIX_TAIL;
     307 [ #  # ][ #  # ]:          0 :             if (get_exact_entry(string(buf), data))
                 [ #  # ]
     308 [ #  # ][ #  # ]:          0 :                 pq.push(new HoneySpellingTermList(data, buf.data));
                 [ #  # ]
     309                 :            :         }
     310                 :            : 
     311                 :            :         // Tail:
     312                 :          0 :         buf[0] = KEY_PREFIX_TAIL;
     313                 :          0 :         buf[1] = word[word.size() - 2];
     314                 :          0 :         buf[2] = word[word.size() - 1];
     315 [ #  # ][ #  # ]:          0 :         if (get_exact_entry(string(buf), data))
                 [ #  # ]
     316 [ #  # ][ #  # ]:          0 :             pq.push(new HoneySpellingTermList(data, buf.data));
                 [ #  # ]
     317                 :            : 
     318         [ #  # ]:          0 :         if (word.size() > 2) {
     319                 :            :             // Middles:
     320                 :          0 :             buf[0] = KEY_PREFIX_MIDDLE;
     321         [ #  # ]:          0 :             for (size_t start = 0; start <= word.size() - 3; ++start) {
     322                 :          0 :                 memcpy(buf.data + 1, word.data() + start, 3);
     323 [ #  # ][ #  # ]:          0 :                 if (get_exact_entry(string(buf), data))
                 [ #  # ]
     324 [ #  # ][ #  # ]:          0 :                     pq.push(new HoneySpellingTermList(data));
                 [ #  # ]
     325                 :            :             }
     326                 :            : 
     327         [ #  # ]:          0 :             if (word.size() == 3) {
     328                 :            :                 // For three letter words, we generate the two "single
     329                 :            :                 // transposition" forms too, so that we can produce good
     330                 :            :                 // spelling suggestions.
     331                 :            :                 // ABC -> BAC
     332                 :          0 :                 buf[1] = word[1];
     333                 :          0 :                 buf[2] = word[0];
     334 [ #  # ][ #  # ]:          0 :                 if (get_exact_entry(string(buf), data))
                 [ #  # ]
     335 [ #  # ][ #  # ]:          0 :                     pq.push(new HoneySpellingTermList(data));
                 [ #  # ]
     336                 :            :                 // ABC -> ACB
     337                 :          0 :                 buf[1] = word[0];
     338                 :          0 :                 buf[2] = word[2];
     339                 :          0 :                 buf[3] = word[1];
     340 [ #  # ][ #  # ]:          0 :                 if (get_exact_entry(string(buf), data))
                 [ #  # ]
     341 [ #  # ][ #  # ]:          0 :                     pq.push(new HoneySpellingTermList(data));
                 [ #  # ]
     342                 :            :             }
     343                 :            :         }
     344                 :            : 
     345         [ #  # ]:          0 :         if (pq.empty()) return NULL;
     346                 :            : 
     347                 :            :         // Build up an OrTermList tree by combine leaves and/or branches in
     348                 :            :         // pairs.  The tree is balanced by the approximated sizes of the leaf
     349                 :            :         // HoneySpellingTermList objects - the way the tree is built are very
     350                 :            :         // similar to how an optimal Huffman code is often constructed.
     351                 :            :         //
     352                 :            :         // Balancing the tree like this should tend to minimise the amount of
     353                 :            :         // work done.
     354         [ #  # ]:          0 :         while (pq.size() > 1) {
     355                 :            :             // Build the tree such that left is always >= right so that
     356                 :            :             // OrTermList can rely on this when trying to minimise work.
     357                 :          0 :             TermList * termlist = pq.top();
     358         [ #  # ]:          0 :             pq.pop();
     359                 :            : 
     360 [ #  # ][ #  # ]:          0 :             termlist = new OrTermList(pq.top(), termlist);
     361         [ #  # ]:          0 :             pq.pop();
     362         [ #  # ]:          0 :             pq.push(termlist);
     363                 :            :         }
     364                 :            : 
     365                 :          0 :         return pq.top();
     366                 :          0 :     } catch (...) {
     367                 :            :         // Make sure we delete all the TermList objects to avoid leaking
     368                 :            :         // memory.
     369         [ #  # ]:          0 :         while (!pq.empty()) {
     370         [ #  # ]:          0 :             delete pq.top();
     371         [ #  # ]:          0 :             pq.pop();
     372                 :            :         }
     373                 :          0 :         throw;
     374                 :          0 :     }
     375                 :            : }
     376                 :            : 
     377                 :            : Xapian::doccount
     378                 :          0 : HoneySpellingTable::get_word_frequency(const string & word) const
     379                 :            : {
     380                 :          0 :     map<string, Xapian::termcount>::const_iterator i;
     381         [ #  # ]:          0 :     i = wordfreq_changes.find(word);
     382         [ #  # ]:          0 :     if (i != wordfreq_changes.end()) {
     383                 :            :         // Modified frequency for word:
     384                 :          0 :         return i->second;
     385                 :            :     }
     386                 :            : 
     387         [ #  # ]:          0 :     string data;
     388 [ #  # ][ #  # ]:          0 :     if (get_exact_entry(make_spelling_wordlist_key(word), data)) {
                 [ #  # ]
     389                 :            :         // Word "word" already exists.
     390                 :            :         Xapian::termcount freq;
     391                 :          0 :         const char *p = data.data();
     392         [ #  # ]:          0 :         if (!unpack_uint_last(&p, p + data.size(), &freq)) {
     393 [ #  # ][ #  # ]:          0 :             throw Xapian::DatabaseCorruptError("Bad spelling word freq");
                 [ #  # ]
     394                 :            :         }
     395                 :          0 :         return freq;
     396                 :            :     }
     397                 :            : 
     398                 :          0 :     return 0;
     399                 :            : }
     400                 :            : 
     401                 :            : ///////////////////////////////////////////////////////////////////////////
     402                 :            : 
     403                 :            : Xapian::termcount
     404                 :          0 : HoneySpellingTermList::get_approx_size() const
     405                 :            : {
     406                 :            :     // This is only used to decide how to build a OR-tree of TermList objects
     407                 :            :     // so we just need to return "sizes" which are ordered roughly correctly.
     408                 :          0 :     return data.size();
     409                 :            : }
     410                 :            : 
     411                 :            : std::string
     412                 :          0 : HoneySpellingTermList::get_termname() const
     413                 :            : {
     414                 :          0 :     return current_term;
     415                 :            : }
     416                 :            : 
     417                 :            : Xapian::termcount
     418                 :          0 : HoneySpellingTermList::get_wdf() const
     419                 :            : {
     420                 :          0 :     return 1;
     421                 :            : }
     422                 :            : 
     423                 :            : Xapian::doccount
     424                 :          0 : HoneySpellingTermList::get_termfreq() const
     425                 :            : {
     426                 :          0 :     return 1;
     427                 :            : }
     428                 :            : 
     429                 :            : Xapian::termcount
     430                 :          0 : HoneySpellingTermList::get_collection_freq() const
     431                 :            : {
     432                 :          0 :     return 1;
     433                 :            : }
     434                 :            : 
     435                 :            : TermList *
     436                 :          0 : HoneySpellingTermList::next()
     437                 :            : {
     438         [ #  # ]:          0 :     if (p == data.size()) {
     439                 :          0 :         p = 0;
     440                 :          0 :         data.resize(0);
     441                 :          0 :         return NULL;
     442                 :            :     }
     443                 :            : 
     444                 :          0 :     size_t keep = 0;
     445         [ #  # ]:          0 :     if (rare(tail < 0)) {
     446                 :          0 :         tail += 2;
     447                 :          0 :         keep = current_term.size() - tail;
     448         [ #  # ]:          0 :     } else if (usual(!current_term.empty())) {
     449                 :          0 :         keep = data[p++] ^ MAGIC_XOR_VALUE;
     450                 :            :     }
     451                 :            :     size_t add;
     452   [ #  #  #  # ]:          0 :     if (p == data.size() ||
                 [ #  # ]
     453                 :          0 :         (add = data[p] ^ MAGIC_XOR_VALUE) >= data.size() - p) {
     454 [ #  # ][ #  # ]:          0 :         throw Xapian::DatabaseCorruptError("Bad spelling data (too little left)");
                 [ #  # ]
     455                 :            :     }
     456                 :          0 :     current_term.replace(keep, current_term.size() - tail - keep,
     457                 :          0 :                          reinterpret_cast<const char *>(&data[p + 1]), add);
     458                 :          0 :     p += add + 1;
     459                 :            : 
     460                 :          0 :     return NULL;
     461                 :            : }
     462                 :            : 
     463                 :            : TermList *
     464                 :          0 : HoneySpellingTermList::skip_to(const string & term)
     465                 :            : {
     466 [ #  # ][ #  # ]:          0 :     while (!data.empty() && current_term < term) {
                 [ #  # ]
     467                 :          0 :         (void)HoneySpellingTermList::next();
     468                 :            :     }
     469                 :          0 :     return NULL;
     470                 :            : }
     471                 :            : 
     472                 :            : bool
     473                 :          0 : HoneySpellingTermList::at_end() const
     474                 :            : {
     475                 :          0 :     return data.empty();
     476                 :            : }
     477                 :            : 
     478                 :            : Xapian::termcount
     479                 :          0 : HoneySpellingTermList::positionlist_count() const
     480                 :            : {
     481                 :            :     throw
     482                 :            :         Xapian::UnimplementedError("HoneySpellingTermList::"
     483                 :            :                                    "positionlist_count() "
     484 [ #  # ][ #  # ]:          0 :                                    "not implemented");
                 [ #  # ]
     485                 :            : }
     486                 :            : 
     487                 :            : PositionList*
     488                 :          0 : HoneySpellingTermList::positionlist_begin() const
     489                 :            : {
     490                 :            :     throw
     491                 :            :         Xapian::UnimplementedError("HoneySpellingTermList::"
     492                 :            :                                    "positionlist_begin() "
     493 [ #  # ][ #  # ]:          0 :                                    "not implemented");
                 [ #  # ]
     494                 :            : }

Generated by: LCOV version 1.11