7
votes

LUCENE / LUCENE.NET - Document.SetBoost () Valeurs?

Je sais que cela prend un flotteur, mais quelles sont certaines valeurs typiques pour divers niveaux d'augmentation dans un résultat?

Par exemple:

Si je voulais renforcer la pondération d'un document de 10%, je devrais la définir 1.1? Pour 20%, puis 1,2?

Que se passe-t-il si je commence à définir des boosts en valeurs comme 75.0? ou 500,0?

EDIT: Formatage corrigé


0 commentaires

3 Réponses :


6
votes

S'il vous plaît voir le Documentation similaire de Lucene pour la formule. En principe, tous les autres facteurs étant égaux, fixer le coup de pouce d'un document à 1.1 lui donnera en effet un score de 10% supérieur à celui d'un document identique avec un boost de 1,0. Si vous avez un ensemble de documents qui devraient être intrinsèquement préférés dans les recherches, cela peut être une bonne idée. Notez que le document Boost est un attribut d'indexation, ce qui rend impossible de modifier le boost du document sans le réindexier. Il existe d'autres facteurs importants dans la notation - y compris les scores de correspondance, les normes, etc. Voir Débogage Questions de pertinence dans la recherche Pour plus de détails.


1 commentaires

Mais sotez que le document et le champ stimulent finissent par codé dans un seul octet, avec une mantissée 3 bits - de sorte que toute différence inférieure à 25% peut se retrouver complètement inaperçue.



2
votes

Ajout à ce que Yuval a dit. Cette valeur est la fonction de boost et de boost de documents sur le terrain. Les valeurs de boost sont codées dans un seul octet. Donc, la précision pourrait être perdue lors de la conservation de cette valeur. Débogage avec perquisteur.Explain () vous aiderait à obtenir la bonne quantité de boost.

Si vous souhaitez que la valeur de boost soit préservée (elle est utile, par exemple, lorsque vous souhaitez recréer l'index de l'indice actuel), vous pouvez l'ajouter dans un champ stocké.


0 commentaires

2
votes

La chose importante à retenir sur la stimulation est de ne pas l'approcher isolément, vous devez considérer cela dans le cadre d'une stratégie globale, apporter une liste de chaque critère utilisé pour répercuter la pertinence, puis commander ces critères. Définir une relation entre chacun de ces critères. Êtes-vous régulièrement ré-indexé ou indiquez-vous simplement d'ajouter de nouveaux documents, si vous êtes régulièrement réindexé, vous pouvez vous permettre d'accorder vos critères de stimulation de documents, sinon vous devez le penser à l'avance.


0 commentaires