7
votes

Algorithme d'apprentissage de la machine

Je cherche à rechercher un algorithme approprié à mon objectif, quelqu'un peut-il suggérer un bon algorithme d'apprentissage pour le scénario suivant:

Un utilisateur peut rechercher un mot dans un ensemble de phrases. Je retournerai ensuite les 10 phrases top 10 basées sur ce mot-clé, je souhaite que l'algorithme autorise l'entrée de l'utilisateur, c'est-à-dire qu'un utilisateur peut cliquer sur les meilleures phrases et que ces informations aideront l'algorithme de recherche à renvoyer des résultats plus appropriés dans le futur. < / p>


4 commentaires

Toute autre information sur la manière dont les recherches sont liées aux phrases.


Quelles fonctionnalités extrayez-vous ou calculez-vous à partir du texte, des requêtes et des clics de l'utilisateur?


Un bon point de départ: Apache Lucene


@Rwong, j'utilise déjà Lucene et j'utilise une fréquence de document inverse et une expansion de la requête pour classer les phrases basées sur un mot clé donné. Cela fonctionne bien. Cependant, une fois qu'ils sont classés sur la base de cette méthode, je souhaite que l'utilisateur puisse sélectionner des phrases les plus correctes pour eux. Cela permet à l'utilisateur de former la recherche et la recherche tirera ensuite de ces phrases pertinentes et d'utiliser ces connaissances à l'avenir.


3 Réponses :


0
votes

Regardez dans une sorte de technique de la factorisation matricielle, comme décomposition de valeur singulière ou factorisation de matrice non négative .


0 commentaires

1
votes

Vous trouverez peut-être ce chapitre dans le manuel QI II utile:

6.3 Listes de propriétés

Le chapitre traite de l'utilisation de filets sémantiques pour stocker et trier les données. Je recommande également les exercices à l'arrière du chapitre; Ils peuvent vous donner quelques idées, peu importe la langue que vous écrivez.


0 commentaires

2
votes

semble que vous souhaitiez utiliser les commentaires des utilisateurs pour améliorer la sorte de résultats de recherche. Si cela convient, vous devez regarder Rocchio . Vous pouvez également conserver une liste de phrases "cliquées" pour chaque mot clé. De cette façon, vous pouvez stimuler les positions "cliquées" dans le rang.


0 commentaires