-2
votes

Analyse, formatage et génération de données basées sur l'entrée

Pour certaines entrées connues, j'ai des sorties / résultats connus. Basé sur cela, je souhaite que le programme génère des résultats en fonction de l'entrée selon les données de résultats d'entrée pré-remplies.

Exemple d'entrée:

Profitez de votre thé le matin puis avez du pain au déjeuner. Profitez du goût d'un poulet à l'ail au dîner.
Votre journée commence avec du café froid. Dans le midi, avoir du riz et du curry de poisson.

Exemple de sortie:

avoir du thé le matin. Avoir du pain au déjeuner. Avoir du poulet à l'ail au dîner.
Avoir du café froid. Avoir du riz et du curry de poisson.

Je ne veux pas utiliser String remplacer ou regexp car il se cassera souvent. Comment ou où puis-je commencer?


2 commentaires

PHP n'est pas la meilleure langue pour faire l'apprentissage de la machine. Il y a PHP-ML , mais je vais regarder de se connecter à AWS ou à GCP à faire Ce type de traitement si vous ne voulez pas utiliser de fonctions PHP. Je sais AWS a un SDK pour php , mais je Je ne l'ai pas personnellement utilisé.


C'est certainement un sujet intéressant, mais comme formulé ici, il est trop ouvert pour bien s'adapter au format Strict Q & A de ce site. Veuillez noter que demander des recommandations de bibliothèques ou de ressources tierces est considérée comme "hors sujet" sur ce site, comme expliqué dans le centre d'aide .


3 Réponses :


-1
votes

Si votre entrée est vraiment connue, vous pouvez utiliser str_replace () par exemple xxx

méfiez-vous de la sensibilité des cas et des espaces tels que des espaces, des périodes et autres ponctutures.

Si votre entrée est moins connue, vous pouvez utiliser RegEx comme sumi vous surminisez.


0 commentaires

2
votes

Si vous avez un grand nombre de paires d'entrée et de sortie, vous pouvez traiter cela comme un séquence à la séquence tâche. L'entrée peut être considérée comme votre source et votre sortie peut être considérée comme une cible. Vous pouvez facilement développer un modèle de base utilisant Opennmt .


0 commentaires

1
votes

Pas vraiment clair sur votre façon de vous approcher de votre problème spécifique, mais laissez-moi parler de quelques façons de résoudre les problèmes liés au texte, car il semble être ce que vous êtes intéressé.

Niveau 0 Disposition de texte statique H1>

Si, et c'est un grand si, votre entrée est statique, vous pouvez avoir des digestions en cas de saisie des sorties. Mais, comme vous l'avez mentionné, cela est facilement cassable. Même un espace supplémentaire entraînerait une inadéquation et c'est pourquoi c'est le niveau 0. p>

Niveau 1 Pré-processus Votre entrée: H1>

Supprimez tous les espaces supplémentaires avant, après et entre les mots supplémentaires . P>

Retirez les mots butées de votre entrée: p>

Liste des mots d'arrêt communs https://www.textfixer.com/tatudials/commmon-english-Words.txt p>

Cette étape transformerait votre entrée sur: P > xxx pré>

Ensuite, vous pouvez supprimer la conjugaison verbale, qui ne s'applique pas à votre exemple, mais supposons que vous aviez des phrases comme: p> xxx pré> Cette phrase est devenue: p>

want piz
piz za
want za


0 commentaires