Les exigences sont: p>
Démarrage des phrases doit être un mot avec sa première lettre des capitales entrée: Sortie attendue: Cependant, s'il y a une citation présente à la fin de la phrase, il devrait être inclus dans la phrase. Dans ce cas, le point peut être après la citation (ou) avant et après la citation. P>
li>
ol>
EG: P>
entrée: Sortie attendue: (comme, le, dans) code> seulement et la fin de la phrase devrait être un point.
Par exemple: p>
"C'est un nouveau livre. J'aime lire ce livre" code> p>
['C'est un nouveau livre.' , 'J'aime lire ce livre'] code> p>
li>
"C'est un nouveau livre. (Steve et Rasol 2014). J'aime lire ce livre (Rashi & Shabana 2015)." Code> P>
['C'est un nouveau livre. (Steve et Rasol 2014)', 'J'aime lire ce livre (Rashi & Shabana 2015).'] Code> P>
3 Réponses :
Étant donné que les données que vous avez répertoriées sont séparées par . code> Vous pouvez diviser les données en une matrice avec
array = data.split ('.') code> commande. De plus, pour ajouter
. Code> à la fin de chaque élément, vous pouvez itérer sur le tableau et vérifier si
. Code> existe à la fin s'il ne l'appends pas. P>
Vous pouvez utiliser cette regex: edit strud> p> Vous pouvez utiliser cette regex optimisée p> Utilisez ce site pour tester: https://regexr.com/ p> Exemple Java strong> em> p>
[a-z] code> Les phrases commencent par la lettre majuscule li>
(. | \ n) *? code> Les phrases peuvent avoir tous les caractères ou nouvelle ligne li>
\. code> Les sensibles se terminent par le point ... Li>
(?! \ () code> ... et n'ont pas de parentés "(" après li>
ul>
['This is a new book(Steve and Rasol 2014)', 'I like to read this book (Rashi & Shabana 2015).']
Votre code ne fera pas ce que l'OP demande dans la question. I.e. 'C'est un nouveau livre. (Steve et Rasol 2014)' code> serait mal divisé en deux chaînes.
Qu'est-ce que tu as essayé jusque-là?
r '\ w. + (\ w. + \ d {4}) '- Ce modèle a fonctionné pour moi.