6
votes

Regex for Markdown Table Syntaxe?

Je développe actuellement Un petit outil qui me permet de convertir Github Wikis en pages Github. Maintenant, j'essaie d'ajouter un bon soutien aux tables de marquage (non pris en charge par l'analyseur que j'utilise).

Maintenant, je raccroche à la lexère d'un parseur puis l'étendez avec divers suppression spécifiques de GitHub Wiki (liaisons), puis transmettez les jetons modifiés à l'analyseur. Les tables doivent également correspondre à ce schéma. Mes modifications utilisent divers modèles de regex et remplacer les regibles de regex afin d'effectuer les modifications dont j'ai besoin.

Je suis un peu coincé avec la syntaxe de table compliquée, cependant. Vous pouvez trouver un exemple de ce ici et ici . Comme vous pouvez le constater, il y a une certaine structure, mais certaines parties sont entièrement facultatives.

J'en ai réfléchi et je pense que je voudrais une regex qui me produirait un groupe contenant l'en-tête (première ligne), les données d'alignement de la colonne (deuxième ligne) et le contenu réel en tant que groupes distincts. Il devrait contenir au moins une ligne de contenu afin de correspondre. Les données d'en-tête et d'alignement doivent également obéir à certaines règles comme indiqué sur les exemples.

Comment approcheriez-vous de construire une regex comme celle-ci? Mieux encore, quelqu'un peut-il me fournir un point de départ où construire? Il est possible que mon approche soit erronée (peut-être que la regex peut être évitée?). Si tel est le cas, toutes les idées menant aux mêmes résultats plus facilement sont appréciées.

github markdown regex syntax

0 commentaires

4 Réponses :

1
votes

J'ai fini par sauter à la fibex et je viens de le pirater ensemble en utilisant une logique conventionnelle. Il pourrait ne pas être aussi joli ni court comme une regex basée sur une regex mais au moins je peux le maintenir facilement.

J'ai trouvé des regexes qui auraient pu correspondre à cet objectif BTW. Voir Multimarkdown .

0 commentaires

8
votes

J'ai besoin d'une solution de regex dans le même problème. Voici ce que j'ai jusqu'ici, le mettre à jour au fur et à mesure de la mise à jour car je suis capable de l'améliorer: xxx

Visualisation d'expression régulière

Démo debuggex < / p>

Testé avec JavaScript



                                                                    
                                    
                                    
                                        3 commentaires
                                        
                                                                                            
                                                    C'est une regex effrayante. :)                                                
                                                
                                                                                            
                                                    Je vais juste laisser tomber ceci:  ((\ | [^ | \ r \ r \ n] *) + \ | (\ r? \ N | \ r)?) +  ici, comme un autre Réponse à une telle vieille question n'en vaut pas la peine. Ou, si vous vous souciez des groupes de capture:  (?: (?: \ | [^ | \ r \ n] *) + \ | (?: \ r? \ R)?) +                                                 

                                                
                                                                                            
                                                    Pourquoi ce n'est pas la réponse approuvée? C'est ce qui a fonctionné pour moi avec  javascript . Mais je viens de supprimer un personnage d'échappement inutile qui cause des erreurs d'Eslint et qui fonctionne bien.


                        
                                            
                            
                                
                                    3
 votes
                                
                            
                            
                                
                                     quelque chose que j'ai fait: 


 Regex pour l'en-tête de la table d'analyse et le délimiteur !! 


  [|]? (\ S + [A-ZA-Z0-9 -_ * # @ $%:;?!., \ / \\] + \ s +) [|]? [|] ? (\ s + [a-za-z0-9 -_ * # @ $%:;?!., \ / \\] + \ s +) [|]? [|]? (\ S + [A-ZA- Z0-9 -_ * # @ $%:;?!.., \ / \\] + \ s +) [|]? \ r? \ n? \ |: - +: \ |: - +: \ | | ?:: +: \ |?  

-MODIFICATEUR - GLOBAL 


 regex pour délimiter entre l'en-tête et le texte 


  \ |: - +: \ |?: - +: \ | ?:: +: \ |? \ r? \ N?  

- Modificateur - Global 


 regex pour analyser tous les éléments avant et après le délimiteur d'en-tête! 


  [|]? (\ S + [A-ZA-Z0-9 -_ * # @ $%:;?!., \ / \\] + \ s +) [|]? [|] ? (\ s + [a-za-z0-9 -_ * # @ $%:;?!., \ / \\] + \ s +) [|]? [|]? (\ S + [A-ZA- Z0-9 -_ * # @ $%:;?!.., \ / \\] + \ s +) [|]? \ r? \ n?     

 -Modificateurs - Global, Multiline 

 Ceci est la table, pour analyse. 

 
| Tables | Sont | Cool |
|: ---------------: | :------------: | :----: |
| Col 3 est | R-L | 1600 $ |
| Col 2 est | centré | 12 $ |
| rayures zébrées | sont soignés | 1 $ |
                                 


                                                                    
                                    
                                    
                                        1 commentaires
                                        
                                                                                            
                                                    Merci pour la regex: je l'ai utilisé dans un parseur de markdown,  Slimdown-JS , qui Convertit la table en HTML.                                                
                                                
                                                                                    
                                    
                                                            

                        

                        
                                            
                            
                                
                                    5
 votes
                                
                            
                            
                                
                                     J'ai eu le même problème et je n'ai jamais trouvé de réponse appropriée, j'ai finalement proposé ce qui suit. 
^(\|[^\n]+\|\r?\n)((?:\|:?[-]+:?)+\|)(\n(?:\|[^\n]+\|\r?\n?)*)?$

 Il ne permettra que les tables de marquage "strictes", où chaque ligne démarre et se termine par un caractère  |  code> et la ligne "Alignements cellulaires" est correctement formatée.  LI>
 Le premier groupe capture la "tête", le deuxième groupe La ligne "Alignements cellulaires" et le troisième groupe (facultatif) capture le "corps".  li>
 Il a besoin d'au moins une cellule "alignement" complétée et correctement formatée pour le considérer comme une table, mais correspondra aux tables incomplètes autrement (c'est-à-dire sans "corps").  Li>
 ul>  Testé en Java (Android) et ici:  P> 
  Regex101   p> 
 et ici:  P> 
  debuggex Démo   P> 
 J'espère que cela aide quelqu'un. :)  p>  p>

                                

                                                                    
                                    
                                    
                                        0 commentaires


            
                
		    
                    Articles qui pourrait vous intéresser :
                                            
                            Actions Github - Aucun fichier ou répertoire de ce type à aucune étape d'exécution                        
                        
                                            
                            Erreur "ssh_exchange_identification: read: Connection reset by peer" lors de la tentative de connexion au référentiel distant sur git                        
                        
                                            
                            Android Studio, problème de connexion à Github, informations d'identification incorrectes                        
                        
                                            
                            Comment ignorer la tâche Actions GitHub lors d'un événement push?