11
votes

Convertir le format MEDIAWIKI WIKITEXT en HTML à l'aide de la ligne de commande

J'ai tendance à écrire une bonne quantité de documentation afin que le format mediawiki me soit facile à comprendre que cela me sauve beaucoup de temps que de devoir écrire HTML traditionnel. Cependant, je écris également un blog et trouvez que la commutation du clavier à la souris est tout le temps nécessaire pour entrer les balises correctes pour HTML ajoute beaucoup de temps. J'aimerais pouvoir écrire mes articles dans la syntaxe MediaWiki, puis la convertir en HTML pour une utilisation sur mon blog.

J'ai essayé Google-ing mais j'ai besoin de meilleure nomenclature comme surprenante que je n'ai pas pu trouver quoi que ce soit.

J'utilise Linux et préférerais faire cela à partir de la ligne de commande.

Quelqu'un a des idées ou des idées?


1 commentaires

Voir aussi Lexers / analyseurs pour (ONU) Documents texte structurés pour des formats alternatifs


3 Réponses :


3
votes

Cette page répertorie des tonnes d'analyseurs MediaWiki que vous pourriez essayer.


0 commentaires

8
votes

J'ai un peu regardé dans ce sens et pense qu'un bon itinéraire à prendre ici serait d'apprendre à un langage de balise générale comme le rétablissementText ou le marquage, puis être capable de convertir de là. Découvert un programme appelé Pandoc qui peut convertir l'une des deux en HTML et MediaWiki. Appréciez l'aide.

Exemple: P>

pandoc -f mediawiki -s myfile.mediawiki  -o myfile.html -s


4 commentaires

S'il vous plaît ne faites pas. Les analyseurs alternatifs pour WikiteXT sont toujours très fragiles, car WikiteXT a (non) été conçu.


Je viens d'essayer Pandoc à la suite de cette réponse pour convertir MediaWiki en TeX et HTML et je suis très satisfait des résultats. Je ne peux pas parler de sa fragilité, mais si vous utilisez simplement les bases telles que les en-têtes, les listes, etc. il a l'air parfaitement bien. Il joue bien avec d'autres commandes UNIX puisqu'il prend en charge STDIN / STDOUT IO, ce qui est idéal pour les pipes.


Pandoc ne reconnaît pas le marquage complet du wiki. Par conséquent, il y aura beaucoup d'articles qui ne peuvent pas être correctement analysés. J'ai essayé cela moi-même.


@Waschbaer - Si vous vous en souvenez, quel type de syntaxe Mediawiki échoue-t-il? Les lecteurs envisagent de l'utiliser peuvent ne pas nécessairement avoir besoin de fonctionnalités non prises en charge principalement pour les cas d'utilisation de type Wikipedia.



14
votes

Le meilleur serait d'utiliser MEDIAWIKI PARSER. La bonne nouvelle est que MediaWiki 1.19 fournira un outil de ligne de commande juste pour cela!

Disclaimer: J'ai écrit cet outil. P>

Le script est entretien / pars.php code> EXEMPLES D'UTILISATION DROIT DU CODE SOURCE: P>

Saisie de texte vous-même, en terminant avec Control + D: P>

$ cat /tmp/foo | php maintenance/parse.php
<p><b>bold</b>
</p>$


6 commentaires

En fait, cela est assez utile et exactement ce dont j'ai besoin. Appréciez l'info Antoine.


Je reçois l'erreur "Erreur fatale PHP: appel à une fonction non définie mysql_error () dans /scluscrat4/dhruv/mediawiki-1.20.2/includes/db/databasemysql.p HP à la ligne 326" Quand j'essaie d'exécuter ce qui précède. Avez-vous une idée de la façon dont je peux le réparer?


En outre, pourquoi cet outil prend-il à -DBUSER et --Dbass?


@Dhruvbird the eval.php Script est un ancien script qui n'a pas été migré pour prendre reconnaissance --DBuser et --Dbass :( j'ai rempli Bug bugzilla.wikimedia.org/45254 pour suivre cela, bien que ce ne soit pas une grande partie d'un élément de priorité élevé =)


J'ai eu des problèmes d'autorisations avec des fichiers CDB, de sorte que le moyen paresseux de se déplacer était d'utiliser sudo . Alors ça a fonctionné.


Je souhaite que cela ne produisait pas de liens hypertexte "Modifier" qui pointe de nulle part. Je suppose que certaines manipulations de regex peuvent prendre en charge cela. Je suis heureux que cela génère une table des matières.