Nutch est un robot Web bien mûr à la production. Nutch permet une configuration à grain fin, s'appuyant sur les structures de données Apache Hadoop ™, qui sont excellentes pour le traitement par lots.
Je recherche une solution de chenilles Web qui peut être suffisamment mature et peut être simplement étendue. Je suis intéressé par les fonctionnalités suiv ...