est-il possible de toucher des directives sur Google dans une mesure quels ignorera une partie d'une page, mais toujours indexer le reste? P>
Il y a quelques problèmes différents que nous avons rencontrés qui seraient aidés par cela, tels que: p>
Je suis conscient que les deux ci-dessus peuvent être abordés via d'autres techniques (telles que l'écriture du contenu avec JavaScript), mais je me demandais si quelqu'un sait s'il y a une option plus propre déjà disponible chez Google? P>
Je fais de creuser sur ceci et je suis tombé sur des mentions de Est-ce que quelqu'un sait s'il y a un ensemble similaire de balises auxquelles GoogleBot adhérera? P>
Googleon code> et
googleoff code> tags , mais ceux-ci semblent être exclusifs aux appareils de recherche Google. p>
8 Réponses :
En bref non - sauf si vous utilisez Capeaking avec est découragé par Google. P>
Il y a des méta-tags pour les robots et il y a aussi les robots.txt, avec lesquels vous pouvez restreindre l'accès à certains répertoires. P>
Meta-Tags et Robots.txt Autoriser ou restreindre l'accès sur un niveau de fichier, je suis curieux si vous pouvez autoriser une page indexée, mais bloque une certaine partie de celui-ci.
Tous les moteurs de recherche indifférent ou ignorent toute la page. Le seul moyen possible de mettre en œuvre ce que vous voulez est de: P>
(a) avoir deux versions différentes de la même page p>
(b) détecter le navigateur utilisé p>
(c) Si c'est un moteur de recherche, servez la deuxième version de votre page. P>
Ce lien pourrait s'avérer utile. P>
En effet ( Google.com/support/webmasters/bin/ ... ): "Serviant différents résultats basés sur l'agent utilisateur peut amener votre site perçu comme trompeur et retiré de l'index Google."
à votre serveur détecte le bot de recherche par IP à l'aide de PHP ou ASP. Nourrissez ensuite les adresses IP qui tombent dans cette liste une version de la page que vous souhaitez être indexée. Dans cette version conviviale pour moteur de recherche de votre page, utilisez la balise Canonical Link pour spécifier au moteur de recherche La version de la page que vous ne souhaitez pas être indexée. P>
De cette façon, la page avec le contenu qui veut être l'index sera indexée par adresse uniquement lorsque le seul contenu que vous souhaitez être indexé sera indexé. Cette méthode ne vous sera pas bloquée par les moteurs de recherche et est complètement sûr. P>
Comme indiqué dans un commentaire séparé, cela peut entraîner la suppression de votre site de Google.
Ce que vous demandez, vous ne pouvez pas vraiment être fait, Google prend une page entière ou rien de tout. P>
Vous pouvez faire des astuces sournoises, cependant, comme insérer la partie de la page que vous ne voulez pas indexée dans un iframe et utilisez robots.txt pour demander à Google de ne pas indexer que iframe. P>
Veuillez consulter la documentation officielle d'ici
http : //code.google.com/apis/searchAppliance/documentation/46/admin_crawl/preparing.html p>
aller à la section "Excluant le texte indésirable de l'index" p>
<!--googleoff: index--> here will be skipped <!--googleon: index-->
Malheureusement, cela ne s'applique qu'à l'appliance de recherche Google, non pas au site Web de Google public.
Oui, vous pouvez arrêter Google à partir de l'indexation des parties de votre site Web en créant des robots personnalisés.txt et écrivez quelles portions vous ne souhaitez pas indexer comme WPADMINS ou un poste ou une page particulière afin que vous puissiez le faire facilement en créant Ce fichier robots.txt. Avant de créer vérifier votre site robots.txt par exemple www.yoursite.com/robots.txt. p>
trouvé ressource utile pour utiliser certains contenus en double et ne pas autoriser l'index par moteur de recherche pour un tel contenu.
<p>This is normal (X)HTML content that will be indexed by Google.</p> <!--googleoff: index--> <p>This (X)HTML content will NOT be indexed by Google.</p> <!--googleon: index>