7
votes

Google Api | URL au titre du site

Par exemple pour obtenir le favicon d'un site que je peux utiliser http://www.google.com/s2/favicions?Domaine= et remplissez le domaine. Google renvoie le favicon. Je voudrais aussi tirer le titre.

Je sais que je pourrais analyser le titre du HTML sur le côté serveur ... ou Je pourrais utiliser JavaScript Document.title du côté du client. Mais je ne veux pas avoir à télécharger tout le site.

J'ai utilisé l'exemple de Favicon B.C. Ce fut un bon exemple de la manière dont vous avez des données sur un site disponible sur le Web sans avoir à faire n'importe quel "levage intensif"

Il doit y avoir une similaire pour le titre. Essentiellement, je veux faire correspondre une URL au titre.


2 commentaires

N'oubliez pas que vous pouvez attraper le Favicon vous-même en accédant directement à l'adresse www.whatevertheurlis.com/favicon.ico. Je pense que l'outil Google Favicon était plus important pour la conversion. Il génère un PNG qui peut être utilisé dans les balises IMG.


Ouais, mais il y a beaucoup plus lourd de soulevé dans la conversion d'une image que dans l'analyse de texte, non? Je doute donc qu'il y avait toujours un besoin urgent de créer un service similaire disponible pour les balises HTML. Quoi qu'il en soit, si vous voulez que vous puissiez écrire du code qui attrape simplement un document HTML sans essayer de saisir le contenu des références. C'est vraiment assez simple et vous ne seriez pas attrapé "tout le site", juste le texte de la page.


4 Réponses :


0
votes

3 commentaires

Désolé, tu as raison. Mais je ne pense pas qu'il y ait un autre moyen, car le titre n'est pas envoyé avec l'en-tête. Mais peut-être consulter Google.com/...


Vous pouvez simplement obtenir l'en-tête avec PHP.net/Manual/ffuncunction .GET-Headers.php Mais le titre ne fait pas partie de l'en-tête. Certaines personnes ont discuté dans get_meta_tags () Comment obtenir le titre et ne pouvait que le résoudre en téléchargeant tout le site.


OverV vous a donné un lien vers Google API, c'est au moment de la seule solution sans télécharger tout le site. Ce serait votre élément correct: éléments []. Titre Le titre du résultat de la recherche, en texte brut.



2
votes

Vous pouvez utiliser l'API de recherche sur mesure Google pour obtenir le titre d'un site Web. Il suffit de chercher "info: Siteurl" et saisissez le titre de la première demande. Je ne sais pas exactement ce que vous voulez faire, mais cela permet à 100 demandes par jour.

Voir les détails de l'API ici: http://code.google.com/apis/customeschecch/v1/reference.html


2 commentaires

Vous avez juste besoin de l'URL et des paramètres. Assurez-vous d'obtenir une clé API et vous êtes défini.


Le lien que @overv posté est devenu développeurs.google.com/custom- Recherche / JSON-API / V1 / Vue d'ensemble



1
votes

Ce message a une très belle pièce de code qui récupère l'URL, la description et les mots-clés ...

Obtenir des tags de titre et méta du site Web externe < / p>

Vous devez télécharger la source des pages entière, mais sa seule page et l'utilisation de la classe PHP Domdocument est très efficace.

Vous n'avez pas à charger la page entière pour obtenir un Favicon car c'est un fichier séparé, mais les titres sont stockés à l'intérieur de la source de la page.


1 commentaires

Eh bien, s'il y avait un service, ils devront toujours télécharger la page entière, il n'y en a aucun moyen. Et ce serait fortement mis en cache. Son facile à faire pourrait aussi bien le faire vous-même avec un cache que vous pouvez contrôler.



0
votes

avec la recherche Google API
  1. Créer une clé API ici: https://developers.google.com.com / Custom-Search / V1 / Aperçu # API_KEY
  2. Créez un "moteur de recherche programmable" à partir d'ici: https://programmablearchEngine.google.com/ Vous pouvez le limiter à un domaine spécifique dans ces paramètres si vous le souhaitez.
  3. Exécutez un Demande avec cette URL: https://www.googleapis.com/customesearch/v1?key=$ {SearchAPIKEY} & CX = $ {Searchid} & q = $ {URL}
    • SearchAPIKEY provient de l'étape 1
    • SearchID provient de l'étape 2
    • URL est le texte de recherche, la mise en place d'une URL mettra généralement ce résultat d'abord dans les résultats. Cependant, les liens plus récents ou cachés ne seront pas apparus dans ces résultats.

      Dans la réponse JSON, vous pouvez obtenir le titre du premier résultat avec les éléments [0] .title

      Exemple de récupération JavaScript avec async / attendre < / h3> xxx


0 commentaires