9
votes

Utilisez des données Freebase sur le serveur local?

Y a-t-il des moyens existants d'utiliser les DU DUMPS DE FREEBASE DATA pour créer une base de données similaire à ce que FreeBase offre, mais sur votre propre serveur? À peu près freebase mais localement et pas à travers l'API?

Je suppose qu'il serait possible de créer, mais y a-t-il des solutions existantes pour cela déjà? Ou toute solution alternative pour des données similaires sans utiliser d'API? Je n'ai pas trouvé cela pour DBPEDIA: |


1 commentaires

Avez-vous réussi à le faire? Quelle solution avez-vous utilisée? Quelles ressources informatiques (RAM, disque, CPU ...) avez-vous besoin?


5 Réponses :


1
votes

Si vous pouvez exporter la base de données pour indiquer, onglet Des valeurs délimitées ou séparées par des virgules dans des fichiers TXT ou de base de données tels que MDB, XLS ou tout autre format de données hautement transportable, vous n'auriez aucun problème à construire votre propre base de données MySQL sur votre ordinateur utilisant ces données. La principale chose est de vous assurer que vous pouvez exporter des données à partir desquelles vous pouvez reconstruire votre propre base de données.


0 commentaires

3
votes

Importation des données dans un magasin triple de votre choix ne serait pas difficile - mais vous aurez de grandes difficultés à obtenir des réponses dans un délai raisonnable, à moins que vous fassiez quelque chose de trivial.

Quelqu'un a importé l'ensemble de l'ensemble de données dans MySQL il y a quelques années - il a fallu 2 semaines pour charger et même des requêtes simples comme "le nombre de choses tapé en tant que personne" prenant> 1 minute pour donner une réponse. C'était sur le gros matériel et l'ensemble de données est beaucoup plus grand maintenant que ce qu'il était alors.


1 commentaires

Il faut comprendre comment les données de FreeBase sont aménagées, puis l'optimisent avant de tenter de charger dans MySQL. Une solution est décrite ici - Stackoverflow.com/a/12428232/756579 (charge toutes les fractions de FreeBase et de réponse est des fractions de une seconde).



3
votes

Regardez le Projet FreeBase-quad-RDFize sur Google Code. Il devrait vous permettre de télécharger l'hebdomadaire Rel="nofewe"> Freebase Quad Dump et le charger dans le magasin Triple RDF de votre choix.


0 commentaires


3
votes

Je suis le créateur de : basekb , la première conversion utilisable de FreeBase en RDF.

Il existe des problèmes d'intégrité clés dans la députée FreeBase Quad, qui permettent d'obtenir des résultats complètement corrects à partir du point mort. : Basekb reconstruit la structure de clé de FreeBase afin que l'hypothèse de nom unique détient. Ceci est important, car la capacité d'écrire des requêtes SPARQL simples qui fonctionnent comme les requêtes SQL dépend de cela.

En ce moment,: basekb existe en deux éditions. Il y a une édition gratuite composée de 120 millions de faits d'environ 4 millions de sujets (ceux de Wikipedia) et il y a une édition «Pro» qui contient tout.

Quant aux problèmes de performance soulevés par Phillip Kendall, je peux dire que c'est principalement une question d'avoir assez de RAM. Avec 24 Go de RAM, je peux charger l'édition gratuite dans un magasin triple dans une heure. Certaines questions prennent plus de temps que moi, mais la performance globale de la requête est bonne.

Quiconque souhaite utiliser l'édition "Pro" va avoir besoin d'un matériel inhabituellement puissant et passera beaucoup d'efforts à faire fonctionner leur boîte à outils. Je travaille maintenant avec des partenaires pour livrer "PRO" aux utilisateurs de manière satisfaisante.


1 commentaires

Paul, pouvez-vous développer sur le matériel nécessaire pour exécuter Pro? Pouvez-vous développer sur les partenaires? basekb expanding au-delà des données FreeBase / dbpedia? Merci