12
votes

Quel est l'avantage du RDF et du triple stockage à Neo4J?

Neo4J est une base de données graphique vraiment rapide et évolutive, il semble qu'il puisse être utilisé sur des projets d'entreprise et c'est gratuitement!

En même temps, il n'y a pas de magasins triple RDF qui fonctionnent bien avec de grandes données ou livrent un accès à grande vitesse. Et qu'est-ce que c'est plus, les triples magasins libres RDF fonctionnent encore pire.

Alors, quel est l'avantage des triples triples RDF et RDF à Neo4J?


2 commentaires

"Vraiment rapide", pouvez-vous quantifier cela? Par exemple, la vitesse de chargement ... Combien de vertex | Les bords par seconde sont «vraiment rapides»? "Base de données graphique échelle", pouvez-vous quantifier cela? Par exemple, combien de vertex | bords sur un serveur avec X Go de RAM?


@castagna: insertion ou récupération? Avec des liaisons pythoniques, il n'est que deux fois plus lent lorsqu'il est utilisé sur l'insertion de triplet par rapport à une pile optimisée SQLACHEMY / SQLITE. Pour la traversée, si je me souviens bien, c'était bien supérieur à 1 m de bord / seconde sur ma machine personnelle (6 Go de RAM), mais je pense que cela peut aller au-delà. Pour les requêtes pures sur la relation (sommet-sommets, relations, etc ...), le serveur NO4J sur ma machine se porte bien sur 1k Transaction / s, même si la base de données se rapproche des propriétés indexées de 1 m avec 100SK de nœuds et à proximité d'un Des relations


4 Réponses :


-2
votes

J'ai entendu des rumeurs qu'il faut une journée entière pour charger 10 m triples dans Neo4j (c'est le plus lent, car il n'est pas construit principalement pour RDF).

sésame et 4SORE sont les plus rapides mais Jena a une API puissante.


2 commentaires

Où avez-vous entendu ces rumeurs?


S'il vous plaît fournit des références



19
votes

L'avantage de l'utilisation d'un magasin triple pour RDF plutôt que NEO4J est que c'est ce qu'ils sont conçu pour. Neo4j est plutôt bon pour de nombreux cas d'utilisation, mais dans mon expérience, ses performances pour le chargement et la requête de RDF sont bien inférieures à toutes les bases de données RDF dédiées.

C'est une erreur que les bases de données RDF ne font pas échouement ou ne sont pas rapides. Bien sûr, ils ne sont pas encore à la hauteur des niveaux de performance et d'échelle que les bases de données relationnelles ont, mais elles ont un début de 50 ans. De nombreux triple magasins échouent dans les milliards de triples, fournissent des fonctionnalités d'entreprise «standard» et offrent de grandes performances pour de nombreux cas d'utilisation.

Si vous allez utiliser RDF pour un projet, utilisez un magasin triple magasin; Il va fournir les meilleures performances et l'ensemble de fonctionnalités / API pour travailler avec RDF pour créer votre application.


1 commentaires

Neo4j prend en charge Sparql et Gremlin: blog.neo4j.org/2010/02/top-10-ways-a-get-a-now-neo4j.html Langues de requête Au-delà de l'utilisation de NEO4J Programmatiquement, vous pouvez également émettre des requêtes à l'aide d'une langue de requête. Ce sont les options prises en charge pour le moment: SPARQL: NeO4J peut être utilisé comme triple ou quadstore et dispose d'implémentations de voile et de Sparql. Accédez au site Composants pour en savoir plus sur les composants associés. Gremlin: une langue de programmation basée sur des graphiques avec des implémentations de backend différentes dans les travaux ainsi qu'un outil de support.



11
votes

RDF et SPARQL sont des normes. Vous avez donc le choix entre plusieurs implémentations et peut migrer vos données d'un magasin RDF vers une autre.

En outre, la version 1.1 de la langue de requête SPARQL est assez sophistiquée (plus expressive que la plupart des implémentations SQL) et peut effectuer toutes sortes de requêtes qui nécessiteraient beaucoup de code à écrire à Neo4J.


0 commentaires

2
votes

Si vous allez pour le graphique minier (par exemple, le trershasel graphique) sur Triple, Neo4J est un bon choix. Pour les grands triples, vous voudrez peut-être utiliser son batchinserter qui est assez rapide.


0 commentaires