-2
votes

Comparaison entre les grandes données et les lacs de données, la différence et les similitudes

Quelqu'un peut-il me dire les similitudes et les différences entre les grandes données et les lacs de données.

Vous ne pouvez pas trouver une réponse satisfaisante n'importe où.


1 commentaires

Les questions sur Stackoverflow doivent être très spécifiques. Des questions larges comme celle-ci seront généralement évitées et fermées.


3 Réponses :


-1
votes

Je pense que nous ne pouvons pas comparer et différencier la terminologie, car Data Lake est synonyme des grandes données. Data Lake = Enterprise Data + Données non structurées + données semi-structure.

Autre main Son référentiel de données Vous pouvez stocker tout type de données et utilisée à des fins d'analyse. La plupart des données seront stockées dans le système de fichiers Hadoop (HDFS), où sous «Big Data», il existe un stockage et une autre technologie de traitement impliquée.


1 commentaires

@Shambhu_nath: Puisses-tu élaborer à quel point "Data Lake" et "Big Data" sont-ils synonymes?



0
votes

Big Data et Data Lake sont deux choses différentes. Data Lake est un concept où vous avez toutes vos données stockées et facilement accessibles en utilisant un mécanisme différent. Data Lake peut être maintenu sur S3 ou Redshift ou toute autre plate-forme de stockage. Les grandes données sont un terme utilisé pour traiter un volume important de données. La plupart du temps, il est arbitré avec de grandes solutions de données comme Hadoop, Spark.


0 commentaires

2
votes

Big Data est un terme utilisé de manière très différente, on pourrait l'appeler même un mot à la mode. Souvent, il est utilisé comme terme collectif pour les technologies numériques, numérisation , Industrie 4.0 et de nombreux sujets liés à la transformation numérique.

Dans l'interprétation moins générale, les grandes données se réfèrent simplement à un ensemble de données complexe et grand. Le terme "gros" puis fait référence aux trois dimensions (voir Wikipedia sur Big Data )

  1. volume , c'est-à-dire la taille de l'ensemble de données
  2. vélocité à laquelle les volumes de données sont générés
  3. variété de types de données et de sources

    A Data Lake fait référence à une approche Comment stocker les grandes données . D'autres possibilités de stockage de données sont une base de données traditionnelle appelée également Système de gestion de la base de données relationnelle (RDBM) d'une part et un Warehouse de données de l'autre côté, voir par exemple Data Lake vs. Warehouse de données vs . Base de données: Quelle est la différence?


0 commentaires