11
votes

Structure de base de données optimale - Table 'plus large »avec champs vides ou plus grand nombre de tables?

J'ai besoin d'adapter des données supplémentaires dans une base de données et j'ai le choix entre modifier une table existante (table_existing) ou créer de nouvelles tables.

Voici comment Table_Existing ressemble maintenant à: P>

table_existing would be converted into table_WW_1_data
---------------
| ID | Field1 |
| .. | ...... |
| .. | ...... |
---------------

table_XX_1_data
------------------------
| ID | Field1 | Field2 |
| .. | ...... | ...... |
| .. | ...... | ...... |
------------------------

table_YY_2_data
---------------------------------
| ID | Field1 | Field2 | Field3 |
| .. | ...... | ...... | ...... |
| .. | ...... | ...... | ...... |
---------------------------------

optimization database database-design database-optimization

1 commentaires

SQL Server 2016 prend en charge JSON. Depuis que vous n'avez que récupérer ce qui est stocké, vous pouvez stocker les données dans une seule colonne JSON. C'est une option uniquement pour les versions 2016 et au-dessus.

5 Réponses :

0
votes

Les questions sont-elles plus susceptibles de combiner des rangées FRO (XX, 1) Set avec (YY, 2) Set, etc.?

Si ce n'est pas le cas, le fractionnement dans des tables séparées est plus rapide, car les tables individuelles utilisées pour toutes les requêtes sont plus étroites.

Si vous les combinez, ils pourraient être légèrement plus lents car vous auriez besoin de syndicats qui nécessiteront des requêtes en double contre la table principale.

2 commentaires

Salut @dvk - Pourriez-vous m'aider à comprendre où se diviser dans plus de tables ne paient pas? À l'heure actuelle, nous examinons 4-5 tables supplémentaires, mais votre déclaration serait-elle toujours valable si nous divisions en 400? (Voir Edition1 d'abord s'il vous plaît)

Avec la grande table aplatie, pourquoi les syndicats sont-ils nécessaires et si oui, pourquoi contiendraient-ils des hauts?

0
votes

Je serais d'accord avec DVK que si vous optez pour (b), vous finirez par avoir à interroger sur plusieurs tables pour obtenir toutes vos valeurs de champ d'origine1, sans parler de la complexité des joints, etc. Ce ne serait pas un sens à moins que la scission dans Les tables séparées correspondent également à la séparation en différentes entités.

Je suis d'accord avec Paul dans cette question, votre question ne peut pas vraiment être répondu sans connaître les détails des entités impliquées et les délais de requêtes et de mises à jour que vous allez courir.

0 commentaires

0
votes

Je me souviens d'avoir ces doutes auparavant.

à partir d'une perspective de validation des données, l'option b) s'avère être plus favorable. Vous pouvez mieux placer des contraintes sur les champs. C'est précisément pourquoi vous voudriez scinder, disons, un utilisateurs dans étudiants , enseignants , etc., etc., pour appliquer les contraintes non nulles en fonction de le rôle de l'utilisateur.

Généralement, avoir beaucoup de valeurs nulles dans votre table est mauvaise pour la performance en raison de problèmes d'indexation.

En règle générale, tant que le nombre de tables impliquées dans vos jointures est de 4 ou moins, vous n'avez pas à vous soucier d'une performance touchée.

edit: Si vous êtes inquiet du nombre de tables de votre base de données, je vous suggère de regarder ici .



                                                                    
                                    
                                    
                                        2 commentaires
                                        
                                                                                            
                                                    Salut @rabidfire - pas ici, mais ailleurs, nous avons parfois 4 jointures ou plus sur des tables! Pourriez-vous me signaler à une ressource qui explique cette règle de base plus en détail?                                                
                                                
                                                                                            
                                                    La limite maximale du nombre de tables dans une jointure est de 61:  FROMDULY.COM/MYSQL-LIMITATIONS# LIMITS_JOINS41  Cela dit, vous pouvez aller en toute sécurité jusqu'à 10 tables aussi longtemps que vous indexez intelligemment vos colonnes. Il n'y a pas de ressource «Performance-VS-Tables» si c'est ce que vous recherchez.


                        
                                            
                            
                                
                                    18
 votes
                                
                            
                            
                                
                                      Quelle est la structure de base de données plus optimale du point de vue de la vitesse?  

 Eh bien, ce qui est correct, les meilleures pratiques, etc, est appelé Normalization. Si vous le faites correctement, il n'y aura pas de colonnes (non champs), pas de valeurs nulles. Les colonnes en option seront dans une table séparée, avec moins de lignes. Bien sûr, vous pouvez organiser les tables afin qu'ils sont des ensembles de colonnes en option, plutôt que (un PK plus) une colonne chacun. 

 Combiner les rangées des sous-tables dans une 5NF rangée est facile, faire vue de ia (mais ne met pas à jour via le point de vue, faire directement à chaque sous-tableau, par l'intermédiaire d'une transaction stockée proc) 

 Plus, les petites tables, sont la nature d'une base de données relationnelle Normalisé. Habituez-vous à lui. Moins, les grandes tables sont plus lentes, en raison du manque de normalisation, les doublons et les valeurs nulles. Rejoindre est lourd dans SQL 

 Ce qui se trouve être la meilleure performance re, pas de surprise. Pour deux raisons: 


  Les tables sont plus étroites, donc il y a plus de lignes par page, vous obtenez plus de lignes par E / S physiques, et plus de lignes dans le même espace de cache.  
  Puisque vous n'avez pas les valeurs nulles, ces colonnes sont fixes len, pas de déballage pour extraire le contenu de la colonne.  


 Il n'y a pas de pros pour de grandes tables avec de nombreuses colonnes en option (null), contre seulement. Il n'y a jamais un pro pour violation des normes. 

 La réponse ne change pas, peu importe si vous envisagez 4 ou 400 nouvelles tables. 


 Une recommandation si vous envisagez sérieusement que beaucoup de tables: vous vous dirigez dans le sens de la sixième normale forme, sans le savoir. Donc en rendre compte, et le faire officiellement. Les 400 tables seront beaucoup mieux contrôlés. Si vous obtenez un professionnel pour le faire, ils normaliseront que, et finissent par revenir à moins de 100. 
                                


                                                                    
                                    
                                    
                                        2 commentaires
                                        
                                                                                            
                                                    "Il n'y a pas de pros pour de grandes tables avec de nombreuses colonnes optionnelles (NULL), uniquement des inconvénients. Il n'y a jamais de professionnel pour les normes de violation." Cela me frappe comme une déclaration trop forte une déclaration donnée à toutes les preuves du monde réel au contraire.                                                
                                                
                                                                                            
                                                    Pendant que je suis d'accord avec la plupart des arguments, cela semble un peu du manuel. Si vous avez un coup d'œil à  La dénormalisation  Vous verrez la réalité est différente.                                                
                                                
                                                                                    
                                    
                                                            

                        

                        
                                            
                            
                                
                                    2
 votes
                                
                            
                            
                                
                                     Je suis un dba SQL Server afin que je suggère de savoir ce que je ferais dans SQL Server 2008. 

 Ajoutez les colonnes à la table existante comme nullable marquant les colonnes comme clairsemées. L'utilisation de l'étiquette de rareté n'augmentera pas le stockage des colonnes supplémentaires dans les pages de table existantes et vous permettra toujours d'interroger les colonnes clairsemées en tant que colonnes. SQL Server stocke des colonnes clairsemées en interne au format XML qui peut également être interrogée ou affichée. 

 S'il y a des applications héritées qui ne peuvent pas gérer la nouvelle structure de la table 


 renommer la table 
 Créez une vue avec la structure de la table d'origine et nommez-le le nom de la table d'origine 


 Si vous avez une version qui ne prend pas en charge les colonnes clairsemées, construisez une seule table enfant pour votre table existante reliant l'enfant au parent avec l'ID de la table des parents. Créez une vue sur les deux tables pour présenter les données.                                 

                                                                    
                                    
                                    
                                        0 commentaires


            
                
		    
                    Articles qui pourrait vous intéresser :
                                            
                            Le moyen le plus rapide de trouver et de remplacer une ligne spécifique dans un gros fichier texte avec Python                        
                        
                                            
                            sans boucles à somme Plage de nombres impairs                        
                        
                                            
                            Étant donné un ensemble de points ou de vecteurs, trouvez l'ensemble de N points les plus proches les uns des autres                        
                        
                                            
                            Méthode plus rapide pour extraire et combiner des bits de UINT16 à UINT8