0
votes

Charger les données S3 dans Redshift à l'aide d'un travail d'opérations par lots

Je veux charger des données stockées dans S3 Seau dans Redshift. Je sais que cela peut être fait manuellement. Mais, est-il possible d'utiliser le travail d'opération de lots S3 et de planifier cette tâche de chargement de données S3 dans Redshift, sur un intervalle régulier?

aws-lambda amazon-s3 amazon-redshift aws-batch

0 commentaires

3 Réponses :

0
votes

Le pipeline de données AWS est un service géré qui fait exactement cela. Vous pouvez configurer et planifier des travaux par lots qui importent des données de S3 à Redshift.

Voici un tutoriel: https: // docs .aws.aMazon.com / DataPipeline / Dernière / Developerguide / DP-CopyData-Redshift.HTML

1 commentaires

La colle AWS pourrait également être un candidat idéal capable de gérer les données d'approvisionnement dans S3. Il est construit pour l'ETL récurrent. Mais si vous avez déjà des données correctement formatées dans S3, la colle AWS pourrait être une overcilleuse.

1
votes

Vous pouvez invoquer une fonction Lambda à partir d'opérations de lots S3 pour charger des données dans Redshift.

vérifier invoquant AWS Lambda Fonctions dans le message ci-dessous de Jeff Barr

https://aws.amazon.com/ Blogs / AWS / New-Amazon-S3-Batch-Operations /



                                                                    
                                    
                                    
                                        0 commentaires


                        
                                            
                            
                                
                                    0
 votes
                                
                            
                            
                                
                                     Vous pouvez écrire un script python pour le faire en exécutant la commande  copier  pour charger les données de S3 à redshift. Utilisez la bibliothèque  psycopg2  dans Python pour exécuter des commandes SQL sur RedShift via Python Code.                                 


                                                                    
                                    
                                    
                                        0 commentaires


            
                
		    
                    Articles qui pourrait vous intéresser :
                                            
                            Comment importer une couche lambda Python?                        
                        
                                            
                            Hôte DynamoDB inaccessible lors de l'exécution de la simulation d'amplification                        
                        
                                            
                            AWS- Les données ne sont pas enregistrées dans DynamoDB à partir de Lambda                        
                        
                                            
                            Comment "DependsOn" une fonction Lambda à partir d'une ressource CFN?