J'ai une tâche fargate que j'ai planifiée pour s'exécuter avec les règles d'événement CloudWatch et générer un horodatage dans une base de données lors d'une exécution réussie. Il génère également un fichier journal vers CloudWatch à chaque fois qu'il s'exécute.
Cependant, il y a eu une fois où le fichier journal n'a pas été créé et la base de données n'a pas été mise à jour. Je soupçonne que la tâche n’a même jamais été lancée ou qu’elle n’a pas pu démarrer.
Dans CloudWatch, la règle d'événement affiche le déclencheur et l'appel au moment où je m'attendais à ce que la tâche s'exécute, donc je suppose que la tâche a au moins tenté de démarrer.
Ma question est la suivante: est-il possible que je puisse déboguer ou enregistrer des informations sur le cluster qui ne parvient pas à démarrer une tâche?
Veuillez me faire savoir si j'ai besoin de plus d'informations.
Edit: je dois préciser que je cherche un moyen de lire ces informations dans un fichier journal quelque part. Je sais que je peux voir la raison de l'échec de la tâche dans la console Web, mais ce n'est que pour les tâches relativement récentes.
J'ai posté la même question ici: https: //www.reddit .com / r / aws / comments / adtqvt / debugging_failed_fargate_task_initialization / et StackOverflow: https://forums.aws.amazon.com/thread.jspa?messageID=884638
3 Réponses :
Tâches
Arrêté
pour la valeur Statut de tâche souhaité
tâche
souhaitée et cliquez sur son GUID Conteneurs
et développez les conteneurs pertinents qui rencontrent des erreurs Vous verrez une sorte de raison d'état de l'erreur. Dans mon cas, c'était:
CannotStartContainerError: API error (500): failed to initialize logging driver: Cannot determine region for awslogs driver
Edit: Je ne peux pas vraiment m'attribuer le mérite d'avoir compris cela - je l'ai trouvé ici:
https://github.com/aws/amazon-ecs-agent/issues/1654 # issuecomment-437178282
Merci pour la suggestion, mais malheureusement cela se produit de manière irrégulière et je ne suis pas averti quand cela ne se produit pas , donc je n'ai jamais eu la chance de voir la tâche elle-même. Je recherche donc une sorte de métadonnées qui montreront la gestion des tâches par le cluster. Comme un fichier journal qui montre "la tâche reçue du cluster à partir de la règle d'événement", etc., pour voir où la chaîne se rompt
Je viens de faire face à ce problème et le manque de journaux l'a rendu assez difficile à résoudre.
Le problème dans mon cas était que le groupe de sécurité utilisé pour la tâche avait été supprimé. J'espère que cela aidera si quelqu'un a un problème similaire.