6
votes

Comment déboguer l'initialisation de la tâche Fargate a échoué

J'ai une tâche fargate que j'ai planifiée pour s'exécuter avec les règles d'événement CloudWatch et générer un horodatage dans une base de données lors d'une exécution réussie. Il génère également un fichier journal vers CloudWatch à chaque fois qu'il s'exécute.

Cependant, il y a eu une fois où le fichier journal n'a pas été créé et la base de données n'a pas été mise à jour. Je soupçonne que la tâche n’a même jamais été lancée ou qu’elle n’a pas pu démarrer.

Dans CloudWatch, la règle d'événement affiche le déclencheur et l'appel au moment où je m'attendais à ce que la tâche s'exécute, donc je suppose que la tâche a au moins tenté de démarrer.

Ma question est la suivante: est-il possible que je puisse déboguer ou enregistrer des informations sur le cluster qui ne parvient pas à démarrer une tâche?

Veuillez me faire savoir si j'ai besoin de plus d'informations.

Edit: je dois préciser que je cherche un moyen de lire ces informations dans un fichier journal quelque part. Je sais que je peux voir la raison de l'échec de la tâche dans la console Web, mais ce n'est que pour les tâches relativement récentes.

J'ai posté la même question ici: https: //www.reddit .com / r / aws / comments / adtqvt / debugging_failed_fargate_task_initialization / et StackOverflow: https://forums.aws.amazon.com/thread.jspa?messageID=884638󗾞


0 commentaires

3 Réponses :


6
votes

Essayez d'aller dans "CloudWatch -> Journaux -> Insights" et cliquez sur "Exécuter la requête":

 entrez la description de l'image ici


0 commentaires

7
votes
  1. Accédez au cluster et choisissez l'onglet Tâches
  2. Dans le volet inférieur, choisissez Arrêté pour la valeur Statut de tâche souhaité
  3. Recherchez la tâche souhaitée et cliquez sur son GUID
  4. Faites défiler jusqu'à la section Conteneurs et développez les conteneurs pertinents qui rencontrent des erreurs
  5. Vous verrez une sorte de raison d'état de l'erreur. Dans mon cas, c'était:

    CannotStartContainerError: API error (500): failed to initialize logging driver: Cannot determine region for awslogs driver
    

    Edit: Je ne peux pas vraiment m'attribuer le mérite d'avoir compris cela - je l'ai trouvé ici:

    https://github.com/aws/amazon-ecs-agent/issues/1654 # issuecomment-437178282


1 commentaires

Merci pour la suggestion, mais malheureusement cela se produit de manière irrégulière et je ne suis pas averti quand cela ne se produit pas , donc je n'ai jamais eu la chance de voir la tâche elle-même. Je recherche donc une sorte de métadonnées qui montreront la gestion des tâches par le cluster. Comme un fichier journal qui montre "la tâche reçue du cluster à partir de la règle d'événement", etc., pour voir où la chaîne se rompt



0
votes

Je viens de faire face à ce problème et le manque de journaux l'a rendu assez difficile à résoudre.

Le problème dans mon cas était que le groupe de sécurité utilisé pour la tâche avait été supprimé. J'espère que cela aidera si quelqu'un a un problème similaire.


0 commentaires