1
votes

Filtrage des écarts dans les mesures en double

J'ai un ensemble de données avec le problème suivant. Parfois, un capteur de température renverrait des lectures en double exactement à la même minute, où parfois 1 sur 2 des doublons est «raisonnable» et l'autre est légèrement éteint. Par exemple:

    TEMP   TIME
1   24.5   4/1/18 2:00
2   24.7   4/1/18 2:00 
3   24.6   4/1/18 2:05
4   28.3   4/1/18 2:05
5   24.3   4/1/18 2:10
6   24.5   4/1/18 2:10
7   26.5   4/1/18 2:15
8   24.4   4/1/18 2:15
9   24.7   4/1/18 2:20
10  22.0   4/1/18 2:20

Les lignes 5, 7 et 10 sont des lectures qui doivent être supprimées car elles sont trop élevées ou trop basses (cela n'a pas de sens que dans les 5 minutes, elles augmentent et diminuent davantage qu'un diplôme dans un environnement relativement stable).

L'objectif à la fin de cet ensemble de données est de «faire la moyenne» des valeurs similaires (comme dans les lignes 1 et 2) et de supprimer simplement les lignes trop extrêmes (comme les lignes 5 et 7) l'ensemble de données entièrement.

Actuellement, mon idée de formuler ceci est de regarder une ligne précédemment obtenue, et si l'un des 2 doublons est de +/- 0,5 degré, de marquer dans une 3e colonne avec TRUE afin que je puisse tout filtrer les valeurs TRUE à la fin. Je ne suis pas sûr de savoir comment communiquer dans l'instruction if que je recherche un + OU - 0,5 d'un numéro précédent. Quelqu'un le sait-il?


1 commentaires

Valeur absolue de la différence supérieure à la limite. ABS (A - B)> limite


3 Réponses :


0
votes

Voici un exemple de feuille Google qui fait ce que vous voulez: https://docs.heogleets.com/spreads 1Va9RjSeulOfVTd-0b4EM4azbUkYUb22jXNc_EcafUO8 / edit? Usp = partage

Ce que j'ai fait:

  • Calculez une colonne d'une moyenne en cours d'exécution à trois éléments des données en utilisant "= MOYENNE (B3: B1)"
  • Filtrer la liste en utilisant "= IF (ABS (B2-C2) <1, B2,)"
  • Calculer la moyenne de la liste filtrée

L'utilisation de la valeur absolue est ce qui fournit "+ OU -" que vous recherchiez. Cela signifie que si la distance entre deux nombres est trop grande, n'incluez pas le terme.


0 commentaires

0
votes

Alors, une solution simple m'est venue à l'esprit. Suivez les étapes ci-dessous:

  1. Convertir les données en tableau
  2. Ajouter une quatrième colonne à la fin
  3. Saisissez la formule "Valeur actuelle - Valeur précédente"
  4. Filtrer la colonne avec des valeurs de différence élevées
  5. Supprimez ces lignes de données filtrées et vous vous retrouverez avec les valeurs normales Voici la réf. Image Supprimer les valeurs élevées

0 commentaires

0
votes

Ou si vous ne souhaitez considérer que le même décalage horaire, procédez comme suit:

  1. Convertissez vos données en tableau
  2. Ajouter une quatrième colonne à la fin du tableau
  3. Écriture de la formule suivante dans la 4e colonne IF (Current_Time = Previous_Time, Current_Temp-Previous_Temp, "")
  4. Filtrer et supprimer les données avec une différence élevée Voir l'image suivante:

 Exemple 2


0 commentaires