J'ai un jeu de données avec une liste de villes et le nombre de touristes sur une semaine sur la semaine. Je veux faire une vérification d'intégrité des sortes pour voir si une ville apparaît semaine la semaine. P>
L'image montre un instantané de ce que l'on dirait le jeu de données, mais l'ensemble de données est proche de 1563 villes: P>
[ p>
Je veux vérifier si Harare apparaît systématiquement toutes les semaines et la même chose pour toutes les autres villes (1562 d'entre elles). P>
3 Réponses :
En supposant que chaque ville puisse apparaître une seule fois à une date donnée, une option consiste à utiliser une technique de division relationnelle: Cela vous donne toutes les villes qui apparaissent pour toutes les dates. P> Si une ville donnée peut apparaître plus d'une fois à une date donnée, nous pouvons modifier Sligthly modifier le avoir code> Clause: p>
having count(distinct week) = (select count(distinct week) from mytable)
Une solution potentielle pourrait être de compter le nombre de semaines pour chaque ville et de faire correspondre le nombre au numéro de la semaine en cours.
dans SQL, vous pouvez faire quelque chose comme P>
select city, count(week) over (partition by city) as appearance_num from table_name
en supposant qu'il soit stocké dans la trame de données de Panda (nommé DF):
Voulez-vous une solution Python ou une solution SQL est une option?
@Gmb je travaille sur le projet en Python, mais une option SQL peut également fonctionner.
Pas un
Question de l'apprentissage de la machine Code>, veuillez ne pas spamner non plus des tags non pertinents (supprimés)
Qu'entendez-vous par «apparaît systématiquement»? La ville apparaît-elle dans plus de la moitié des semaines? Ou plus de 30% des semaines? Ou quoi?. Par exemple, dans cet instantané, vous joignez avec 4 semaines et ces villes, quelle sera la sortie de Harare?
S'il vous plaît Utilisez du texte, non des images / liens, pour le texte - y compris les tables et les erds . Utilisez des images uniquement pour ce qui ne peut pas être exprimé en tant que texte ou pour augmenter le texte. S'il vous plaît dans les questions de code donnez un exemple de reproductible minimal - Coupe et code de coller et d'exécution, y compris l'exemple de l'exemple représentatif code; sortie souhaitée et réelle (y compris les messages d'erreur Verbatim); Tags et versions; Spécification claire et explication. Pour SQL qui inclut le DBMS & DDL (y compris les contraintes et les index) et l'entrée en tant que code formaté comme une table. Comment demander montrer ce que vous pouvez faire et expliquer que vous êtes coincé.