7
votes

John Tukey "médiane médiane" (ou "ligne résistante") test statistique pour la régression r et linéaire

Je cherche l'algorithme de John Tukey qui calculent une "ligne résistante" ou "ligne médiane médiane" sur ma régression linéaire avec r.

Un étudiant sur une liste de maillot explique cet algorithme en ces termes:

"La façon dont il est calculé est de diviser les données en trois groupes, trouvent la Valeurs X-Médian et Y-Médian (appelée le point de synthèse) pour chaque groupe, et Ensuite, utilisez ces trois points de synthèse à déterminer la ligne. L'extérieur deux Les points de synthèse déterminent la pente, et une moyenne de tous détermine l'interception. "

article sur la médiane médiane de John Tukey pour curieux: http: //www.johndcook.com/blog/2009/06/23/Tukey-median-Ninther/

Avez-vous une idée de l'endroit où je pourrais trouver cet algorithme ou cette fonction R? Dans quels paquets, Merci beaucoup!


1 commentaires

En fait, la fonction ligne fait exactement cela. Ou devrait ...


3 Réponses :


11
votes

Il y a une description de la façon de calculer la ligne médiane-médiane ici . Une mise en oeuvre de celle-ci est xxx

pour le tester, voici un exemple: xxx

notez la manière légèrement étrange de spécifier les groupes. Les instructions sont assez difficiles sur la manière dont vous définissez les tailles de groupe, de sorte que la méthode plus évidente de coupée (x, quantitif (x, SEQ.int (0, 1, 1/3))) ne fait pas travail.


3 commentaires

Wow ! Merci beaucoup richie coton !! C'est parfait ;)


dfR <- data.frame (heure = C (.16 ,24 ,25 , .30 , .30 ,32 ,36 ,36 ,.50, .50, .57, 0,61,. .68, .72, 0,72, 0,83 ,88 ,89), Distance = C (12.1, 29.8, 32.7, 42.8, 44.2, 55.8, 63.5, 65.1, 124.6, 129.7, 150.2, 182.2, 189.4, 220.4 , 250.4, 261.0, 334.5, 375.5, 399.1)); Ligne (DFR); donne une réponse différente.


Le lien dans la première ligne semble maintenant brisé.



2
votes

Je suis un peu tard à la fête, mais avez-vous essayé de la ligne () du paquet statistiques?

de l'aidefile:

valeur

Un objet de classe "tukeyline".

références

Tukey, J. W. (1977). Analyse des données exploratoires, lecture de Massachusetts: Addison-Wesley.


1 commentaires

Version modifiée de mon commentaire de mon 16 janvier original: Un peu d'expérimentation avec ligne sur 9 points de données suggère que cela peut ne pas être la ligne médiane médiane comme normalement donnée. En fait, si vous laissez à la fois x et y être 1: 9 (tous les points se trouvent sur une ligne avec pente 1), la ligne de ligne a une pente 1.2! Pendant que je pensais à l'origine que la fonction a peut-être été mise en œuvre d'une autre ligne que la ligne résistante aux tuyois (ligne médiane de la médiane), je soupçonne maintenant qu'il s'agisse d'être cette ligne, ce qui est simplement un bogue dans la ligne > fonction.



2
votes

En tant que membre de l'équipe de base R, j'ai maintenant creusé le code source et j'ai également étudié l'historique de celui-ci.

Conclusion: le code source source C, ajouté en 19961997, lorsque R était toujours appelé alpha (et autour de la version 0.14alpha) déjà calculé les quantiles non assez correctement ... pour quelques tailles d'échantillons.

plus à ce sujet sur les listes de diffusion R (pas encore).


0 commentaires