une question de débutant: Est-ce que quelqu'un sait-il comment exécuter une régression logistique avec des erreurs standard en cluster dans R? Dans Stata, c'est juste Logit Y X1 X2 x3, VCE (Cluster Z) CODE>, mais malheureusement, je n'ai pas compris comment faire la même analyse dans R. Merci d'avance! P>
4 Réponses :
Vous voudrez peut-être consulter le package RMS code> (stratégies de modélisation de régression). Donc,
LRM code> est le modèle de régression logistique et si
ajustement code> est le nom de votre sortie, vous auriez quelque chose comme ceci:
fit=lrm(disease ~ age + study + rcs(bmi,3), x=T, y=T, data=dataf)
fit
robcov(fit, cluster=dataf$id)
bootcov(fit,cluster=dataf$id)
Merci beaucoup! Cela a travaillé des merveilles! Je vais lire de plus près le manuel de RMS et voir s'il existe un moyen de regrouper les coefficients par pays et par année. Encore une fois merci!
Cette réponse est déjà très bonne mais elle pourrait être améliorée si elle était complètement reproductible. Je ne sais pas où proviennent les variables, quelle est la sortie, et pourquoi RCS (BMI, 3) code> est nécessaire.
J'ai frappé ma tête contre ce problème au cours des deux derniers jours; J'ai trouvé par magie ce qui semble être un nouveau paquet qui semble destiné à de grandes choses - par exemple, je suis également en cours d'exécution dans mon analyse certains modèles de Tobit robustes en grappes et ce paquet a également été construit. De ne pas mentionner la syntaxe est beaucoup plus propre que dans toutes les autres solutions que j'ai vues (nous parlons à proximité des niveaux de stata propre). Donc pour votre exemple de jouet, je voudrais Exécuter: P> library(Zelig)
logit<-zelig(Y~X1+X2+X3,data=data,model="logit",robust=T,cluster="Z")
WOW, cela semble "travailler" de manière à ce que mon code R ne semble jamais. Cette nouvelle fonctionnalité est-elle? Sinon, pourquoi Zelig a-t-il été le moyen canonique de résoudre ce problème dans R?
Je ne sais pas, mais j'espère que ça deviendra tellement. Le projet semble certainement ambitieux! [GROUPE Google] ( groups.google.com/forum/ M / #! Forum / Zelig-Statistical-Logiciels ) ne semble pas si actif, alors non plus sûr de la rapidité de progression.
Malheureusement, je pense que la commande ne fonctionne pas dans la dernière version de zelig code> (sur cran). Je viens de gérer quelques modèles avec et sans l'argument code> cluster code> et les erreurs standard sont exactement les mêmes. Je crois que cela ressemble à cela depuis la version 4.0, la dernière fois que j'ai utilisé le colis.
Oui, en effet, ils ont laissé tomber cette fonctionnalité pour le moment. Vérifiez leur groupe Google (Aller à la section communautaire de leur site Web) - ils sont au milieu de la restructuration de l'ensemble du projet; L'un des développeurs a déclaré en réponse à un poste de mien qu'ils travaillent pour ramener des fonctionnalités de cluster / robustes
Environ trois ans plus tard, la fonctionnalité de cluster n'est pas de retour: Erreur dans glm.control (cluster = "groupe"): argument inutilisé (cluster = "groupe") code>.
Toute mise à jour indique que cela inclut maintenant la fonctionnalité de cluster?
Il y a une commande Dans l'un des exemples de cette page, les commandes p> donnent les mêmes erreurs standard robustes telles que la commande stata p> par exemple une erreur standard de 0,004038 pour la variable GLM.Cluster code> dans le package R
Miceadds code> qui semble donner les mêmes résultats pour la régression logistique que STATA effectue avec l'option
VCE ( Cluster) code>. Voir la documentation ici .
hisei code>. p> p>
Une autre alternative serait d'utiliser le fera le travail. P> p> sandwich code> et
lmtest code> comme suit. Supposons que
z code> est une colonne avec les indicateurs de cluster de votre ensemble de données
dat code>. Alors
La fonction
VCOVHC () CODE> dans le package
sandwich code> peut également être utile (pas sûr s'il s'applique aux estimations de la régression logistique)
Si vous migrez de STATA, vous pouvez trouver le package appelé
PLM code> utile. En outre, il y a le package appelé
pcse code> pour la mise en œuvre d'erreurs standard corrigées en manipulant la matrice de covariance de la variance après l'estimation
Merci beaucoup pour vos réponses, Ben et Hubert. Je vais également tester les paquets que vous avez suggéré et voir s'ils travaillent avec des estimations logistiques. Merci encore!