J'utilise souvent des données d'Eurostat et j'ai trouvé tout ce que les données ne pouvaient pas être chargées directement dans R. J'ai écrit cet extrait pour obtenir un jeu de données fourni par la facilité de téléchargement en vrac d'Eurostat http://epp.eurostat.ec.europa.eu/navtree_prod/everybody Bulkdownloadlistting? Trier = 1 & Dir = DIC% 2FEN
Y a-t-il une meilleure façon? ..Cette on a travaillé pour moi: p>
3 Réponses :
Vérifiez Voici Exemple: P> library(SmarterPoland)
# info about passagers
grepEurostatTOC("split of passenger transport")
## get table
tmp <- getEurostatRCV("tsdtr210")
summary(tmp)
## vehicle geo time value
## BUS_TOT:756 AT : 63 1990 : 108 Min. : 0.0
## CAR :756 BE : 63 1991 : 108 1st Qu.: 6.9
## TRN :756 BG : 63 1992 : 108 Median :12.9
## CH : 63 1993 : 108 Mean :33.6
## CY : 63 1994 : 108 3rd Qu.:77.4
## CZ : 63 1995 : 108 Max. :93.4
## (Other):1890 (Other):1620 NA's :397
Le package Eurostat R est développé sur la base de Smarterpoland et comprend le même auteur d'origine. Les outils spécifiques d'Eurostat dans le package Eurostat R sont désormais plus à jour et bien entretenus que ceux du SmarterPoland (ce forfait peut contenir d'autres fonctionnalités utiles, cependant).
the package RJSDMX peut également être utilisé Pour récupérer des données d'Eurostat dans R. Un exemple est indiqué ci-dessous. P> <?xml version="1.0" encoding="utf-8"?>
<message:GenericData xmlns:footer="http://www.sdmx.org/resources/sdmxml/schemas/v2_1/message/footer" xmlns:generic="http://www.sdmx.org/resources/sdmxml/schemas/v2_1/data/generic" xmlns:common="http://www.sdmx.org/resources/sdmxml/schemas/v2_1/common" xmlns:message="http://www.sdmx.org/resources/sdmxml/schemas/v2_1/message" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<message:Header>
<message:ID>13e08b8d24936d75b3a6fa1b9c632e22</message:ID>
<message:Test>false</message:Test>
<message:Prepared>2014-10-20T21:10:50</message:Prepared>
<message:Sender id="ESTAT">
<common:Name xml:lang="en">Eurostat</common:Name>
<message:Timezone>+01:00</message:Timezone>
</message:Sender>
<message:Receiver id="RECEIVER"/>
<message:Structure structureID="ESTAT_DSD_nama_gdp_c_1_0" dimensionAtObservation="TIME_PERIOD">
<common:Structure>
<Ref agencyID="ESTAT" id="DSD_nama_gdp_c" version="1.0"/>
</common:Structure>
</message:Structure>
<message:DataSetAction>Append</message:DataSetAction>
<message:DataSetID>nama_gdp_c</message:DataSetID>
</message:Header>
<message:DataSet structureRef="ESTAT_DSD_nama_gdp_c_1_0">
<generic:Series>
<generic:SeriesKey>
<generic:Value id="UNIT" value="EUR_HAB"/>
<generic:Value id="INDIC_NA" value="B1GM"/>
<generic:Value id="GEO" value="DE"/>
<generic:Value id="FREQ" value="A"/>
</generic:SeriesKey>
<generic:Obs>
<generic:ObsDimension value="2013"/>
<generic:ObsValue value="33300.0"/>
</generic:Obs>
<generic:Obs>
<generic:ObsDimension value="2012"/>
<generic:ObsValue value="32600.0"/>
</generic:Obs>
<generic:Obs>
<generic:ObsDimension value="2011"/>
<generic:ObsValue value="31900.0"/>
</generic:Obs>
<generic:Obs>
<generic:ObsDimension value="2010"/>
<generic:ObsValue value="30500.0"/>
</generic:Obs>
</generic:Series>
</message:DataSet>
</message:GenericData>
Eurostat diffuse leurs données statistiques au format SDMX. Dans R, vous pouvez utiliser package RSDMX pour lire leurs données. Voir l'exemple ci-dessous: Remarque: Vous pouvez trouver RSDMX soit à partir de cran ou l'installer directement à partir du référentiel GitHub. https://github.com/opensdmx/rsdmx p> rsdmx n'est pas limité à Lecture SDMX Datasets CODE> Mais tous les documents, données ou métadonnées SDMX, y compris
structures de données code> et
codelistes code>. Je vous invite à vérifier le rsdmx wiki si vous voulez plus d'exemples. P> p >
+1 ressemble à une approche simplifiée et davantage conviviale à la méthode que j'ai suggérée. Ici, l'utilisateur R n'a pas besoin d'utiliser directement XPath, donc très bon travail, en effet. Hâte d'utiliser rsdmx.
Merci Graeme Walsh! Oui, l'un des objectifs de RSDMX est de le rendre aussi simple que possible. Il en résulte une fonction unique liselddmx code> pour l'utilisateur final. La fonction s'occupe de l'instanciation de l'objet SDMX R droit. L'approche d'analyse est XPath, mais elle entend être prolongée plus tard avec d'autres approches telles que saxo, pour d'énormes jeux de données. Eurostat est l'une des sources pour lesquelles
rsdmx code> peut être utilisé, mais il a été testé sur d'autres: par exemple. OCDE, BCE, FAO.
Eblondel, j'aime votre approche très simple et efficace. Je lis la documentation SDMX disponible sur le site Web d'Eurostat, mais je vous demandais s'il existe un moyen de générer efficacement les URL souhaitées, sans absorber le contenu complet des manuels. Idéalement, je voudrais générer une table de NUT3 génératrice de DatasURL avec un taux de chômage pour toutes les séries chronologiques disponibles. Comment, utilisant le site Web Eurostat, je peux trouver tous les éléments nécessaires à l'URL?
Vous pouvez identifier le jeu de données en parcourant EC.Europa.eu/eurostat/data / Parcourir-statistiques-par-thème Une fois que vous avez choisi un thème, allez à la section "Tables principales", par exemple ec.europa.eu/eurostat/web/lfs/data/main- Tables Vous avez un arbre de jeux de données navigable: Notez que chaque jeu de données est livré avec un ID code>, ainsi que le
StartDate code> et
enddate code> souhaité, pour créer l'URL: EC.europa.eu/eurostat/sdmx/diss-web / repos / data / ... > espère que cela aide
Un package R appelé Eurostat a été publié en 2015. Une belle Vignette donne Exemple d'instructions pour télécharger et visualiser des données Eurostat. L'auteur du Smarterpoland Le paquet mentionné ci-dessous est l'un des co-auteurs du paquet Eurostat.