7
votes

Est-ce la solution pour obtenir des données d'Eurostat dans R?

J'utilise souvent des données d'Eurostat et j'ai trouvé tout ce que les données ne pouvaient pas être chargées directement dans R. J'ai écrit cet extrait pour obtenir un jeu de données fourni par la facilité de téléchargement en vrac d'Eurostat http://epp.eurostat.ec.europa.eu/navtree_prod/everybody Bulkdownloadlistting? Trier = 1 & Dir = DIC% 2FEN

Y a-t-il une meilleure façon? ..Cette on a travaillé pour moi: xxx

r

1 commentaires

Un package R appelé Eurostat a été publié en 2015. Une belle Vignette donne Exemple d'instructions pour télécharger et visualiser des données Eurostat. L'auteur du Smarterpoland Le paquet mentionné ci-dessous est l'un des co-auteurs du paquet Eurostat.


3 Réponses :


7
votes

Vérifiez SMARTERPOLAND strong>, il existe des fonctions à télécharger (et à entrer dans R) les données directement à partir d'Eurostat.

Voici Exemple: P>

library(SmarterPoland)
# info about passagers
grepEurostatTOC("split of passenger transport")
## get table
tmp <- getEurostatRCV("tsdtr210")
summary(tmp)

##     vehicle         geo            time          value     
##  BUS_TOT:756   AT     :  63   1990   : 108   Min.   : 0.0  
##  CAR    :756   BE     :  63   1991   : 108   1st Qu.: 6.9  
##  TRN    :756   BG     :  63   1992   : 108   Median :12.9  
##                CH     :  63   1993   : 108   Mean   :33.6  
##                CY     :  63   1994   : 108   3rd Qu.:77.4  
##                CZ     :  63   1995   : 108   Max.   :93.4  
##                (Other):1890   (Other):1620   NA's   :397


1 commentaires

Le package Eurostat R est développé sur la base de Smarterpoland et comprend le même auteur d'origine. Les outils spécifiques d'Eurostat dans le package Eurostat R sont désormais plus à jour et bien entretenus que ceux du SmarterPoland (ce forfait peut contenir d'autres fonctionnalités utiles, cependant).



2
votes

réponse révisée forte>

the package RJSDMX peut également être utilisé Pour récupérer des données d'Eurostat dans R. Un exemple est indiqué ci-dessous. P>

<?xml version="1.0" encoding="utf-8"?>
<message:GenericData xmlns:footer="http://www.sdmx.org/resources/sdmxml/schemas/v2_1/message/footer" xmlns:generic="http://www.sdmx.org/resources/sdmxml/schemas/v2_1/data/generic" xmlns:common="http://www.sdmx.org/resources/sdmxml/schemas/v2_1/common" xmlns:message="http://www.sdmx.org/resources/sdmxml/schemas/v2_1/message" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
  <message:Header>
    <message:ID>13e08b8d24936d75b3a6fa1b9c632e22</message:ID>
    <message:Test>false</message:Test>
    <message:Prepared>2014-10-20T21:10:50</message:Prepared>
    <message:Sender id="ESTAT">
      <common:Name xml:lang="en">Eurostat</common:Name>
      <message:Timezone>+01:00</message:Timezone>
    </message:Sender>
    <message:Receiver id="RECEIVER"/>
    <message:Structure structureID="ESTAT_DSD_nama_gdp_c_1_0" dimensionAtObservation="TIME_PERIOD">
      <common:Structure>
        <Ref agencyID="ESTAT" id="DSD_nama_gdp_c" version="1.0"/>
      </common:Structure>
    </message:Structure>
    <message:DataSetAction>Append</message:DataSetAction>
    <message:DataSetID>nama_gdp_c</message:DataSetID>
  </message:Header>
  <message:DataSet structureRef="ESTAT_DSD_nama_gdp_c_1_0">
    <generic:Series>
      <generic:SeriesKey>
        <generic:Value id="UNIT" value="EUR_HAB"/>
        <generic:Value id="INDIC_NA" value="B1GM"/>
        <generic:Value id="GEO" value="DE"/>
        <generic:Value id="FREQ" value="A"/>
      </generic:SeriesKey>
      <generic:Obs>
        <generic:ObsDimension value="2013"/>
        <generic:ObsValue value="33300.0"/>
      </generic:Obs>
      <generic:Obs>
        <generic:ObsDimension value="2012"/>
        <generic:ObsValue value="32600.0"/>
      </generic:Obs>
      <generic:Obs>
        <generic:ObsDimension value="2011"/>
        <generic:ObsValue value="31900.0"/>
      </generic:Obs>
      <generic:Obs>
        <generic:ObsDimension value="2010"/>
        <generic:ObsValue value="30500.0"/>
      </generic:Obs>
    </generic:Series>
  </message:DataSet>
</message:GenericData>


0 commentaires

6
votes

Eurostat diffuse leurs données statistiques au format SDMX. Dans R, vous pouvez utiliser package RSDMX pour lire leurs données. Voir l'exemple ci-dessous: xxx

Remarque: Vous pouvez trouver RSDMX soit à partir de cran ou l'installer directement à partir du référentiel GitHub. https://github.com/opensdmx/rsdmx

rsdmx n'est pas limité à Lecture SDMX Datasets Mais tous les documents, données ou métadonnées SDMX, y compris structures de données et codelistes . Je vous invite à vérifier le rsdmx wiki si vous voulez plus d'exemples.


4 commentaires

+1 ressemble à une approche simplifiée et davantage conviviale à la méthode que j'ai suggérée. Ici, l'utilisateur R n'a pas besoin d'utiliser directement XPath, donc très bon travail, en effet. Hâte d'utiliser rsdmx.


Merci Graeme Walsh! Oui, l'un des objectifs de RSDMX est de le rendre aussi simple que possible. Il en résulte une fonction unique liselddmx pour l'utilisateur final. La fonction s'occupe de l'instanciation de l'objet SDMX R droit. L'approche d'analyse est XPath, mais elle entend être prolongée plus tard avec d'autres approches telles que saxo, pour d'énormes jeux de données. Eurostat est l'une des sources pour lesquelles rsdmx peut être utilisé, mais il a été testé sur d'autres: par exemple. OCDE, BCE, FAO.


Eblondel, j'aime votre approche très simple et efficace. Je lis la documentation SDMX disponible sur le site Web d'Eurostat, mais je vous demandais s'il existe un moyen de générer efficacement les URL souhaitées, sans absorber le contenu complet des manuels. Idéalement, je voudrais générer une table de NUT3 génératrice de DatasURL avec un taux de chômage pour toutes les séries chronologiques disponibles. Comment, utilisant le site Web Eurostat, je peux trouver tous les éléments nécessaires à l'URL?


Vous pouvez identifier le jeu de données en parcourant EC.Europa.eu/eurostat/data / Parcourir-statistiques-par-thème Une fois que vous avez choisi un thème, allez à la section "Tables principales", par exemple ec.europa.eu/eurostat/web/lfs/data/main- Tables Vous avez un arbre de jeux de données navigable: Notez que chaque jeu de données est livré avec un (en parentés). Utilisez ce ID , ainsi que le StartDate et enddate souhaité, pour créer l'URL: EC.europa.eu/eurostat/sdmx/diss-web / repos / data / ... > espère que cela aide