R in Ihrem Unternehmen

Startseite > Die Wahl in Frankreich 2012 - Eine quantitative Analyse

Die Wahl in Frankreich 2012 - Eine quantitative Analyse

Wir demonstrieren die Möglichkeiten von R anhand der französischen Präsidentschaftswahl von 2012:

Die Daten kommen von der Webseite des Französischen Innenministeriums.

Die Daten sind HTML basiert, darum benutzen wir die R Funktionen getUrl aus dem Packet ’RCurl’ und readHTMLTable aus dem Packet ’XML’.
Damit können wir Daten von mehr als 36 000 französischen Orten herunterladen.

Beispiel für eine Stadt (die Angaben sind die Anzahl der Stimmen):

CODGEO 01001 (INSEE)
LIBGEOL’Abergement-Clémenciat
Abstention84
JOLY 13
LE_PEN 126
SARKOZY 159
MELENCHON 25
POUTOU 2
ARTHAUD 2
CHEMINADE 2
BAYROU 54
DUPONT_AIGNAN4
HOLLANDE 112

(Acht Kandidaten + ungültige Stimmen) im ersten Durchgang, (Zwei Kandidaten + ungültige Stimmen) im zweiten Durchgang => 12 * 36 000 = ungefähr 430 000 Datensätze.

Das ist noch nicht viel, aber bereits zu viel für Excel.

  • Histogramm der Städte

Eines der größten Probleme dieser Studie ist, dass wir Daten pro Stadt haben. Die Stadtgrößen variieren beträchtlich, daher können wir keine "Standard"-funktionen verwenden. Wir gewichten die Daten über die Anzahl der Wähler pro Stadt.

Stadtgrößen folgen keiner einfachen Gaußverteilung. Ihre Verteilung ähnelt eher einer Exponentialverteilung.

Betrachtet man den Logarithmus der Wählerzahlen, so erhält man eine Verteilung, die eher aussieht wie eine Normalverteilung.

  • Principal component analysis (PCA, dt.: Hauptkomponentenanalyse)

Zwei Beispiele mit R:

PNG - 36 000+ towns on the PCA graph (first two dimensions)
36 000+ towns on the PCA graph (first two dimensions)
(click to zoom) The display shows its limits... but it can be used to identify "extreme" towns which vote almost exclusively for one of the candidate
  • Korrelationsdiagramme

Korrelationsdiagramme sind ein einfaches Mittel, um Korrelationsmatrizen zu visualisieren: Blau bedeutet positive Korrelation, Rot negative.

  • Korrelationsdiagramme mit sozialen Faktoren

Das Französische Statistikinstitut veröffentlicht umfangreiche Daten über soziale Faktoren für jede Stadt (Altersverteilung der Einwohner, Arbeitslosigkeit, Gehaltsverteilung,...).
Mit R ist die Berechnung und Visualisierung der Korrelationsmatrizen sehr einfach:

PNG - Correlogram by jobs
Correlogram by jobs
PNG - By degree obtained
By degree obtained
PNG - Correlogram by salary
Correlogram by salary
  • Kartogramme

Kartogramme visualisieren Städte mit einer Fläche, die proportional ist zur Einwohnerzahl. Diese Art von Visualisierung ist essenziell, wenn eine Studie eher von der Einwohnerzahl abhängt als von der geografischen Größe (z.B. Verkaufszahlen). R lädt das Kartogramm und färbt es entsprechend der Daten ein.

(zum Vergrößern anklicken)

JPEG -  Cartogram of France
Cartogram of France
The area of each town is proportionnal to the inhabitants
PNG - Cartogram of non-voters
Cartogram of non-voters
Non voters are concentrated in cities
PNG - Holland’s results
Holland’s results
Holland scores best in South West and towns. Less in west suburb of Paris (Sarkozy’s stronghold), Alsace, South East
PNG - Sarkozy’s results
Sarkozy’s results
PNG - Le Pen’s results
Le Pen’s results
Le Pen’s results are better in the countryside and in South-East