3 Datengrundlage

In diesem Kapitel wird auf die für die Herleitung der beiden hedonischen Modelle verwendeten Daten und deren Beschaffung eingegangen. Detailliertere Informationen zur Kategorisierung der einzelnen Variablen können dem Anhang entnommen werden.

3.1 Erhebung

Für die Erstellung und Produktion des neuen Wohnimmobilienpreisindex werden verschiedene Daten benötigt. Zusätzlich zu den Informationen über die einzelnen Transaktionen (Transaktionsdatum und Transaktionspreis) bedarf es ergänzender Daten für die Qualitätsanpassung. Dazu gehören Angaben zur physischen Struktur (Strukturvariablen), zur Nutzung (Nutzungsvariablen) und zum Standort (Lagevariablen) der Immobilien. Eine effektive Qualitätsanpassung und ein methodisch valider Immobilienpreisindex sind nur möglich, wenn die Qualität der erhobenen Immobilien realistisch wiedergegeben wird. Im Rahmen der Konzeptionsphase untersuchte das BFS, welche Institutionen Immobilientransaktionen erfassen und welche davon als Datenquellen für den neuen Index dienen könnten.

Diese Analyse hat gezeigt, dass für die Erstellung eines offiziellen Wohnimmobilienpreisindex verschiedene Datenquellen benötigt werden. Die Kerninformationen über Transaktionsdaten, Preise und physische Eigenschaften der Immobilien werden vierteljährlich bei den grössten Hypothekarinstituten (26 Banken) erhoben. Dies ist die einzige Quelle, die die erforderlichen Transaktionsdaten, einschließlich der Preise, vollständig und zeitnah erfasst. Hypothekarinstitute führen auch zusätzliche Informationen über die Qualität der von ihnen finanzierten Immobilien in ihren Akten. Da die operativen und strategischen Geschäftsentscheidungen der Hypothekeninstitute auf diesen Daten aufbauen, sind sie von hoher Qualität.

Die von den Hypothekarinstituten erhobenen Transaktions-, Struktur- und Nutzungsvariablen werden durch verschiedene Informationen über die Standortqualität der Immobilien ergänzt. Diese Daten stammen aus Geoinformationsdatensätzen, die von der Bundesverwaltung frei zur Verfügung gestellt werden. Die Anreicherung der Bankdaten mit den geolokalisierten Datensätzen basiert auf der Objektadresse als Identifikationsmerkmal. Aufgrund von Bedenken auf Seiten der Datenlieferanten wegen einer möglichen Verletzung des Datenschutzes und des Bankkundengeheimnisses, erhebt das BFS die Adressinformationen jedoch nicht mit. In Zusammenarbeit mit der Schweizerischen Bankiervereinigung hat das BFS ein Open Source Tool entwickelt, das es den meldepflichtigen Hypothekarinstituten ermöglicht, Daten ohne die Adresse der Objekte zu liefern. Dieses Instrument, einschliesslich einer Datenbankdatei mit den Adressen aller relevanten Liegenschaften in der Schweiz zusammen mit den entsprechenden Standortvariablen, stellt das BFS den Datenlieferanten zur Verfügung. Die Datenbankdatei wird vierteljährlich durch das BFS aktualisiert. Die Adressen sind dem eidgenössischen Gebäude- und Wohnungsregister (GWR) entnommen. Die Standortvariablen stammen aus öffentlich zugänglichen Geodatensätzen (vgl. Kapitel 3.4. und 3.5). Aus Datenschutzgründen stellt das BFS sicher, dass keine Kombination von Standortvariablen in der Datenbankdatei weniger als dreimal vorkommt. Die Standortvariablen wurden so kategorisiert, dass sie aber dennoch genügend Aussagekraft im hedonischen Modell entfalten. Um die Datenlieferung vorzubereiten, importieren die Banken ihre Transaktionsdaten inklusive Objektadresse in das Tool. Das Tool validiert die Eingabedaten und reichert sie über die Objektadresse mit Informationen aus der Datenbankdatei an. Die resultierende Ausgabedatei enthält schliesslich keine Objektadressen mehr und ist als anonymisierter Datensatz für den Versand an das BFS bereit. Für weitere Informationen zum Open-Source-Erhebungstool sowie zur Datenbankdatei konsultieren sie bitte https://github.com/bfs-preis/impi/wiki/Einführung. Zudem können dort sowohl der Code des Tools als auch die Datei eingesehen werden.

3.2 Transaktionsvariablen

3.2.1 TransactionDate

Als Transaktionsdatum wird das Auszahlungsdatum der ersten Kredittranche verwendet. Die Variable dient der eindeutigen Zuweisung der Transaktionen zu einem Quartal.

3.2.2 TransactionPrice

Als Transaktionspreis gilt der finale Kaufpreis von Freihandtransaktionen in Schweizer Franken. Schenkungen, Vorzugspreise, Zwangsversteigerungen, Teilkäufe und Vorerbschaften werden ausgeschlossen. Transaktionskosten wie Grunderwerbssteuern, Notar- und Grundbuchgebühren sowie Maklerprovisionen werden dabei nicht berücksichtigt.

3.3 Struktur- und Nutzungsvariablen

Strukturvariablen umfassen Informationen, die die physischen Eigenschaften einer Immobilie beschreiben. Nutzungsvariablen beinhalten Informationen zur künftigen Nutzung der gehandelten Objekte. Das BFS erhebt diese Variablen zusammen mit dem Transaktionsdatum und dem Transaktionspreis bei den Hypothekarinstituten.

3.3.1 ObjectType

In der Kategorie Wohneigentum unterscheidet das BFS zwischen Einfamilienhäusern und Eigentumswohnungen. Die Variable wird als Stratifizierungskriterium verwendet, wobei für beide Objekttypen Subindizes berechnet werden. Zudem werden separate hedonische Modelle für die Einfamilienhäuser und Eigentumswohnungen berechnet.

3.3.2 SingleFamilyHouseType

Die Banken unterscheiden bei Einfamilienhäusern weitere Unterkategorien. Dazu gehören z.B. die Typologien freistehendes Einfamilienhaus, Reihenmittelhaus, Reiheneckhaus oder Doppelhaus. Der größte gemeinsame Nenner ist die Unterscheidung zwischen freistehenden und zusammengebauten Einfamilienhäusern. Die für die Modellierung verwendete Variable umfasst daher diese beiden Kategorien.

3.3.3 CondominiumType

Die Banken unterscheiden bei den Eigentumswohnungen weitere Unterkategorien. Dazu gehören z.B. die Typologien Erdgeschosswohnung, Gartenwohnung, Etagenwohnung, Attikawohnung oder Dachgeschosswohnung. Der größte gemeinsame Nenner ist die Unterscheidung zwischen Wohnungen im obersten Stockwerk und sämtlichen anderen Wohnungen. Die für die Modellierung verwendete Variable umfasst daher diese beiden Kategorien.

3.3.4 PrimaryOrSecondaryHome

Diese Variable enthält die Information, ob das Objekt als Erst- oder Zweitwohnung verwendet wird. Mit der Verabschiedung der Zweitwohnungsinitiative im Jahr 2012 stimmte die Schweiz dafür, den Bau von Zweitwohnungen einzuschränken. In Gemeinden mit einem Zweitwohnungsanteil von mehr als 20% (siehe Variable Zweitwohnungsquote) werden keine neuen Zweitwohnungen mehr genehmigt. Es stellt sich daher die Frage, ob sich die Preise für Zweitwohnungen in den von der 20-Prozent-Quote betroffenen Gemeinden anders entwickeln als die Preise für Erstwohnungen.

3.3.5 OwnerOccupiedOrRented

Diese Variable enthält die Information, ob ein Objekt zur Selbstnutzung oder zur Vermietung vorgesehen ist.

3.3.6 YearOfConstruction

Diese Variable enthält Informationen, wann das entsprechende Objekt errichtet wurde. Insgesamt werden sieben Bauperioden unterschieden.

3.3.7 LandArea

Einfamilienhäuser verfügen per Definition über einen Grundstücksanteil, der nur dem konkreten Objekt zugeordnet werden kann. Für Eigentumswohnungen gibt es jedoch keine individuell zuordenbare Landfläche. Daher wird die Parzellenfläche nur für Einfamilienhäuser berücksichtigt. Sie wird in Quadratmetern gemessen.

3.3.8 VolumeOfBuilding

Die Größe von Einfamilienhäusern wird als Gebäudevolumen in Kubikmetern erfasst.

3.3.9 StandardOfVolume

In der Schweiz gibt es drei verschiedene Normen zur Messung des Gebäudevolumens (SIA 116, SIA 416 und Gebäudeversicherungsnorm). Da das Gebäudevolumen von ein und demselben Objekt je nach gewählter Norm stark variieren kann, ist es sinnvoll, die Variable als Zusatz zum Gebäudevolumen zu verwenden.

3.3.10 NetLivingArea

Die Größe von Eigentumswohnungen wird als Nettowohnfläche in Quadratmetern angegeben.

3.3.11 NumberOfRooms

Diese Variable enthält die Anzahl der Zimmer sowohl für Einfamilienhäuser als auch für Eigentumswohnungen. Die Art und Weise, wie die Anzahl der Räume erfasst wird, unterscheidet sich jedoch von Datenlieferant zu Datenlieferant und von Region zu Region. In einigen Fällen werden Küchen als halbe Räume gezählt, in anderen ist dies nicht der Fall. Es ist daher angebracht, auf die nächste ganze Zahl abzurunden.

3.3.12 NumberOfBathrooms

Diese Variable enthält die Anzahl der Badezimmer bzw. Nasszellen (inkl. separater Toiletten) sowohl für Einfamilienhäuser als auch für Eigentumswohnungen.

3.3.13 NumberOfParkings

Diese Variable enthält die Anzahl der Garagen, Parkplätze und Carports sowohl für Einfamilienhäuser als auch für Eigentumswohnungen.

3.3.14 ConstructionQuality

Die Banken erfassen den Ausbaustandard zum Zeitpunkt der Transaktion. Dazu verwenden sie ein Bewertungssystem. Da sich die Notenskalen von Hypothekarinstitut zu Hypothekarinstitut unterscheiden, hat das BFS die Bewertungen von 1 bis 100 standardisiert.

3.3.15 PropertyCondition

Die Banken erfassen den Gebäude- bzw. Wohnungszustand zum Zeitpunkt der Transaktion. Dazu verwenden sie ein Bewertungssystem. Da sich die Notenskalen von Institut zu Institut unterscheiden, hat das BFS die Bewertungen von 1 bis 100 standardisiert.

3.4 Makrolagevariablen

Lagevariablen geben Auskunft über die Qualität des Objektstandorts. Wir unterscheiden dabei zwischen Makro- und Mikrolagevariablen. Bei Makrolagevariablen handelt es sich um Lagevariablen, die Gültigkeit für Gemeinden oder für übergeordnete Gebietskörperschaften haben.

3.4.1 Canton

Es handelt sich hierbei um eine kategorielle Variable, die Auskunft darüber gibt, in welchem Kanton ein Objekt steht.

3.4.2 MajorStatisticalRegion

Die sieben statistischen Grossregionen sind vom BFS definierte Bezugsräume in der Schweiz, die auf einer hierarchischen Ebene über den Kantonen stehen. Es handelt sich um eine Aggregation basierend auf den Kantonen. In der Nomenklatur der Europäischen Union entspricht diese Einteilung der NUTS 2 Ebene eurostat, Nomenclature of territorial units for statistics (NUTS) .

3.4.3 CommunityType

Die Gemeindetypen sind eine Klassifikation der Schweizer Gemeinden Bundesamt für Statistik, Gemeindetypologie und Stadt/Land-Typologie 2012 , die vom BFS erstellt und veröffentlicht wird. Ihre Differenzierung geschieht anhand der Kriterien Dichte, Grösse und Erreichbarkeit. Das Kriterium der Gemeindetypen wird für den Schweizer Wohnimmobilienpreisindex neben dem Objekttyp als zweites Stratifizierungskriterium verwendet. Für ihre Zellen werden ebenfalls Subindizes berechnet. Zu diesem Zweck werden die ursprünglich neun Gemeindetypen zu fünf Kategorien weiter aggregiert (vgl. Kapitel 2.1).

3.4.4 SecondAppartementQuota

Hierbei handelt es sich um eine Dummy-Variable, die Aufschluss darüber gibt, ob der Anteil der Zweitwohnungen in der Gemeinde 20% übersteigt. Die Rohdaten bezüglich der Zweitwohnungsquote pro Gemeinde wird vom Bundesamt für Raumentwicklung (ARE) aufbereitet Bundesamt für Raumentwicklung, Zweitwohnungen . In Kombination mit der Variable PrimaryOrSecondaryHome dient die Information zur Identifizierung der Zweitwohnungen in Gemeinden mit einem Anteil an Zweitwohnungen von mehr als 20%.

3.4.5 TaxBurden

Die Eidgenössische Steuerverwaltung (ESTV) Eidgenössische Steuerverwaltung, Steuerbelastung in den Gemeinden veröffentlicht statistische Informationen über die durchschnittliche Steuerbelastung pro Gemeinde für verschiedene Haushaltstypen und Einkommensklassen. Die vorliegende Variable enthält Informationen über die Steuerbelastung in Prozent des jährlich zu versteuernden Einkommens für eine verheiratete Person mit zwei Kindern und einem jährlich zu versteuernden Bruttoarbeitseinkommen von 100 000 Franken. Für den IMPI werden drei Kategorien unterschieden (niedrige, mittlere und hohe Steuerbelastung).

3.4.6 TravelTimeToCenters

Das Bundesamt für Raumentwicklung (ARE) Bundesamt für Raumentwicklung, Reisezeiten gibt pro Gemeinde Auskunft über die durchschnittliche Fahrzeit in Minuten mit den öffentlichen Verkehrsmitteln und dem motorisierten Individualverkehr zur nächstgelegenen Kernstadt oder zum nächstgelegenen Agglomerationszentrum. Als Kernstädte gelten Genf, Lausanne, Bern, Basel, Zürich und Lugano. Die Kategorie der Agglomerationszentren umfasst rund 50 Städte, die für das Umland von einer gewissen Bedeutung sind. Die beim Wohnimmobilienpreisindex verwendete Variable basiert auf dem standardisierten Durchschnitt der vier Reisezeitkategorien Öffentlicher Verkehr zu Kernstädten, Öffentlicher Verkehr zu Agglomerationszentren, Motorisierter Individualverkehr zu Kernstädten, Motorisierter Individualverkehr zu Agglomerationszentren. Die standardisierte Variable wird anschliessend in drei Kategorien unterteilt.

3.5 Mikrolagevariablen

Mikrolagevariablen umfassen alle Lagevariablen mit einer räumlichen Auflösung feiner als auf der kommunalen Ebene. Um diese Daten einem bestimmten Standort zuordnen zu können, werden sie als Geoinformationen erfasst.

3.5.1 PublicTransportQuality

Die ÖV-Güteklassen sind ein Indikator des ARE Bundesamt für Raumentwicklung, Reisezeiten für die Beurteilung der Erschliessung mit dem öffentlichen Verkehr. Zu diesem Zweck werden alle Haltestellen des öffentlichen Verkehrs in der Schweiz kategorisiert. Dies geschieht anhand der Kriterien Art des Verkehrsmittels (Bahnknotenpunkte, Bahnlinien, Trams, Busse, Postautos, Bereitschaftsbusse, Schiffe und Seilbahnen) und Kursintervall. Um die Erreichbarkeit der Haltestellen für Fussgänger zu berücksichtigen, wird in einem zweiten Schritt die Distanz zur Haltestelle als weiterer Parameter hinzugefügt. Dieser wird in konzentrischen Kreisen als lineare Entfernung zur Haltestelle gemessen und dient in Kombination mit der Haltestellenkategorie zur Bestimmung der Qualitätsklassen des öffentlichen Verkehrs. Dabei ist zu beachten, dass sich diese konzentrischen Kreise über maximal einen Kilometer erstrecken. Alle Punkte, die weiter entfernt liegen, werden der Kategorie «keine Erreichbarkeit» zugeordnet. Insgesamt werden fünf Kategorien unterschieden.

3.5.2 NoiseExposure

Das Bundesamt für Umwelt (BAFU)  Bundesamt für Umwelt, Lärmbelastung und das Bundesamt für Zivilluftfahrt (BAZL) Bundesamt für Zivilluftfahrt, Lärmbelastungskataster haben eine umfassende Geodatenbank zur Lärmbelastung in der Schweiz erstellt. ­Berücksichtigt werden die Lärmquellen Strassen-, Eisenbahn- und Flugverkehr. Für die drei Lärmarten werden jeweils Daten für den Tag (6 bis 22 Uhr) und für die Nacht (22 bis 6 Uhr) veröffentlicht. Für den Wohnimmobilienpreisindex verwendet das BFS aggregierte Lärmbelastungsdaten. Zu diesem Zweck werden der maximale Tag- und der maximale Nachtwert der drei Lärmarten in die Day-Night-Average-Sound-Level-Formel  eingefügt. Diese Formel trägt der Tatsache Rechnung, dass Lärm in der Nacht grundsätzlich als störender empfunden wird, und bestraft Nachtlärm mit einem Zuschlag von 10 Dezibel. Die resultierende Lärmbelastung wird anschliessend in drei Kategorien eingeteilt.

3.5.3 Slope

Diese Variable enthält Informationen über die Steilheit des Geländes am jeweiligen Objektstandort. Die Hangneigung (in Grad) wird aus dem digitalen Höhenmodell swissALTI3D  Bundesamt für Landestopografie (swisstopo), Digitales Höhenmodell swissALTI3D des Bundesamtes für Landestopografie (swisstopo) abgeleitet. Für den Wohnimmobilienpreisindex wird die Hangneigung anschliessend in drei Kategorien eingeteilt. Die Hangneigung kann sowohl positiven als auch negativen Einfluss auf den Immobilienpreis haben. Einerseits werden durch die Steilheit des Geländes die Baukosten in die Höhe getrieben. Andererseits werden durch Hangneigung und Exposition (vgl. Kapitel 5.5.4) besonders gute Hanglagen definiert.

3.5.4 Exposure

Die Exposition bzw. die Ausrichtung eines Hanges wird ebenso wie die Hangneigung aus dem digitalen Höhenmodell swissALTI3D von swisstopo abgeleitet. Die Expositionsrichtung wird in Grad Abweichung von der Nordrichtung gemessen und bewegt sich deshalb innerhalb des Spektrums von 0 bis 360 Grad. Für den Wohnimmobilienpreisindex werden schliesslich zwei Kategorien unterschieden (keine Exposition bzw. Exposition nach Norden, Exposition nach Süden). Südhänge weisen dabei eine gute Sonneneinstrahlung auf.

3.5.5 LakeView

Sicht auf einen See ist ein gewichtiges Verkaufsargument bei Immobilien. Aus dem digitalen Höhenmodell swissALTI3D von swisstopo können diejenigen Bereiche bestimmt werden, die von einem bestimmten Ort aus sichtbar sind. Diese werden mit den Seeflächen verschnitten, um anschliessend die sichtbare Seefläche in Hektaren berechnen zu können. In der finalen Variable werden drei Kategorien unterschieden.

3.5.6 MountainView

Wie bei der Seesicht wird auch die Variable Bergsicht aus dem digitalen Höhenmodell swissALTI3D von swisstopo abgeleitet. Zusätzlich wird das digitale Höhenmodell EU-DEM  European Environment Agency, Digital surface model EU-DEM der Europäischen Umweltagentur verwendet, um die angrenzenden Regionen der Nachbarländer Frankreich, Italien, Österreich, Deutschland und Liechtenstein abzudecken. Die sichtbaren Bereiche der digitalen Höhenmodelle werden mit einem Geoinformationslayer verschnitten, der die dominantesten  Die Dominanz eines Berggipfels entspricht der horizontalen Distanz bis zum nächsten höheren Berggipfel. Gipfel der Schweiz und der angrenzenden Regionen der vier Nachbarländer enthält. Schlussendlich werden für die Variable Bergsicht drei Kategorien unterschieden.

3.5.7 DistanceToLakes

Diese Variable gibt Auskunft darüber, ob sich ein Einfamilienhaus oder eine Eigentumswohnung in weniger als 100 Metern Entfernung zum nächsten See befindet oder nicht. Die Geoinformationen zu den Seen werden aus dem Topografische Landschaftsmodell swissTLM3D von swisstopo bezogen.

3.5.8 DistanceToRivers

Diese Variable gibt Auskunft darüber, ob sich ein Einfamilienhaus oder eine Eigentumswohnung unter 100 Metern Entfernung zum nächsten Fluss befindet oder nicht. Die Geoinformationen zu den Flüssen werden aus dem Topografische Landschaftsmodell swissTLM3D von swisstopo bezogen.

3.5.9 DistanceToHighVoltagePowerLines

Diese Variable gibt Auskunft darüber, ob sich ein Einfamilienhaus oder eine Eigentumswohnung in weniger als 100 Metern Entfernung zur nächsten Hochspannungsleitung befindet oder nicht. Die Geoinformationen zu den Hochspannungsleitungen werden aus dem Topografische Landschaftsmodell swissTLM3D von swisstopo bezogen.

3.6 MatchingType

Diese Variable wird erstellt, wenn die Datenlieferanten ihre Daten in das vom BFS zur Verfügung gestellte Tool importieren. Sie enthält Informationen über die Qualität des Adressabgleichs zwischen den Inputdaten des Datenlieferanten und den Adressen des Gebäude-und Wohnungsregisters. Es werden vier Kategorien unterschieden. Die Kategorie Point-Matching enthält Objekte, deren Adresse das Tool exakt zuordnen konnte. Wenn kein Point-Matching möglich ist, versucht das Tool, die Lagevariablen des Objekts zu imputieren, das der Mitte der Strasse (Center-Street-Matching) oder der Mitte der Gemeinde (Center-Community-Matching) am nächsten liegt. Falls auch diese Versuche fehlschlagen, fällt das Objekt in die Kategorie No-Matching. In letztem Fall können keine Lagevariablen angereichert werden. Bei der Erstellung des hedonischen Modells werden nur Objekte berücksichtigt, die ein Point-Matching oder ein Center-Street-Matching aufweisen. Im Gegensatz zur Modellierung werden bei der Indexberechnung auch Center-Community-Matchings berücksichtigt.