contact | site map | imprint           5.7.2008
Logo EURAC  
  NEWS ARCHIVE    
      Events    
      Education courses    
      On research    
      New print releases    
      Job openings    
SITE SEARCH  
 

Academia 14
 

Home  |  Press  |  Academia  |  14  |  Artikel8  

Künstliche Neuronale Netze.
Eine interdisziplinäre Herausforderung

von Janette Aschenwald



Künstliche Neuronale Netze (KNN) sind eine neuere Entwicklung im Bereich nicht-linearer Analyseverfahren, die sich unter anderem auch zum Einsatz für Klassifikationsaufgaben eignen sollten. Herauszufinden, in welchem Umfang diese Methode klassischen Instrumenten wie zum Beispiel der Diskriminanzanalyse überlegen ist, und welche zusätzlichen Fragen im Bereich der Vegetationsmodellierung beantwortet werden können, haben sich ein Team aus Wissenschaftlern der Ökologie und der Wirtschaftswissenschaften zur Aufgabe gemacht.

Im Rahmen des EU-Projektes ECOMONT, das in Südtirol im Passeiertal durchgeführt wird, befaßt sich der Bereich „Alpine Umwelt“ mit der Modellierung der Vegetation auf der Ebene der Landschaft (Tappeiner et al. 1998). Während der Untersuchungen wurden die Grenzen von linearen Klassifikationsverfahren rasch klar, und diese faszinierende Fragestellung beschäftigt nun nicht nur Ökologen. Aus diesem Grund wurde eine wissenschaftliche Kooperation auf dem Gebiet der KNN zwischen der Europäischen Akademie Bozen und dem Institut für Wirtschaftstheorie und -politik initiert.

Die Kernfrage bei der Vegetationsmodellierung lautet, welche Variablen (Merkmale) dafür maßgeblich sind, daß sich eine bestimmte Pflanzengesellschaft an einem bestimmten Ort entwickelt und hält. Um dieser Fragestellung nachgehen zu können, wurde ein 9 km2 großes Gebiet im Passeiertal (Waltner Mähder) in 5m x 5m große Flächenquadrate unterteilt. Folglich standen rund 185000 Flächenstücke (oder Pixel) zur Klassifikation zur Verfügung. Nach ökologischen Überlegungen wurden die in Frage kommenden Variablen auf zehn Stück eingegrenzt. Merkmale wie die Hangneigung, die Meereshöhe und die Befahrbarkeit des Geländes (um exemplarisch drei zu nennen) sollten imstande sein, die Unterschiede zwischen den 21 Vegetationseinheiten im Gebiet der Waltner Mähder - die von Borstgraswiesen über Alpenrosenheide mit Zwergwachholder bis hin zum subalpinen Silikat-Fichtenwald reichen - zu erklären. Vom Bereich „Alpine Umwelt“ betreute Diplomanden gingen das gesamte Gebiet ab, erhoben einige der Merkmale vor Ort, wogegen andere mit Hilfe eines digitalen Geländemodells mittels GIS (Geographisches Informationssystem) am Computer abgeleitet wurden (Ostendorf et al. 1998).

Auf diese Weise konnte ein sehr umfangreicher und vielversprechender Datensatz gewonnen werden, der nun für wissenschaftliche Untersuchungen zur Verfügung stand. Wie sich sehr bald herausstellen sollte, nicht nur für ökologisch interessante Fragestellungen. Zunächst drängt sich die Frage auf, ob sich die Unterschiede zwischen den 21 Vege-tationseinheiten alleine durch zehn Merkmale erklären lassen (auch wenn diese nach ökologischen Kriterien in sorgfältiger Weise ausgewählt wurden). Ein gängiges statistisches Verfahren, das hierfür von Tasser et al. (1998) herangezogen wurde, ist die Diskriminanzanalyse. Anhand eines (kleinen) Teils des Datensatzes (Trainings-daten) „lernt“ das Verfahren, Strukturen zwischen den Variablen (als unabhängige Größen) und der Ve-getationsklasse (als abhängige Größe) zu erkennen. Wie gut eine vorhandene Struktur erfaßt wurde, kann mit dem noch nicht verwendeten Teil des Datensatzes (Gene-ralisierungsdaten) überprüft werden. Man vergleicht dazu die von der Diskri-minanzanalyse vorhergesagte Klasse mit der im Gelände kartierten Vegetationseinheit. Mit 18500 Trainingsdaten wurde auf der Generalisierungsmenge eine Trefferquote von 78% erreicht. Die Trefferquote definiert sich als Verhältnis der Anzahl der Übereinstimmungen zu der Gesamtzahl an Klassifikationen. 78% sind ein ausgezeichnetes Ergebnis und ein Hinweis auf den hohen Erklärungsgehalt der ausgewählten Variablen. Würde man zufällig eine Klasse auswählen mit der Zusatzinformation der Verteilung der Klassen in der Trainingsmenge, so könnte man eine Trefferquote von nur ca. 21,5% erwarten; würde man die Flächeneinheiten einfach nur der am häufigsten vorkommenden Vegetationsklasse (in unserem Fall ist dies die Klasse „Subalpiner Silikat-Fichtenwald“) zuordnen, wäre auch nur eine Verbesserung auf höchstens 39,6% möglich! In diesem Kontext muß man die Trefferquote beurteilen.

Die wissenschaftliche Neugierde richtet sich allerdings konsequenterweise auf die Analyse der falsch klassifizierten Flächen; nur so können ein tieferes Verständnis und neue, wichtige Einblicke in die Zusammenhänge zwischen mathematischen Methoden und den zu beschreibenden Datensätzen gewonnen werden. Im Fall der Diskriminanzanalyse könnten die Abweichungen der Vorhersagen von den realen Gegebenheiten durchaus plausibel durch das Fehlen von Variablen und damit von wichtigen Informationen zustande kommen. Damit wäre eine noch bessere Klassifizierung zur Zeit nicht möglich. In diese Richtung sind auch schon einige Überlegungen erfolgt, und neue Einsichten gewonnen worden, die noch experimentell zu überprüfen sind. Ein Grund für die Fehlklassifikationen liegt in der Funktionsweise der Methode selbst. Bei der Diskriminanzanalyse handelt es sich um ein lineares Verfahren, zur Beschreibung können nur lineare Kombinationen der Variablen herangezogen werden. Nichtlinearitäten, wie zum Beispiel ein multiplikativer Einfluß zweier Variablen, werden nicht erfaßt. Dies ist ein schwerwiegender Nachteil jedes linearen Verfahrens, oder anders formuliert, die Chance für ein nicht-lineares Verfahren sein Können zu zeigen! Ein neues, nicht-lineares Verfahren, von dem man sich einige Fortschritte in Richtung Datenanalyse erhofft, ist die Methode der „Künstlichen Neuronalen Netze“.

In Form von mathematischen Beweisen konnte theoretisch gezeigt werden, daß Künstliche Neuronale Netze (KNN) aufgrund ihrer Funktionsweise imstande sind, alle Strukturen, im Besonderen nicht-lineare Zusammenhänge, zu erkennen. Voraussetzungen hierfür sind natürlich, daß derartige Strukturen existieren, daß die Parametereinstellungen des Verfahrens korrekt gewählt werden, und daß genügend Daten vorhanden sind. Ein empirischer Beweis für die Überlegenheit der KNN gegenüber allen anderen, klassisch linearen Analyseinstrumenten steht allerdings noch aus, wofür als (Haupt-) Ursache in der Literatur meist das Fehlen genügend umfangreicher Datensätze angegeben wird. Aber genau dies ist der springende Punkt, eine zu geringe Datenmenge trifft bei dem beschriebenen Datensatz gerade nicht zu. Denn sollten nicht einmal 185000 Datensätze zur Erkennung der linearen und nicht-linearen Strukturen ausreichen, für welches (praktische) Problem sind dann Künstliche Neuronale Netze überhaupt geeignet? Am Institut für Wirtschaftstheorie und -politik beschäftigt sich eine Gruppe intensiv mit der Methode der KNN und aus diesem Grund hat sich für das genannte Problem eine interdisziplinäre Kooperation angeboten, die durch das Forschungsteam bestehend aus Janette Aschenwald, Hans-Werner Holub, Gottfried Tappeiner, Ulrike Tappeiner und Erich Tasser vorangetrieben wird. In Zusammenarbeit versuchen sie nun, die vielen Fragen einerseits bezüglich Vegetationsmodellierung, und andererseits bezüglich des Verfahrens selbst zu beantworten. Der enorme Umfang des ökologischen Datensatzes sowie die Problemstellung der Klassifikation sind dabei für eine Überprüfung der KNN wie geschaffen und in idealer Weise dazu geeignet, die Chancen und Grenzen dieses aktuellen Verfahrens auszuloten.

Bis dato ist es gelungen mit den KNN für die Vegetationsmuster auf den Waltner Mähdern eine Trefferquote von 81,8% zu erzielen, eine in diesem hohen Prozentbereich und bei dieser Datenmenge doch deutliche, signifikante Steigerung gegenüber der Diskriminanzanalyse. Wie können wir dieses Ergebnis nun interpretieren? War es den KNN möglich, nicht-lineare Zusammenhänge zu erkennen und damit noch mehr Informationen aus den Variablen herauszuholen? Wenn ja, zwischen welchen Variablen existieren solche Nichtlinearitäten und von welcher Art sind sie? Warum gibt es immer noch Fehlklassifikationen? Ist eine falsch zugeordnete Klasse eine verwandte Vegetationsklasse zu der richtigen, oder handelt es sich um eine total falsche Zuordnung? Durch Gegenüberstellung der Ergebnisse beider Verfahren und zwar nicht nur der Trefferquoten, sondern auch der einzelnen Klassifikationen selbst, können Erkenntnisse über die speziellen Fähigkeiten beider Analyseinstrumente gewonnen werden. Aufgrund der Größe des Datensatzes können Sättigungen festgestellt werden (Bringen immer mehr Trainingsdaten immer bessere Ergebnisse?). Verschiedenste Parametereinstellungen können auf ihre Effizienz geprüft werden. Wo sollte man eine Schraube anziehen, wo darf man sie lockern (bildlich gesprochen natürlich)?

Die gegenseitige Unterstützung in der jeweils fremden Disziplin ist bei der Beantwortung all dieser Fragen nicht nur eine Notwendigkeit, sondern eine fruchtbare Bereicherung für den wissenschaftlichen Erkenntnisgewinn. Man darf sicher gespannt sein, was die Zusammenarbeit dieses Teams in Zukunft an neuen Einblicken in Richtung Vegetationsmodellierung, sowie über die Einsatzmöglichkeiten und die Fähigkeiten der Methode der Künstlichen Neuronalen Netze bringen wird.

Mag. Janette Aschenwald, Universitätsassistentin am Institut für Wirtschaftstheorie und -politik der Universität Innsbruck

Abstract:
Reti neuronali artificali

Le reti neuronali costituiscono un nuovo campo di sviluppo nell'ambito delle procedure di analisi non lineare, che dovrebbero tra l'altro potersi applicare anche ai lavori di classificazione. Chiarire in che misura questo metodo sia superiore agli strumenti classici, come per esempio l'analisi discriminante, e quali nuovi contributi potrà fornire nel campo della modellistica sulla vegetazione è l'obiettivo di uno studio che impegna un gruppo di ricercatori di ecologia ed economia. Su questo aspetto ha avuto inizio, nell'ambito del progetto ECOMONT (ENV4-CT95-0179), una collaborazione tra l'Acca-demia Europea di Bolzano e l'Istituto di Teoria e Politica Economica di Innsbruck. Janette Aschenwald spiega nel suo articolo i contenuti e gli obiettivi della suddetta collaborazione.


  The latest issue
 

 
 
Copyright © EURAC 2008 Send page Print page Top of page