Meine Wetter-App zeigt Sonne an, dabei regnet es. | Der Club of Rome äußerte in den 1970ern berechtigte Zukunftsängste. Einzelne Fortschreibungen, Berechnungen hielten jedoch der Realität nicht stand. | Wie sicher überhaupt sind heutige Klimaberechnungen? | Wahlprognosen haben erst kürzlich erheblich danebengelegen, als Trump einen deutlichen Sieg errungen hat.
Warum nur sind Prognosen so unzuverlässig? Wir, die Wissenschaft hat doch ein ausgefeiltes Instrumentarium?
Stanislav Lem, der Physiker und grandiose Science-Fiction-Theoretiker, hat gesagt, dass Vorhersagen ausschließlich die Sache äußerst kreativer Köpfe sind. Für lineare Fortschreibungen hatte er nur Spott übrig.
Noch eindrücklicher: In dem Film „Come on, come on“, den ich kürzlich gesehen habe, äußert sich ein Kind, nach der Zukunft befragt, in etwa so: „Es passiert immer das, womit man nicht gerechnet hat.“
Trifft das denn immer noch zu? Wir haben doch jetzt künstliche Intelligenz?
Folgende Ausführungen, erheblich gekürzt und vereinfacht, habe ich einem Interview entnommen: Steven Strogatz, Quanta Magazine, hat es geführt mit Emmanuel Candès, Professor für Mathematik und Statistik in Stanford.
Falls du später lesen willst: Hier die PDF-Datei zum Beitrag.
Der Überraschungseffekt wird quantifiziert – Fehler werden prognostiziert
Wer sich ein wenig mit maschinellem Lernen befasst hat, weiß, dass dabei Lernalgorithmen auf viele Daten (Big Data) angewendet werden ... während sie komplizierte Muster aufspüren, und selbst dabei klüger werden. Die Algorithmen sind jedoch so komplex, dass sie nicht beschrieben werden können.
So ist von der „Blackbox“ die Rede. – Betrachtet, untersucht, verwendet werden letztlich die Ergebnisse, die die Blackbox rauslässt. Und jetzt wird es spannend: Genau das Unerwartete, das, was am Ergebnis überrascht, wird quantifiziert. Der Überraschungseffekt nennt sich übrigens p-Wert.
Beispiel: High-School-Absolventen bewerben sich bei einem College. Nun soll vorhergesagt werden, wie deren Notendurchschnitt bei Abschluss sein wird. Datenquelle ist unter anderem der Bewerbungsaufsatz: Wie gut ist der Ausdruck? Wir groß der Wortschatz? Emmanuel Candès: „Was sagt die Blackbox über diese Studenten aus? Wenn ich mir die Fehlerverteilung ansehe – Differenz zwischen dem Notendurchschnitt der Studenten und den Vorhersagen der Blackbox – bekomme ich einen Eindruck von den typischen Fehlern, die die Blackbox bei einem Zufallsstudenten macht.“
Die Fehlerverteilung wird übertragen auf die nächsten High-School-Absolventen. Nun weiß man, welche Fehler zu erwarten sind. Angegeben wird ein Intervall, in dem sich das wahre Ergebnis befindet. Das kann zwischen einzelnen Personen stark differieren.
Wahlprognosen – Fehler vorhersagen | Unsicherheiten projizieren
Gestellt werden erste Wahlprognosen nach Abgabe der Stimmzettel. Für noch nicht ausgezählte Bezirke werden dabei statt punktueller Schätzungen Vorhersagen mehrerer Bezirke zusammengefasst. Und auf Ebene des Bundesstaates aggregiert.
Wie geht das? – Die Abstimmung der Bezirke beruht auf einer Reihe von Merkmalen. Candés; „Handelt es sich um einen überwiegend städtischen Bezirk? Handelt es sich um einen ländlichen Bezirk? Wie hoch ist das Bildungsniveau?“ Wie hat der Bezirk beim letzten Mal gewählt? Das in etwa gehört zur Datenbasis.
Doch Vorsicht ist geboten: Mit punktuellen Vorhersagen, wie bereits bei den Studenten erläutert, kann man sich irren. Daher empfiehlt es sich, eine Reihe möglicher Ergebnisse anzugeben: Wieder werden Fehler prognostiziert, Unsicherheiten projiziert.
Allerdings, muss ich einräumen, haben die erörterten Hochrechnungen nichts mit den Wahlumfragen im Vorfeld zu tun. Die liegen – wie kürzlich in den USA – ja oft daneben.
In der Medizin mit KI künstliche Daten erzeugen
In der Medizin können Prozesse beschleunigt werden. Liegen bei der Entwicklung eines Medikamentes zu wenig Stichproben vor, kann man mit künstlicher Intelligenz sozusagen künstliche Daten erzeugen.
Große Pharmaunternehmen haben eine riesige Bibliothek von Wirkstoffen. Das können 400, 500 Millionen sein. Wird die Wirksamkeit, also die Fähigkeit der Bindung an ein Molekül, bei einem Wirkstoff nach dem anderen getestet, dauert das sehr lange. Das Procedere nun kann maschinelles Lernen übernehmen. „Es gibt viele Modelle, die versuchen, die Form einer Verbindung allein anhand der Sequenzen der Aminosäuren vorherzusagen.“
Der neue Prozess: Die Verbindung, die zuerst physikalisch getestet werden sollte, wird priorisiert.
Induktives Denken in der Statistik: Beobachtungen verallgemeinern
Über mathematisches und physikalisches Denken hinaus sei induktives Denken wichtig: „Die Fähigkeit, bestimmte Beobachtungen zu verallgemeinern. ... Ich finde statistische Überlegungen äußerst wirkungsvoll und äußerst schön.“
Ein Beispiel: In den 1930ern studierte Alexander Steven Corbett Schmetterlinge, während eines Jahres in Malaysia. Er schrieb akribisch auf, wie oft er welche Art gesehen hatte. Nach seiner Rückkehr fragte er sich, wie viele neue Arten er wohl sehen würde, kehrte er für sechs Monate nach Malaysia zurück.
Das ist es, was Statistiker tun, betont Candès. Da sei Deep Learning nicht sehr hilfreich. Übertragbar sei der Vorgang auch auf das Auszählen von Krebszellen: „So viele Krebszellen habe ich einmal gesehen. ... So viele Krebszellen habe ich zweimal gesehen. ... Wie viele Krebszellen habe ich noch nicht gesehen?“ Suche man weiter – sechs Monate, ein oder zwei Jahre, wie viele neue Arten seien dann zu erwarten.
„Das lernt man also, wenn man Statistik studiert. Und ich finde es faszinierend.“
Noch mal die Frage: Klügere Zukunftsprognosen mit KI
Ja, ich schließe mich an. Faszinierend! Ich habe kürzlich Äußerungen von einem Biologen gehört. Weiterhin wird gezählt und hochgerechnt.
Meine Eingangsfrage: Klügere Zukunftsprognosen mit KI? – Es sieht so aus, dass künstliche Intelligenz Prozesse zum Stellen von Prognosen beschleunigen kann. Vom Verbessern scheinen wir noch um einiges entfernt zu sein.
Und eines wird deutlich: Prognosen zu stellen, ist äußerst fragil. Immer sollten wird den Zweifel, die Fehlerquote für uns mit einbauen. Und auf Überraschungen gefasst sein ...
Hier findest du das ganze Interview.
Comments