Header

Suche

Studie: „LLM im Bereich Risikoprofilierung“

Wie kategorisieren ChatGPT und Bard die Risikoprofile von Anlegern im Vergleich zu Finanzberatern?

August 2025

Prof. Thorsten Hens und Trine Nordlie (Deloitte Norway) untersuchen, wie gut große Sprachmodelle (LLMs), insbesondere ChatGPT-4 von OpenAI und Bard (jetzt umbenannt in Gemini) von Google, im Vergleich zu professionellen Bankern bei der Bewertung von Anleger-Risikoprofilen abschneiden, was ein entscheidender Aspekt der Finanzberatung ist.

Da die strategische Vermögensallokation bekanntermaßen der wichtigste Faktor für den Anlageerfolg ist, ist eine genaue Risikoprofilierung entscheidend, um die Eignung und den Schutz des Kunden zu gewährleisten.

Methode

Die Studie verwendete zehn verschiedene Kundenfälle, in denen die finanzielle Situation, die Anlageziele, die Risikopräferenzen und die Erfahrung der Anleger beschrieben wurden.
Die Daten wurden durch eine Online-Umfrage unter Bankern derselben Schweizer Bank erhoben, die dazu aufgefordert wurden, jeden Fall auf einer Risikoskala von 1 bis 5 zu bewerten. ChatGPT-4 und Bard (Gemini) bewerteten dieselben Fälle jeweils 16 Mal anhand derselben Skala.

Wichtigste Ergebnisse

  • Bei etwa der Hälfte der Kundenfälle zeigten sich keine signifikanten Unterschiede zwischen den Risikobewertungen der Banker und denen der Chatbots, und etwaige Unterschiede hatten nur geringe wirtschaftliche Auswirkungen.

  • Im Vergleich zu den Chatbots waren allerdings die Risikoprofilbewertungen der Banker für die zehn Kundenprofile variabler.

  • Chatbots stützten sich auf allgemeine Regeln und vereinfachten Details oft zu stark. Zusätzlich wurden spezifische Merkmale der Kunden ausser Acht gelassen.

  • LLMs konnten zwar die Risikobewertungen der Bankberater annähernd erreichen, aber ihre Argumentation war nicht tiefgehend, personalisiert und kontextbezogen genug, was bei der Finanzberatung entscheidend ist.

Fig. 1. Time series of the average distance of the utility generated by the LLMs to the utility from the average recommendation of the bankers

Fazit

Die Studie ergab, dass ChatGPT und Bard oft ähnliche Risikoprofile wie Bankberater erstellten, wobei in etwa der Hälfte der Fälle keine signifikanten Unterschiede und insgesamt nur geringfügige wirtschaftliche Unterschiede auftraten. Dennoch stützten sich die Chatbots oft auf einfache Regeln und übersahen wichtige Kundendetails.

Das bedeutet, dass sie Finanzberater nicht ersetzen können, aber als zweite Meinung herangezogen werden könnten.

Mehr Information:

Hens, Thorsten and Nordlie, Trine (2025). How good are LLMs in risk profiling?, https://doi.org/10.1016/j.frl.2025.108102

 

Photoquelle: Canva