Direkt zum Inhalt

Mielke, Bettina ; Wolff, Christian

„KI, lös‘ mir den Fall!“ Zur Evaluierung grosser Sprachmodelle für Anwendungen im deutschsprachigen Rechtswesen

Mielke, Bettina und Wolff, Christian (2025) „KI, lös‘ mir den Fall!“ Zur Evaluierung grosser Sprachmodelle für Anwendungen im deutschsprachigen Rechtswesen. In: Schweighofer, Erich und Eder, Stefan und Constantini, Federico und Schmautzer, Jakob, (eds.) Der Mensch im Zentrum - KI, Ethik & Recht / Human-Centred AI for Good - AI, Ethics & Law. Proceedings des 28. Internationalen Rechtsinformatiksymposions IRIS 2025. Editions Weblaw, Bern, S. 137-146.

Veröffentlichungsdatum dieses Volltextes: 20 Mrz 2025 15:43
Buchkapitel
DOI zum Zitieren dieses Dokuments: 10.5283/epub.75241


Zusammenfassung

Wir diskutieren den möglichen Einsatz großer Sprachmodelle und generativer KI im Rechtswesen und erörtern, wie sich dieser evaluieren lässt. Dazu gehen wir auf bisherige Ansätze zur Evaluierung von großen Sprachmodellen, insbesondere am Beispiel des HELM-Projektes (holistic evaluation of large language models) ein und stellen erste explorative Versuche aus dem deutschsprachigen Raum, die ...

Wir diskutieren den möglichen Einsatz großer Sprachmodelle und generativer KI im Rechtswesen und erörtern, wie sich dieser evaluieren lässt. Dazu gehen wir auf bisherige Ansätze zur Evaluierung von großen Sprachmodellen, insbesondere am Beispiel des HELM-Projektes (holistic evaluation of large language models) ein und stellen erste explorative Versuche aus dem deutschsprachigen Raum, die Leistungsfähigkeit großer Sprachmodelle zu bewerten, vor. Auf dieser Basis entwickeln wir Anforderungen an eine systematische Methodik für künftige Evaluierungsstudien.



Beteiligte Einrichtungen


Details

DokumentenartBuchkapitel
Buchtitel:Der Mensch im Zentrum - KI, Ethik & Recht / Human-Centred AI for Good - AI, Ethics & Law. Proceedings des 28. Internationalen Rechtsinformatiksymposions IRIS 2025
Verlag:Editions Weblaw
Ort der Veröffentlichung:Bern
Seitenbereich:S. 137-146
Datum19 Februar 2025
InstitutionenSprach- und Literatur- und Kulturwissenschaften > Institut für Information und Medien, Sprache und Kultur (I:IMSK) > Lehrstuhl für Medieninformatik (Prof. Dr. Christian Wolff)
Informatik und Data Science > Fachbereich Menschzentrierte Informatik > Lehrstuhl für Medieninformatik (Prof. Dr. Christian Wolff)
Stichwörter / KeywordsAI KI generative KI Künstliche Intelligenz Große Sprachmodelle Large Language Models LLM Large Language Models ChatGPT GPT Evaluierung HELM LegalBench LexGPT Evaluation
Dewey-Dezimal-Klassifikation000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik
300 Sozialwissenschaften > 340 Recht
StatusVeröffentlicht
BegutachtetJa, diese Version wurde begutachtet
An der Universität Regensburg entstandenJa
URN der UB Regensburgurn:nbn:de:bvb:355-epub-752412
Dokumenten-ID75241

Bibliographische Daten exportieren

Nur für Besitzer und Autoren: Kontrollseite des Eintrags

nach oben