Direkt zum Inhalt

Quasthoff, Uwe ; Wolff, Christian

Effizientes Dokumentenclustering durch niederfrequente Terme

Quasthoff, Uwe und Wolff, Christian (1998) Effizientes Dokumentenclustering durch niederfrequente Terme. Datenbank Rundbrief (hier: Proc. GI-Workshop „Softwareagenten, Datenbanken und IR“ (VDI-98) TU Chemnitz.) 21, S. 74-77.

Veröffentlichungsdatum dieses Volltextes: 17 Sep 2009 09:50
Artikel
DOI zum Zitieren dieses Dokuments: 10.5283/epub.6847


Zusammenfassung

In diesem Papier wird ein statistisches IR-Verfahren vorgestellt, mit dem sich ähnliche Dokumente in umfangreichen Kollektionen effektiv ermitteln lassen. Das Verfahren erwendet als Deskriptoren ausschließlich niederfrequente Terme. Die zur Dokumentbeschreibung benutzten Dokumentvektoren sind schwach besetzt (sparse vectors) und erlauben effiziente Berechnungsverfahren. Die Ermittlung geeigneter ...

In diesem Papier wird ein statistisches IR-Verfahren vorgestellt, mit dem sich ähnliche Dokumente in umfangreichen Kollektionen effektiv ermitteln lassen. Das Verfahren erwendet als Deskriptoren ausschließlich niederfrequente Terme. Die zur Dokumentbeschreibung benutzten Dokumentvektoren sind schwach besetzt (sparse vectors) und erlauben effiziente Berechnungsverfahren.

Die Ermittlung geeigneter Deskriptoren zieht als zusätzliche Informationsquelle eine umfangreiche Datenbank mit Frequenzinformation heran.



Beteiligte Einrichtungen


Details

DokumentenartArtikel
Titel eines Journals oder einer ZeitschriftDatenbank Rundbrief (hier: Proc. GI-Workshop „Softwareagenten, Datenbanken und IR“ (VDI-98) TU Chemnitz.)
Verlag:GI-Fachgruppe 2.5.1 Datenbanksysteme
Band:21
Seitenbereich:S. 74-77
DatumMai 1998
InstitutionenSprach- und Literatur- und Kulturwissenschaften > Institut für Information und Medien, Sprache und Kultur (I:IMSK) > Lehrstuhl für Medieninformatik (Prof. Dr. Christian Wolff)
Informatik und Data Science > Fachbereich Menschzentrierte Informatik > Lehrstuhl für Medieninformatik (Prof. Dr. Christian Wolff)
Klassifikation
NotationArt
H.3.1CCS
H.3.3CCS
Stichwörter / KeywordsClustering; Dokumentvektoren; sparse vectors; niederfrequente Terme
Dewey-Dezimal-Klassifikation400 Sprache > 400 Sprachwissenschaft, Linguistik
000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik
StatusVeröffentlicht
BegutachtetJa, diese Version wurde begutachtet
An der Universität Regensburg entstandenNein
URN der UB Regensburgurn:nbn:de:bvb:355-epub-68472
Dokumenten-ID6847

Bibliographische Daten exportieren

Nur für Besitzer und Autoren: Kontrollseite des Eintrags

nach oben