Startseite UR

Effizientes Dokumentenclustering durch niederfrequente Terme

URN zum Zitieren dieses Dokuments: urn:nbn:de:bvb:355-epub-68472

Quasthoff, Uwe und Wolff, Christian (1998) Effizientes Dokumentenclustering durch niederfrequente Terme. Datenbank Rundbrief (hier: Proc. GI-Workshop „Softwareagenten, Datenbanken und IR“ (VDI-98) TU Chemnitz.) 21, S. 74-77.

[img]
Vorschau
PDF
Download (92kB)

Andere URL zum Volltext: http://wortschatz.uni-leipzig.de/Papers/Dokumentenclustering.pdf


Zusammenfassung

In diesem Papier wird ein statistisches IR-Verfahren vorgestellt, mit dem sich ähnliche Dokumente in umfangreichen Kollektionen effektiv ermitteln lassen. Das Verfahren erwendet als Deskriptoren ausschließlich niederfrequente Terme. Die zur Dokumentbeschreibung benutzten Dokumentvektoren sind schwach besetzt (sparse vectors) und erlauben effiziente Berechnungsverfahren. Die Ermittlung geeigneter ...

plus


Bibliographische Daten exportieren



Dokumentenart:Artikel
Datum:Mai 1998
Institutionen:Sprach- und Literatur- und Kulturwissenschaften > Institut für Information und Medien, Sprache und Kultur (I:IMSK) > Lehrstuhl für Medieninformatik
Klassifikation:
NotationArt
H.3.1CCS
H.3.3CCS
Stichwörter / Keywords:Clustering; Dokumentvektoren; sparse vectors; niederfrequente Terme
Dewey-Dezimal-Klassifikation:400 Sprache > 400 Sprachwissenschaft, Linguistik
000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik
Status:Veröffentlicht
Begutachtet:Ja, diese Version wurde begutachtet
An der Universität Regensburg entstanden:Nein
Eingebracht am:17 Sep 2009 09:50
Zuletzt geändert:04 Jun 2018 09:48
Dokumenten-ID:6847
Nur für Besitzer und Autoren: Kontrollseite des Eintrags

Downloads

Downloads im Monat während des letzten Jahres

  1. Universität

Universitätsbibliothek

Publikationsserver

Kontakt:

Publizieren: oa@ur.de

Dissertationen: dissertationen@ur.de

Forschungsdaten: daten@ur.de

Ansprechpartner