Direkt zum Inhalt

Bauer, Andreas ; Wolff, Christian

Using Stream Features for Instant Document Filtering

Bauer, Andreas und Wolff, Christian (2012) Using Stream Features for Instant Document Filtering. In: The Twenty-First Text REtrieval Conference (TREC 2012). NIST Special Publication: SP 500-298, 6.-9.11.2012, Gaithersburg, MD.

Veröffentlichungsdatum dieses Volltextes: 03 Mai 2013 05:18
Konferenz- oder Workshop-Beitrag
DOI zum Zitieren dieses Dokuments: 10.5283/epub.28090

[img]
Vorschau

Originalversion TREC12 Proceedings NIST
Veröffentlichte Version
Download ( PDF | 350kB)

Zusammenfassung

In this paper, we discuss how event processing technologies can be employed for real-time text stream processing and information filtering in the context of the TREC 2012 microblog task. After introducing basic characteristics of stream and event processing, the technical architecture of our text stream analysis engine is presented. Employing well-known term weighting schemes from ...

In this paper, we discuss how event processing technologies can be employed for real-time text stream processing and information filtering in the context of the TREC 2012 microblog task. After introducing basic characteristics of stream and event processing, the technical architecture of our text stream analysis engine is presented. Employing well-known term weighting schemes from document-centric text retrieval for temporally dynamic text streams is discussed next, giving details of the ESPER Event Processing Agents (EPAs) we have implemented for this task. Finally, we describe our experimental setup, give details on the TREC microblog runs as well as the result thereafter with our system including some extensions and give a short interpretation of the evaluation results.



Beteiligte Einrichtungen


Details

DokumentenartKonferenz- oder Workshop-Beitrag (Paper)
Verlag:NIST
DatumNovember 2012
InstitutionenSprach- und Literatur- und Kulturwissenschaften > Institut für Information und Medien, Sprache und Kultur (I:IMSK) > Lehrstuhl für Medieninformatik (Prof. Dr. Christian Wolff)
Informatik und Data Science > Fachbereich Menschzentrierte Informatik > Lehrstuhl für Medieninformatik (Prof. Dr. Christian Wolff)
Klassifikation
NotationArt
H.2.4CCS
H.2.8CCS
H.3.3CCS
Stichwörter / Keywordsinformation retrievalinformation filtering event processing web2.0 text streams real-time search tf/idf okapi stream features
Dewey-Dezimal-Klassifikation000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik
StatusVeröffentlicht
BegutachtetJa, diese Version wurde begutachtet
An der Universität Regensburg entstandenJa
URN der UB Regensburgurn:nbn:de:bvb:355-epub-280901
Dokumenten-ID28090

Bibliographische Daten exportieren

Nur für Besitzer und Autoren: Kontrollseite des Eintrags

nach oben