Direkt zum Inhalt

Schmid, Andreas ; Heckelbacher, Lorenz ; Wimmer, Raphael

Extracting Handwritten Annotations from Printed Documents Via Infrared Scanning

Schmid, Andreas , Heckelbacher, Lorenz und Wimmer, Raphael (2022) Extracting Handwritten Annotations from Printed Documents Via Infrared Scanning. In: CHI Conference on Human Factors in Computing SystemsExtended Abstracts (CHI ’22 Extended Abstracts), April 29 - May 5, 2022, New Orleans, LA, USA.

Veröffentlichungsdatum dieses Volltextes: 28 Okt 2022 14:45
Konferenz- oder Workshop-Beitrag
DOI zum Zitieren dieses Dokuments: 10.5283/epub.53129


Zusammenfassung

Despite ever improving digital ink and paper solutions, many people still prefer printing out documents for close reading, proofreading, or filling out forms. However, in order to incorporate paper-based annotations into digital workflows, handwritten text and markings need to be extracted. Common computer-vision and machine-learning approaches require extensive sets of training data or a clean ...

Despite ever improving digital ink and paper solutions, many people still prefer printing out documents for close reading, proofreading, or filling out forms. However, in order to incorporate paper-based annotations into digital workflows, handwritten text and markings need to be extracted. Common computer-vision and machine-learning approaches require extensive sets of training data or a clean digital version of the document. We propose a simple method for extracting handwritten annotations from laser-printed documents using multispectral imaging. While black toner absorbs infrared light, most inks are invisible in the infrared spectrum. We modified an off-the-shelf flatbed scanner by adding a switchable infrared LED to its light guide. By subtracting an infrared scan from a color scan, handwritten text and highlighting can be extracted and added to a PDF version. Initial experiments show accurate results with high quality on a test data set of 93 annotated pages. Thus, infrared scanning seems like a promising building block for integrating paper-based and digital annotation practices.



Beteiligte Einrichtungen


Details

DokumentenartKonferenz- oder Workshop-Beitrag (Poster)
Verlag:Association for Computing Machinery
Seitenbereich:Art. no. 363
Datum29 April 2022
Zusätzliche Informationen (Öffentlich)erschienen in: Barbosa, Simone: CHI Conference on Human Factors in Computing Systems Extended Abstracts. New York: Association for Computing Machinery, 2022, ISBN 978-1-4503-9156-6
InstitutionenSprach- und Literatur- und Kulturwissenschaften > Institut für Information und Medien, Sprache und Kultur (I:IMSK) > Lehrstuhl für Medieninformatik (Prof. Dr. Christian Wolff)
Informatik und Data Science > Fachbereich Menschzentrierte Informatik > Lehrstuhl für Medieninformatik (Prof. Dr. Christian Wolff)

Sprach- und Literatur- und Kulturwissenschaften > Institut für Information und Medien, Sprache und Kultur (I:IMSK) > Lehrstuhl für Medieninformatik (Prof. Dr. Christian Wolff) > Physical-Digital Affordances (Dr. Raphael Wimmer)
Informatik und Data Science > Fachbereich Menschzentrierte Informatik > Lehrstuhl für Medieninformatik (Prof. Dr. Christian Wolff) > Physical-Digital Affordances (Dr. Raphael Wimmer)
Informatik und Data Science > Fachbereich Menschzentrierte Informatik > Physical-Digital Affordances (Dr. Raphael Wimmer)
Identifikationsnummer
WertTyp
10.1145/3491101.3519872DOI
Verwandte URLs
URLURL Typ
https://hci.uni-regensburg.de/projects/infrared_scanProjekt
Stichwörter / Keywordsannotation extraction, multispectral imaging, computer vision
Dewey-Dezimal-Klassifikation000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik
StatusVeröffentlicht
BegutachtetUnbekannt / Keine Angabe
An der Universität Regensburg entstandenJa
URN der UB Regensburgurn:nbn:de:bvb:355-epub-531293
Dokumenten-ID53129

Bibliographische Daten exportieren

Nur für Besitzer und Autoren: Kontrollseite des Eintrags

nach oben