Direkt zum Inhalt

Möller, Mark Lukas ; Berton, Nicolas ; Klettke, Meike ; Scherzinger, Stefanie ; Störl, Uta

jHound: Large-Scale Profiling of Open JSON Data

Möller, Mark Lukas, Berton, Nicolas, Klettke, Meike , Scherzinger, Stefanie und Störl, Uta (2019) jHound: Large-Scale Profiling of Open JSON Data. In: Datenbanksysteme für Business, Technologie und Web (BTW 2019), 4.-8. März 2019, Rostock, Germany.

Veröffentlichungsdatum dieses Volltextes: 02 Sep 2025 05:21
Konferenz- oder Workshop-Beitrag
DOI zum Zitieren dieses Dokuments: 10.5283/epub.77298


Zusammenfassung

We present jHound, a tool for profiling large collections of JSON data, and apply it to thousands of data sets holding open government data. jHound reports key characteristics of JSON documents, such as their nesting depth. As we show, jHound can help detect structural outliers, and most importantly, badly encoded documents: jHound can pinpoint certain cases of documents that use string-typed ...

We present jHound, a tool for profiling large collections of JSON data, and apply it to thousands of data sets holding open government data. jHound reports key characteristics of JSON documents, such as their nesting depth. As we show, jHound can help detect structural outliers, and most importantly, badly encoded documents: jHound can pinpoint certain cases of documents that use string-typed values where other native JSON datatypes would have been a better match. Moreover, we can detect certain cases of maladaptively structured JSON documents, which obviously do not comply with good data modeling practices. By interactively exploring particular example documents, we hope to inspire discussions in the community about what makes a good JSON encoding.



Beteiligte Einrichtungen


Details

DokumentenartKonferenz- oder Workshop-Beitrag (Nicht ausgewählt)
Buchtitel:Datenbanksysteme für Business, Technologie und Web BTW2019, Proceedings
Verlag:Gesellschaft für Informatik
Ort der Veröffentlichung:Bonn
Sonstige Reihe:Lecture notes in Informatics (LNI)
Band:P-289
Seitenbereich:S. 555-558
Datum2019
InstitutionenInformatik und Data Science > Allgemeine Informatik > Data Engineering (Prof. Dr.-Ing. Meike Klettke)
Projekte
Gefördert von: Deutsche Forschungsgemeinschaft (DFG) (385808805)
Identifikationsnummer
WertTyp
10.18420/btw2019-44DOI
Dewey-Dezimal-Klassifikation000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik
StatusVeröffentlicht
BegutachtetJa, diese Version wurde begutachtet
An der Universität Regensburg entstandenNein
URN der UB Regensburgurn:nbn:de:bvb:355-epub-772983
Dokumenten-ID77298

Bibliographische Daten exportieren

Nur für Besitzer und Autoren: Kontrollseite des Eintrags

nach oben