Kleines Werkzeug, große Wirkung

Wenn digitale Bildbestände in jahrelanger Arbeit mit unterschiedlichen Personen aufgebaut wurden, dann bleibt es nicht aus, dass sich auch Dubletten ergeben. Diese redundanten Datensätze sind natürlich jedem/r Datenkurator/in ein Dorn im Auge und er oder sie wird bei jedem Befund versuchen, die entsprechenden Datensätze zu verschmelzen oder zu löschen. Sobald eine gewisse Masse an Abbildungen erreicht wurde, bleibt das Auffinden dieser Dubletten häufig dem Zufall überlassen oder ergibt sich aus Hinweisen von Nutzer*innen. Dank der großen Entwicklungen im Bereich der Bildähnlichkeitssuche kann dem Thema nun aber auch systematischer begegnet werden. So z.B. mit dem similARiTy-Tool, welches auf Grundlage von percepual hashing und BK-tree zwei Konvolute von digitalen Bildern miteinander vergleicht. Dazu wird zunächst je zu vergleichendem Verzeichnis ein json-File erzeugt, die dann miteinander verglichen werden. Voraussetzungen der Nutzung dieses command-line-Werkzeugs sind python und imagemagick.

Ergebnis des Bildvergleichs (output als html-Datei).

In Zukunft verbunden! Digital Humanities & digitale Forschungsinfrastrukturen aus Sicht der Max Weber Stiftung

„Bereits etablierte Kooperationen veranschaulichen das ganzheitliche Konzept: So wird die am DFK Paris mitentwickelte Graphdatenbank ConedaKOR von DARIAH als Dienstangebot anderen Projekten und Einrichtungen zur Verfügung gestellt“

In Zukunft verbunden

 

Migration von easyDB zu ConedaKOR im DFK Paris

Als einzigem kunsthistorisches Forschungsinstitut innerhalb der Max Weber Stiftung kommt dem Deutschen Forum für Kunstgeschichte in Paris (DFK Paris) vielleicht auf mehreren Ebenen eine spezifische Rolle zu. Ganz bestimmt aber dort, wo es um Forschungsdaten geht, denn die Arbeit mit digitalen Repräsentanten der Werke der Kunst- und Kulturgeschichte steht hier zumeist im Mittelpunkt des Interesses. Und so ist es auch wenig verwunderlich, dass der Ersatz der bis dato eingesetzten kommerziellen Bilddatenbanksoftware durch das graphbasierte Datenbanksystem „ConedaKOR“ (Open Source-Software) erfolgte, mit dem differenzierter und modularer auf die speziellen Anforderungen der Fachwissenschaft reagiert werden kann. Neben der reinen Verwaltung von Abbildungen geht es hier auch um die Darstellung von Wissenszusammenhängen und somit wurde während der Migration der Altbestände in das neue System direkt eine Implementierung des „CIDOC Conceptual Reference Model durchgeführt, einer formalisierten Ontologie des Ausschusses für Dokumentation im Internationalen Museumsrat.

ConedaKOR dient nun in mehreren Projekten als „Rückgrat“ im Backend und ist auch perspektivisch gesehen bereits fester Bestandteil von diversen Forschungsvorhaben.