Transkribus

aus GenWiki, dem genealogischen Lexikon zum Mitmachen.
Zur Navigation springen Zur Suche springen

Transkribus ist eine Plattform zur Texterkennung, Layout-Analyse und Strukturerkennung von historischen Dokumenten.

Sie ist frei zugänglich und wird derzeit (Dez 2025) von mehr als 200.000 registrierten Benutzern verwendet. Die Plattform entstand im Rahmen der EU-Projekte tranScriptorium (2013–2015) und READ (Recognition and Enrichment of Archival Documents – 2016–2019). Sie wurde von der Universität Innsbruck bzw. der Gruppe Digitalisierung und elektronische Archivierung entwickelt. Seit dem 1. Juli 2019 wird die Plattform von der Europäischen Genossenschaft READ-COOP betrieben und weiterentwickelt.

In der Plattform sind Tools verschiedener Forschungsgruppen aus ganz Europa integriert.


Transkribus bietet Werkzeuge, um:

  • handschriftliche oder gedruckte Texte aus Digitalisaten zu transkribieren,
  • mit HTR-Modellen (Handwritten Text Recognition) automatisch erkennen zu lassen,
  • den Text anschließend manuell zu korrigieren,
  • sowie Personen, Orte und Daten zu markieren (Tagging), um Inhalte später gezielt durchsuchen und auswerten zu können.

Transkribus Ökosystem

Transkribus (Web-App)

Transkribus ermöglicht die automatische Erkennung von Texten aus historischen Dokumenten, die einfache Bearbeitung, kollaboratives Arbeiten und das Training eigener KI-Modelle für die Digitalisierung und Interpretation unterschiedlichster Quellen.

Die Plattform unterstützt:

  • KI-Texterkennung: Automatische Entzifferung handgeschriebener und gedruckter Dokumente.
  • Eigene KI-Modelle trainieren: Erstellung von Modellen, die speziell auf individuelle Handschriften oder Layouts zugeschnitten sind.
  • Feld- und Tabellenerkennung: Strukturanalyse von Dokumenteninhalten.
  • Leistungsstarker Text-Editor: Korrektur, Annotation und Anreicherung mit Metadaten.
  • Veröffentlichung und Suche: Integration mit Transkribus Sites für Online-Zugriff, Volltext- und Fuzzy-Suche sowie Tagging.

Transkribus rationalisiert den Arbeitsprozess, erleichtert die Verarbeitung großer Mengen von Dokumenten und fördert die Zusammenarbeit innerhalb von Projekten. Durch die Nutzung von KI können ehemals schwer zugängliche Sammlungen jetzt gelesen, durchsucht und für Forschung, Analyse oder Veröffentlichung vorbereitet werden.

Transkribus Expert (Desktop-Installation)

Leistungsfähige Anwendung für fortgeschrittene Benutzer, besonders für Layout-Erstellung, HTR-Training und große Dokumentensammlungen.

Wird nicht mehr fortgeführt.

Transkribus Sites

Transkribus Sites ermöglicht die Online-Veröffentlichung von in Transkribus bearbeiteten Dokumenten in Form durchsuchbarer digitaler Sammlungen. Ohne Programmierkenntnisse oder eigene IT-Infrastruktur können ganze Bestände öffentlich oder für ausgewählte Nutzergruppen zugänglich gemacht werden.

Die Plattform bietet Volltext- und Unschärfesuche (Fuzzy Search), sodass Inhalte auch bei Schreibvarianten, Tippfehlern oder Abweichungen im Text auffindbar bleiben. Digitale Transkriptionen und die zugehörigen Originalbilder werden dabei in einer Seite-an-Seite-Ansicht dargestellt, was eine transparente und quellennahe Nutzung ermöglicht.

Transkribus Sites ist nahtlos in Transkribus integriert: Dokumente werden dort transkribiert und korrigiert und können anschließend direkt online veröffentlicht werden. Die Sammlungen sind über Desktop- und mobile Endgeräte zugänglich und lassen sich in Inhalt und Erscheinungsbild an die Anforderungen eines Projekts oder die visuelle Identität einer Institution anpassen.

Transkribus API (Metagrapho)

Die Metagrapho API von Transkribus ermöglicht die Extraktion von Text- und Layoutinformationen aus handschriftlichen und gedruckten Dokumenten und lässt sich nahtlos in bestehende Workflows oder eigene Anwendungen integrieren. Sie bietet Zugang zu allen KI-Modellen, die im Rahmen von Transkribus trainiert wurden, und unterstützt sowohl die schnelle Texterkennung als auch die Entwicklung neuer Anwendungen.

Mit der API können Entwickler:innen:

  • Text- und Layoutinformationen aus Dokumentbildern extrahieren,
  • eigene Software oder Tools um KI-gestützte Handschrifterkennung erweitern,
  • hohe Verarbeitungskapazitäten nutzen, z. B. über die Fast-Lane-Option für rund 8.000 Bilder pro Tag.

Die API ist darauf ausgelegt, die HTR-Technologie von Transkribus einfach in externe Projekte einzubinden, sodass sich Nutzer:innen auf ihre Kernanwendungen konzentrieren können, während die Texterkennung zuverlässig im Hintergrund läuft.

ScanTent

Das ScanTent ist eine portable Lösung zum zuverlässigen Scannen von Dokumenten mit dem Smartphone, auch außerhalb des Büros oder Archivs. Das leichte, faltbare Zelt lässt sich schnell aufstellen und bietet optimale Bedingungen für die Fotografie handschriftlicher und gedruckter Dokumente. Eine eingebaute LED-Beleuchtung unterstützt die Bildqualität, während der spezielle Fotostoff des Zelts das vorhandene Licht streut.

Mit dem ScanTent können Nutzer:innen:

  • Dokumente in hoher Qualität fotografieren,
  • ihr eigenes Smartphone verwenden,
  • schnell und flexibel scannen, auch unterwegs.

Es ergänzt Transkribus, indem es qualitativ hochwertige Vorlagen für die Texterkennung bereitstellt und den Workflow der Digitalisierung erleichtert.

READ-Coop

READ-COOP ist eine missionsorientierte Genossenschaft, die mit Transkribus eine umfassende Plattform zur Zugänglichkeit historischer Dokumente bereitstellt. Sie unterstützt den gesamten Arbeitsprozess – vom Digitalisieren und der KI-gestützten Texterkennung über die Bearbeitung bis hin zur Veröffentlichung und Recherche. Im Mittelpunkt stehen Zusammenarbeit mit der wissenschaftlichen und kulturellen Erbe-Gemeinschaft, offener Zugang zu historischen Quellen sowie soziale Verantwortung. Gewinne werden nicht an Aktionäre ausgeschüttet, sondern in die Weiterentwicklung der Technologie, die Community und Bildungs- sowie Gemeinwohlprojekte reinvestiert. Dabei legt READ-COOP Wert auf nachhaltige Innovation, flexible Werkzeuge und eine verantwortungsvolle Nutzung moderner KI-Technologien.

Vorträge auf YouTube

YouTube Channel von Transkribus:

https://www.youtube.com/@transkribus

-> Verschiedene Anleitungsvideos und Webinaraufzeichnungen in Deutsch, Englisch, Französich, etc…

-> Vorsicht: Sowohl im Hilfe Center von Transkribus als auch im YouTube Channel gibt es verschiedene Anleitungen und Videos für die Web-App als auch die Desktop-App! Die Desktop-App wird nicht mehr weiterentwickelt, da alle Funktionen in die Web-App überführt werden sollen.

Hilfreiche Videos für komplexere Einzelthemen (Englisch):

CompGen Projekte mit Transkribus

Berleburger Weinkaufsbriefe

Das Projekt „Berleburger Weinkaufbriefe“ ist ein gemeinsames Vorhaben des Vereins für Computergenealogie (CompGen) in Kooperation mit Transkribus und dem Landesarchiv NRW Abteilung Westfalen.

Ziel ist die Transkription und Erschließung von rund 7000 Eheverträgen aus der Grafschaft Sayn-Wittgenstein-Berleburg (1740–1810).

Die Dokumente liegen bereits als Digitalisate vor und werden in Transkribus mit Hilfe von HTR-Modellen (Handwritten Text Recognition) automatisch erfasst, manuell korrigiert und anschließend durch Tagging strukturiert.

Die gewonnenen Daten (Personen, Orte, Daten) sollen später über das Daten-Erschließungs-System (DES) durchsuchbar und mit externen genealogischen Quellen, wie dem Ortsfamilienbuch Wittgensteiner Land, verknüpft werden.

Neben den extrahierten Daten kann auch der transkribierte Volltext über eine Volltextsuche zugänglich gemacht werden.

Weitere Informationen:

Transkribus Team zur Datenerfassung für CompGen

Das Transkribus-Team zur Datenerfassung für CompGen ist die zentrale Arbeits- und Koordinationsgruppe des Vereins für Computergenealogie (CompGen) für alle Projekte, die mit der Transkribus-Plattform arbeiten.

Die Gruppe dient als Austausch- und Anlaufstelle für alle Interessierten, die sich mit der Erkennung, Transkription und Erschließung historischer Dokumente mithilfe von Transkribus beschäftigen.

Zu den Aufgaben der Gruppe gehören:

  • Unterstützung und Erfahrungsaustausch bei der Nutzung von Transkribus
  • Koordination und Organisation laufender und zukünftiger Transkribus-Projekte innerhalb von CompGen
  • Entwicklung gemeinsamer Arbeitsrichtlinien und Schulungsmaterialien
  • Förderung der Zusammenarbeit zwischen Freiwilligen, Archiven und Forschungseinrichtungen

Das Team steht allen offen, die an der digitalen Erschließung historischer Quellen mitarbeiten oder Transkribus kennenlernen möchten – unabhängig von Vorkenntnissen oder Vereinsmitgliedschaft.

Weitere Informationen und der Zugang zur Gruppe sind über das CompGen-Teamportal zu finden:

-> Transkribus-Team zur Datenerfassung für CompGen

(Wichtiger Hinweis: Da die Nachrichtenfunktion in Team momentan nicht funktioniert bitte bei Interesse eine E-Mail an jasminriegler@stories-through-time.de oder fotoingrid18@gmail.com schreiben. Kommentarlose Anfrage werden nicht beantwortet!)

Web-Links

Website Transkribus (Englisch)

Deutschsprachige Benutzeranleitung für Transkribus

READ-COOP (Englisch)