Back to Blog

Von der Doku zur Infografik: Ein KI-Abenteuer

DE

Dieser Text wurde mit Hilfe von KI aus dem Englischen übersetzt.

Ich habe mir kürzlich eine Arte-Dokumentation über den Untergang des alten Ägypten angeschaut - Der Untergang des alten Ägypten. Sie war faszinierend, vollgepackt mit Informationen, und natürlich hatte ich am nächsten Morgen die Hälfte davon wieder vergessen. Das brachte mich auf eine Idee: Könnte man eine Video-Dokumentation in eine grafische Übersicht verwandeln, die die wichtigsten Informationen so aufbereitet, dass man sie jederzeit wieder abrufen kann?

Wie sich herausstellt: Mit ein paar Werkzeugen und etwas KI geht das tatsächlich.

Die Pipeline

Die Idee ist einfach: Den gesprochenen Inhalt aus dem Video extrahieren, transkribieren und dann mit KI eine strukturierte visuelle Zusammenfassung erstellen. So habe ich es Schritt für Schritt gemacht.

Schritt 1: Das Video herunterladen. Arte stellt seine Dokumentationen in der Mediathek zur Verfügung, aber ein direkter Download ist nicht ohne Weiteres möglich. Ich habe MediathekViewWeb benutzt, um die Videodatei zu finden und herunterzuladen.

Schritt 2: Audio extrahieren. Ich brauchte nicht das Video selbst, nur den gesprochenen Inhalt. Ein kurzer ffmpeg-Befehl trennt die Audiospur aus der Videodatei:

ffmpeg -i documentary.mp4 -vn -acodec aac output.aac

Schritt 3: Transkription mit Whisper. OpenAIs Whisper-Modell leistet beeindruckende Arbeit bei der Spracherkennung, auch bei deutschem Audio. Man kann es lokal installieren und die Transkription mit nur zwei Befehlen starten:

pip install -U openai-whisper
whisper output.aac --model base

Das Ergebnis war ein überraschend genaues Transkript der gesamten Dokumentation.

Schritt 4: Die Infografik generieren. Hier wird es richtig spannend. Ich habe das Transkript in Claude eingegeben und darum gebeten, eine grafische Übersicht zu erstellen, die den Inhalt der Dokumentation zusammenfasst. Claude hat eine strukturierte, visuelle HTML-Seite generiert, die die wichtigsten Ereignisse, Zeitabläufe und Zusammenhänge aus der Dokumentation abdeckt.

Das Ergebnis ist unter content.oglimmer.com/s/egypt verfügbar, falls ihr es euch selbst ansehen wollt.

Was das Ganze so faszinierend macht

Die gesamte Pipeline - von einer zweistündigen Dokumentation zu einer teilbaren visuellen Zusammenfassung - hat vielleicht 30 Minuten aktive Arbeit gekostet. Das meiste davon war Warten auf die Transkription. Die eigentliche kreative und analytische Schwerstarbeit wurde von KI erledigt.

Was mich am meisten überrascht hat, war die Qualität. Das Transkript hat die Erzählung genau erfasst, und Claude hat hervorragend die wichtigen Themen extrahiert, sie visuell aufbereitet und so präsentiert, dass es wirklich hilft, den Inhalt zu verstehen und zu behalten.

Ist das das Ende der Schulbücher?

Dieses Experiment wirft eine größere Frage auf. Wenn jeder eine Dokumentation, eine Vorlesung oder beliebige andere Bildungsinhalte nehmen und in wenigen Minuten in personalisiertes Lernmaterial verwandeln kann - was bedeutet das für traditionelle Bildungsmedien?

Heute nutzen Schüler und Studenten Lehrbücher, die vor Jahren geschrieben wurden, für ein allgemeines Publikum konzipiert sind und in langsamen Publikationszyklen aktualisiert werden. Aber die Werkzeuge existieren bereits, um eigenes Lernmaterial zu erstellen. Eine Dokumentation schauen, eine Vorlesung besuchen, ein Paper lesen - und dann mit KI Zusammenfassungen, Infografiken, Karteikarten oder welches Format auch immer am besten zum eigenen Lernstil passt, generieren.

Das Material wird nicht mehr nur konsumiert. Es wird transformiert, personalisiert und zu etwas Eigenem gemacht. Das ist ein fundamental anderes Verhältnis zu Bildungsinhalten.

Ich sage nicht, dass Schulbücher morgen verschwinden werden. Aber die Richtung ist klar: Die Zukunft des Lernmaterials ist persönlich, KI-gestützt und on demand erstellt. Das Internet liefert die Rohinhalte. KI liefert die Transformation. Der Lernende bestimmt das Format.

Das ist ein faszinierender Wandel, und wir stehen erst am Anfang.