Video: Dein eigenes Internetarchiv mit ArchiveBox

  Lioh Möller   Lesezeit: 5 Minuten  🗪 3 Kommentare Auf Mastodon ansehen

In diesem Video zeige ich dir Schritt für Schritt, wie du mit ArchiveBox deine eigenen Schnappschüsse von Webseiten speichern kannst. Egal, ob du interessante Artikel, wichtige Informationen oder einfach nur Erinnerungen festhalten möchtest – mit ArchiveBox hast du die volle Kontrolle über deine digitale Sammlung!

video: dein eigenes internetarchiv mit archivebox

Vielleicht kennst du schon die Wayback Machine auf archive.org, die es uns ermöglicht, frühere Versionen von Webseiten zu durchstöbern – egal, ob sie noch aktiv sind oder bereits offline gegangen sind.

Kürzlich kam es jedoch zu einem Angriff auf das Internet Archive, der die Verfügbarkeit stark beeinträchtigt hat.

Abhilfe schaffen kann da, dein eigenes Internet-Archiv mit der ArchiveBox zu erstellen.

ArchiveBox einrichten

Ihr findet die Software auf archivebox.io. Ich empfehle, die Installation über Docker Compose durchzuführen, da dies eine flexible und sichere Methode ist, um die Software zu verwalten. Zuerst müsst ihr Docker installieren, was auf einer Debian-basierten Linux-Distribution ganz einfach ist. Denkt daran, euren Benutzer zur Docker-Gruppe hinzuzufügen, damit ihr die Docker-Befehle ausführen könnt.

Nach der Installation von Docker erstellt ihr ein Verzeichnis für ArchiveBox und ladet die notwendige Docker-Compose-Datei herunter. Im initialen Setup legt ihr dann einen Admin-Benutzernamen und ein Passwort fest.

Sobald ArchiveBox eingerichtet ist, könnt ihr es mit dem Befehl 'docker-compose up' starten. Der Zugriff erfolgt über die Adresse localhost auf Port 8000. Standardmäßig lauscht die ArchiveBox auf allen Netzwerkinterfaces, nicht nur auf localhost. Das bedeutet, dass es im lokalen Netzwerk zugänglich ist. Wenn ihr den Zugriff auf localhost beschränken möchtet, empfehle ich, die Docker-Compose-Datei entsprechend anzupassen.

In der Weboberfläche von ArchiveBox habt ihr die Möglichkeit, URLs oder ganze RSS-Feeds zur Archivierung hinzuzufügen. Der Prozess ist ähnlich wie bei der Wayback Machine, und ArchiveBox ermöglicht es euch, Snapshots von Webseiten zu erstellen, die ihr jederzeit abrufen könnt. Fügt einfach die Webseiten hinzu, die euch interessieren, um ein umfassendes Archiv eurer Lieblingsinhalte zu erstellen.

Viel Spaß beim Erstellen eures eigenen Internetarchivs und gebt mir gerne euer Feedback!

TuxWiz

Hast du Lust, das Linux-Betriebssystem auf eine unterhaltsame Weise kennenzulernen? Dann schau unbedingt auf meinem YouTube-Kanal TuxWiz vorbei! ✨

Ich habe speziell für Einsteiger eine Playlist erstellt, die dich Schritt für Schritt durch die aufregende Welt von Linux und Freier Software führt. Also starte von Anfang an – du wirst sehen, wie viel Spass es macht!

Die Linux-Lernvideos bauen auf meiner Debian GNU/Linux basierenden Distribution SpaceFun auf. Viele der bei Einsteiger_innen beliebten Linux-Distros wie Mint, MX Linux oder Ubuntu stammen ebenfalls aus dieser kosmischen Familie. Falls du eine andere Distro nutzt, keine Sorge – die grundlegenden Mechanismen sind universell und lassen sich problemlos übertragen.

Ich freue mich auch, wenn du mir auf Mastodon folgst. Dort erfährst du immer sofort, wenn es etwas Neues zu entdecken gibt.

Mein Kanal auf YouTube: https://www.youtube.com/@tuxwiz

Die Einsteiger-Playlist: https://www.youtube.com/playlist?list=PLJlnbs0kQiZiWks57CPOoCOnUlFwbZWQp

Tags

Archive, ArchiveBox, Docker, HowTo

Peregrinus
Geschrieben von Peregrinus am 30. November 2024 um 20:26

Ist das die Software, die auch auf conifer.rhizome.org oder ghostarchive.org zum Einsatz kommt? Dort gibt es einen sogenannten „Webrecorder“, der warc-Dateien unterstützt. Das sind wohl irgendwelche Webarchive. Das Archivieren von Websites ist nicht unwichtig, gerade in der heutigen Zeit, da aufgrund von politischem Druck vieles, das es 2016 noch gab, inzwischen gelöscht scheint. Hatte von dem Projekt schon öfter gehört; Klasse wäre es natürlich, wenn solche Archive öffentlich zugänglich gemacht würden. Das archive.today-Projekt setzt, wenn ich nicht falsch liege, auf eine eigene Softwarelösung, braucht aber Unmengen an Ressourcen, was wohl irgendwann ein Probem weden dürfte, steckt doch dahinter nur ein russischer IT-Mann aus New York (soweit ich weiß).

Fragesteller
Geschrieben von Fragesteller am 2. Dezember 2024 um 08:39

Hallo Lioh,

du nutzt in den Anleitungen scheinbar bevorzugt Docker. Hat das einen Grund? Warum nutzt du bei Archivebox nicht apt?

Lioh Möller
Geschrieben von Lioh Möller am 2. Dezember 2024 um 15:01

An Docker schätze ich die Portabilität. Ich kann, wenn ich es richtig einrichte, einfach das komplette Verzeichnis sichern und auf einer anderen Maschine, ja sogar auf einer anderen Distribution wieder starten.