SkillJavaScriptv1.0.0

tageblatt-headlines

Download and archive daily Schlagzeilen from https://www.tageblatt.de/.

0 downloads
zopyx
Updated Feb 13, 2026

Tageblatt Headlines

Ăśberblick

Dieses Skill-Paket lädt die Startseite von tageblatt.de, extrahiert die sichtbaren Artikelüberschriften (<h2 class="article-heading">), bereinigt sie und speichert sie lokal als Text- oder JSON-Datei. Nutze es für Ad-hoc-Abfragen ("Schlagzeilen jetzt"), tägliche Archive oder automatisierte Benachrichtigungen.

Quick Start

  1. Headlines ziehen
    python3 skills/tageblatt-headlines/scripts/fetch_headlines.py \
      --limit 15 \
      --output data/tageblatt/$(date +%Y-%m-%d)_headlines.txt
    
  2. JSON statt Text (falls du die Daten weiterverarbeiten willst):
    python3 skills/tageblatt-headlines/scripts/fetch_headlines.py \
      --format json --output data/tageblatt/$(date +%Y-%m-%d).json
    
  3. Die Skriptausgabe wird zusätzlich auf STDOUT geloggt – perfekt, um die Liste sofort per Telegram zu senden.

Automatischer 07:00-Job

  1. Cronjob anlegen (lokale Zeit Europe/Berlin):
    openclaw cron add <<'JSON'
    {
      "name": "tageblatt-headlines-07",
      "schedule": {
        "kind": "cron",
        "expr": "0 7 * * *",
        "tz": "Europe/Berlin"
      },
      "sessionTarget": "isolated",
      "payload": {
        "kind": "agentTurn",
        "model": "default",
        "message": "Run `python3 skills/tageblatt-headlines/scripts/fetch_headlines.py --limit 15 --output data/tageblatt/$(date +%F)_headlines.txt`. Send Master the list via Telegram (bulleted) and mention where the file was saved."
      }
    }
    JSON
    
  2. Automation optionalen Versand hinzufĂĽgen: Nach erfolgreichem Lauf kann derselbe Job eine Telegram-Zusammenfassung verschicken (siehe Payload oben).
  3. Aufbewahrung: Lege data/tageblatt/ an und committe Archivdateien, falls sie langfristig gespeichert werden sollen.

Fehlerbehebung & Hinweise

  • Das Skript nutzt nur Standardbibliotheken (urllib, re). Keine zusätzlichen Pip-Abhängigkeiten nötig.
  • Falls Consent-Banner den HTML-Aufbau ändert, prĂĽfe die Regex in scripts/fetch_headlines.py (Pattern HEADING_PATTERN).
  • Bei Netzwerkfehlern gibt das Skript Exit-Code 1 zurĂĽck. Cronjobs sollten in diesem Fall automatisch beim nächsten Zyklus erneut laufen.
  • Begrenze --limit, falls du nur eine kurze Liste brauchst (z. B. Top 5).

Ressourcen

  • scripts/fetch_headlines.py – HTTP-Download & Parser fĂĽr Schlagzeilen (Text/JSON-Ausgabe, limitierbar).
Free
Installation
Reviews

Sign in to leave a review.

No reviews yet. Be the first.