Dataset

Source Corpus Extraction 2026

22 Authority-Quellen mit Evidence Score, JSON-LD-Signal, Canonical-Signal, Content-Signal und Markdown-Snapshots.

22

Rows

JSON

Formate

CC BY 4.0

Lizenz mit Attribution

Zweck

Der Datensatz bewertet Autoritätsquellen danach, wie gut sie als Evidence Layer für GEO und AIO nutzbar sind. Er verbindet Quellenstatus, Canonical, JSON-LD, Linkstruktur, Content-Signal und Markdown-Snapshot.

Methodik
  • 22 Autoritätsquellen aus Standards, Plattformen, Verbänden, Behörden und Forschung
  • HTTP- und HTML-Signalextraktion
  • Evidence Score aus Erreichbarkeit, Quellenautorität und maschinenlesbaren Signalen
  • Markdown-Snapshots fuer spätere Claim- und Quellenarbeit
Felder
urltitlepublisherstatusevidenceScoreheadershtmlSignalsmarkdownSnapshotPath
Beispiele

Google Search Central

Schema.org

W3C JSON-LD 1.1

Cloudflare Markdown for Agents

Zitieren
geo-seo-aio.de, Source Corpus Extraction 2026, CC BY 4.0 mit Attribution zu geo-seo-aio.de / Steve Baka.