Source Corpus Extraction 2026
22 Authority-Quellen mit Evidence Score, JSON-LD-Signal, Canonical-Signal, Content-Signal und Markdown-Snapshots.
22
Rows
JSON
Formate
CC BY 4.0
Lizenz mit Attribution
Zweck
Der Datensatz bewertet Autoritätsquellen danach, wie gut sie als Evidence Layer für GEO und AIO nutzbar sind. Er verbindet Quellenstatus, Canonical, JSON-LD, Linkstruktur, Content-Signal und Markdown-Snapshot.
Methodik
- 22 Autoritätsquellen aus Standards, Plattformen, Verbänden, Behörden und Forschung
- HTTP- und HTML-Signalextraktion
- Evidence Score aus Erreichbarkeit, Quellenautorität und maschinenlesbaren Signalen
- Markdown-Snapshots fuer spätere Claim- und Quellenarbeit
Felder
urltitlepublisherstatusevidenceScoreheadershtmlSignalsmarkdownSnapshotPath
Beispiele
Google Search Central
Schema.org
W3C JSON-LD 1.1
Cloudflare Markdown for Agents
geo-seo-aio.de, Source Corpus Extraction 2026, CC BY 4.0 mit Attribution zu geo-seo-aio.de / Steve Baka.