Schnittstelle zum Datenexport
Sie können die gecrawlten Daten zu einer Website als XML-Datei herunterladen.
Die URL der Schnittstelle ist
Die Website-ID
steht neben dem Namen der Website in der ersten Spalte der Übersicht im
Verwaltungs-Interface.
https://sitesearch.netestate.de/WebsiteExport?benutzername=[benutzername]&passwort=[passwort]&websiteid=[websiteid]
Standardmäßig wird nur das Feld url zurückgegeben. Als optionaler Parameter kann "felder" angegeben, welcher eine kommagetrennte Liste von auszugebenden Feldnamen enthält.
XML-Ergebnis:
<?xml version="1.0" encoding="UTF-8" standalone="yes"?> <website> <record> <url> URL der Seite </url> <crawled_first> Zeitpunkt zu dem die Seite das erste Mal gecrawlt wurde. </crawled_first> <crawled_last> Zeitpunkt zu dem die Seite zum letzten Mal gecrawlt wurde. </crawled_last> <statuscode> HTTP-Statuscode als Ganzzahl </statuscode> <content_type> Content-Type </content_type> <language> Sprache </language> <modified> Zeitpunkt der letzten Modifizierung </modified> <url_text> Textinhalt der URL </url_text> <visible_text> Sichtbarer Text auf der Seite </visible_text> <invisible_text> Unsichtbarer Text auf der Seite </invisible_text> <title> Seitentitel </title> <keywords> Meta-Keywords </keywords> <description> Meta-Description </description> <sitemapcategory> Sitemap-Kategorie </sitemapcategory> <sitemaptitle> Sitemap-Titel </sitemaptitle> ...gebuchte Metafelder (XML-Elementnamen beginnen mit meta_)... </record> <record> ... ... </website>