Schnittstelle zum Datenexport
Sie können die gecrawlten Daten zu einer Website als XML-Datei herunterladen.
Die URL der Schnittstelle ist
Die Website-ID
steht neben dem Namen der Website in der ersten Spalte der Übersicht im
Verwaltungs-Interface.
https://sitesearch.netestate.de/WebsiteExport?benutzername=[benutzername]&passwort=[passwort]&websiteid=[websiteid]
Standardmäßig wird nur das Feld url zurückgegeben. Als optionaler Parameter kann "felder" angegeben, welcher eine kommagetrennte Liste von auszugebenden Feldnamen enthält.
XML-Ergebnis:
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<website>
<record>
<url> URL der Seite </url>
<crawled_first> Zeitpunkt zu dem die Seite das erste Mal gecrawlt wurde. </crawled_first>
<crawled_last> Zeitpunkt zu dem die Seite zum letzten Mal gecrawlt wurde. </crawled_last>
<statuscode> HTTP-Statuscode als Ganzzahl </statuscode>
<content_type> Content-Type </content_type>
<language> Sprache </language>
<modified> Zeitpunkt der letzten Modifizierung </modified>
<url_text> Textinhalt der URL </url_text>
<visible_text> Sichtbarer Text auf der Seite </visible_text>
<invisible_text> Unsichtbarer Text auf der Seite </invisible_text>
<title> Seitentitel </title>
<keywords> Meta-Keywords </keywords>
<description> Meta-Description </description>
<sitemapcategory> Sitemap-Kategorie </sitemapcategory>
<sitemaptitle> Sitemap-Titel </sitemaptitle>
...gebuchte Metafelder (XML-Elementnamen beginnen mit meta_)...
</record>
<record>
...
...
</website>
