/ / Pobierz wszystkie określone tagi z XML strony internetowej do listy (C #) - c #, xml, linq

Pobierz wszystkie określone tagi w XML Strona WWW do listy (C #) - c #, xml, linq

Próbuję zbudować funkcję, aby wyodrębnić wszystkie elementy lokalizacji z mapy witryny.

Ta strona dokumentu XML próbuję przeczytać

<?xml version="1.0" encoding="utf-8"?><?xml-stylesheet type="text/xsl" href="http://www.topquadcoptersreviews.com/wp-content/plugins/google-sitemap-generator/sitemap.xsl"?><!-- sitemap-generator-url="http://www.arnebrachhold.de" sitemap-generator-version="4.0.8" -->
<!-- generated-on="December 24, 2015 6:26 am" -->
<sitemapindex xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap>
<loc>http://www.topquadcoptersreviews.com/sitemap-misc.xml</loc>
<lastmod>2015-12-09T03:05:04+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.topquadcoptersreviews.com/sitemap-pt-post-2015-12.xml</loc>
<lastmod>2015-12-09T03:05:04+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.topquadcoptersreviews.com/sitemap-pt-post-2015-11.xml</loc>
<lastmod>2015-11-28T09:52:03+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.topquadcoptersreviews.com/sitemap-pt-post-2015-10.xml</loc>
<lastmod>2015-10-23T11:39:16+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.topquadcoptersreviews.com/sitemap-pt-post-2015-09.xml</loc>
<lastmod>2015-09-26T11:24:49+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.topquadcoptersreviews.com/sitemap-pt-post-2015-08.xml</loc>
<lastmod>2015-08-31T12:03:10+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.topquadcoptersreviews.com/sitemap-pt-post-2015-07.xml</loc>
<lastmod>2015-08-25T11:56:33+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.topquadcoptersreviews.com/sitemap-pt-post-2015-05.xml</loc>
<lastmod>2015-12-05T06:59:11+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.topquadcoptersreviews.com/sitemap-pt-page-2015-10.xml</loc>
<lastmod>2015-10-31T11:06:37+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.topquadcoptersreviews.com/sitemap-pt-page-2015-09.xml</loc>
<lastmod>2015-09-24T12:01:22+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.topquadcoptersreviews.com/sitemap-pt-page-2015-05.xml</loc>
<lastmod>2015-11-16T04:25:02+00:00</lastmod>
</sitemap>
</sitemapindex><!-- Request ID: 3a7e86d4b9d274d0b89130cb07553a8f; Queries for sitemap: 6; Total queries: 49; Seconds: 0.01; Memory for sitemap: 0.25MB; Total memory: 40.25MB -->

Próbuję umieścić wszystkie elementy „loc” na liście i do tej pory próbowałem uzyskać dostęp do elementów, ale nie działałem i w tej chwili udało mi się utworzyć Dokument XML i móc uzyskać do niego dostęp.

Aktualny kod

string url = "http://www.topquadcoptersreviews.com/sitemap.xml";
XmlDocument xmlDoc = new XmlDocument();
xmlDoc.Load(url);

Odpowiedzi:

2 dla odpowiedzi № 1

Sztuczka polega na użyciu menedżera przestrzeni nazw i poprzedzeniu wyrażenia XPath domyślną przestrzenią nazw:

string url = "http://www.topquadcoptersreviews.com/sitemap.xml";
var xmlDoc = new XmlDocument();
var xmlns  = new XmlNamespaceManager(xmlDoc.NameTable);
xmlns.AddNamespace("default", "http://www.sitemaps.org/schemas/sitemap/0.9");
xmlDoc.Load(url);

var locs = xmlDoc.SelectNodes("//default:loc", xmlns)
.OfType<XmlElement>()
.Select(element => element.InnerText)
.ToList();

2 dla odpowiedzi nr 2

// Najpierw załaduj xml:

var data = XElement.Parse(xmlResult);
string ns ="http://www.sitemaps.org/schemas/sitemap/0.9";
var m_content = data.Descendants(ns + "sitemapindex ");
var loc = m_content.Select(p => p.Element(ns + "loc"));

var locs =     m_content.Elements(ns + "loc");

// teraz powinny mieć lokalizacje w loc

// Niech ci to pomoże ..


1 dla odpowiedzi nr 3

To zrobi to w LINQ to XML:

XDocument doc = XDocument.Load("data.xml");
XNamespace ns = "http://www.sitemaps.org/schemas/sitemap/0.9";

List<string> locs = doc.Descendants(ns + "loc").Select(e => e.Value).ToList();