Я разбираю некоторые HTML и мне нужно получить все innerHTML <body />
. Я делаю это так:TFHpple - получение элемента HTML без тегов элемента?
TFHpple *doc = [[TFHpple alloc] initWithHTMLData:[NSData dataWithContentsOfFile:sectionFilePath]];
TFHppleElement *body = [doc searchWithXPathQuery:@"//body"][0];
NSString *bodyHTML = body.raw;
Однако это возвращает:
<body>stuff inside body</body>
вместо того, чтобы просто:
stuff inside body
Вопрос: Есть ли способ, чтобы получить чисто внутренний HTML элемента, исключая его собственные теги?
Я придумал этот метод, но мне кажется, что я изобретаю колесо здесь. Этот метод также довольно медленный.
TFHppleElement *child;
for(int i = 0; i<body.children.count; i++){
child = (TFHppleElement*)body.children[i];
if(child.raw != nil) [bodyHTML appendString:child.raw];
else if(child.content != nil) [bodyHTML appendString:child.content];
}
Это похоже только на текст первого элемента в теле, который не является тем, что мне нужно ... похоже, вы также скопировали это из другой статьи? – mattsven
добавьте теги других элементов, подобных этому, @ "// body/h1/ul/li" и btw это было из приложения, которое я написал – iDevMartin