diverse - RegExp hente data ud html - Udvikleren.dk - Programmering, webdesign og grafik

Tags: diverse

<< < 1 2 > >>

Bruger #11506 @ 28.01.09 21:12

hello, jeg vil høre om nogen gider at give noget input/hjælp (ikke nødvendigvis løsningen).

Mit problem er at jeg har to html-filer som jeg skal hente data ud af til Flash. Det skal gøres med RegExp.

1. den første html har nogen DIVclass som omkranser den info der skal ud. fx
<div class="data01">data som skal ud</div>, der er så flere div classes men det finder jeg nok ud af med et array.

2. den anden er langt sværere. Der er en enkelt XML description tag på fx <description> inde i den <des..> ligger 3 info:
- et http link
- et navn hvor der står Name foran
- et img som tilhører linket.

nogen gode ideer til patterns??

Indlæg senest redigeret d. 28.01.2009 21:13 af Bruger #11506

16 svar postet i denne tråd vises herunder
2 indlæg har modtaget i alt 5 karma

Sorter efter stemmer Sorter efter dato

Bruger #10647 @ 29.01.09 18:10

233

Nej det var E4X men der er også mulighed for xpath, E4X virker bare mere intelligent. XMLListVar..description.@http_link får fat i attributten http_link uanset hvor description tagget befinder sig i dokumentet. Det gør det let at finde elementer der er begravet langt nede i et komplekst xml/xhtml dokument. Derfor 2 prikker og ikke 1

Indlæg senest redigeret d. 29.01.2009 18:10 af Bruger #10647

Bruger #11506 @ 29.01.09 22:09

190

Denne RSS/XML er den hvor der kun er en description. I denne description skal hente :

Pris
Navn
Img link
Navn link

Men I har allerede givet mig en masse input. Men hvis nogen kan få noget ud af det ville det bare være for vildt..

Kode

<?xml version="1.0" encoding="iso-8859-1"?> 
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
<atom:link rel="self" type="application/rss+xml" href="http://www.domain.dk/htc-14c1.rss" />
<title>Sports Items</title>
<link>/shop/htc-14c1.html</link>
<description></description>
<item>
<title>sports Alpha</title>
<link>http://www.domain.dk/sports-alpha-175p.html</link>
<guid isPermaLink="true">http://www.domain.dk/sports-alpha-175p.html</guid>

<description>
			<![CDATA[
			<a href="http://www.domain.dk/sports-alpha-175p.html"><img border="0" src="http://www.domain.dk/images/produktbilleder/foto-paa-vej-t.jpg" /></a><br /><br />Vi præsenterer iPhone 3G. Med hurtig trådløs 3G-teknologi, Kort med GPS, understøttelse af virksomhedsfunktioner som Microsoft Exchange ActiveSync og den nye App Store giver iPhone 3G dig endnu flere fantastiske funktioner i hænderne. Og ligesom den originale iPhone kombinerer den tre produkter – en revolutionerende telefon, en iPod med bred skærm og en banebrydende Internetenhed med e-post i HTML-format og en rigtig webbrowser. iPhone 3G. Den sætter helt nye standarder for, hvad en mobiltelefon kan gøre. Igen.<br />

<br />Pris: 150,00 DKK
			]]>
		</description>
<pubDate>Wed, 14 Jan 2009 16:53:46 +0200</pubDate>
</item>
<item>
<title>sports Beta</title>
<link>http://www.domain.dk/sports-beta-186p.html</link>
<guid isPermaLink="true">http://www.domain.dk/sports-beta-186p.html</guid>
<description>
			<![CDATA[
			<a href="http://www.domain.dk/sports-beta-186p.html"><img border="0" src="http://www.domain.dk/images/produktbilleder/foto-paa-vej-t.jpg" /></a><br /><br />Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Suspendisse fermentum venenatis dui. Donec convallis, sem ac ultricies sollicitudin, pede risus interdum nisl, non elementum sapien orci at diam. Donec elementum. Curabitur magna. Donec at eros. Sed porta, sapien feugiat dapibus ornare, velit massa facilisis nisl, at sodales eros lectus ac lectus. Quisque eros sapien, interdum ac, semper sit amet, aliquam vel, quam. Duis vitae quam vitae dui mattis dignissim. Aliquam ut erat a augue elementum semper. Aliquam erat volutpat. Ut risus. Quisque rhoncus nunc sit amet odio. <br />

<br />Pris: 1.562,50 DKK
			]]>
		</description>
<pubDate>Wed, 14 Jan 2009 14:50:40 +0200</pubDate>
</item>
<item>
<title>sports Charlie</title>
<link>http://www.domain.dk/sports-charlie-187p.html</link>
<guid isPermaLink="true">http://www.domain.dk/sports-charlie-187p.html</guid>
<description>
			<![CDATA[
			<a href="http://www.domain.dk/sports-charlie-187p.html"><img border="0" src="http://www.domain.dk/images/produktbilleder/foto-paa-vej-t.jpg" /></a><br /><br />Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Suspendisse fermentum venenatis dui. Donec convallis, sem ac ultricies sollicitudin, pede risus interdum nisl, non elementum sapien orci at diam. Donec elementum. Curabitur magna. Donec at eros. Sed porta, sapien feugiat dapibus ornare, velit massa facilisis nisl, at sodales eros lectus ac lectus. Quisque eros sapien, interdum ac, semper sit amet, aliquam vel, quam. Duis vitae quam vitae dui mattis dignissim. Aliquam ut erat a augue elementum semper. Aliquam erat volutpat. Ut risus. Quisque rhoncus nunc sit amet odio. <br />

<br />Pris: 1.250,00 DKK
			]]>
		</description>
<pubDate>Wed, 14 Jan 2009 14:50:45 +0200</pubDate>
</item>
<item>
<title>sports Delta</title>
<link>http://www.domain.dk/sports-delta-188p.html</link>
<guid isPermaLink="true">http://www.domain.dk/sports-delta-188p.html</guid>
<description>
			<![CDATA[
			<a href="http://www.domain.dk/sports-delta-188p.html"><img border="0" src="http://www.domain.dk/images/produktbilleder/foto-paa-vej-t.jpg" /></a><br /><br />Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Suspendisse fermentum venenatis dui. Donec convallis, sem ac ultricies sollicitudin, pede risus interdum nisl, non elementum sapien orci at diam. Donec elementum. Curabitur magna. Donec at eros. Sed porta, sapien feugiat dapibus ornare, velit massa facilisis nisl, at sodales eros lectus ac lectus. Quisque eros sapien, interdum ac, semper sit amet, aliquam vel, quam. Duis vitae quam vitae dui mattis dignissim. Aliquam ut erat a augue elementum semper. Aliquam erat volutpat. Ut risus. Quisque rhoncus nunc sit amet odio. <br />

<br />Pris: 1.250,00 DKK
			]]>
		</description>
<pubDate>Wed, 14 Jan 2009 14:50:50 +0200</pubDate>
</item>
</channel>
</rss>

Bruger #11506 @ 29.01.09 22:15

190

Denne nummer 2 som er ren html. Hvor data skal hentes fra.

Kode

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Untitled Document</title>
</head>

<body>
<div class="data01"><img border="0" src="http://www.domain.dk/images/produktbilleder/foto-paa-vej-t.jpg" /></div>
<div class="data02"><p>Den beskrivende tekst som skal hentes ud</p></div>
<div class="data03"><h1>Den beskrivende title</h1></div>
<div class="data04"><a href="http://www.domain.dk/sports-beta-186p.html">linket uden tekst kun med HREF</a></div>
</body>
</html>

såå.. I kan godt se at jeg har noget at gå igang med..

Indlæg senest redigeret d. 29.01.2009 22:15 af Bruger #11506

Bruger #10647 @ 30.01.09 15:31

233

Du skal starte med at læse om grundlæggende E4X i din flash dokumentation, så får du det hele foræret

Der er vist endda et afsnit om at læse RSS feeds, og når du kan det så er det intet problem at læse HTML.

Bruger #11506 @ 30.01.09 16:24

190

Det har jeg da læst 100 gange.
Problemet er at den ene kun indeholder en enkelt description, og det er rigtigt jeg har fået fisket de enkelte Items ud. Problemet er mere de tekststykker der står i tagget description.

ANYWAY. så tror jeg at jeg har fundet en løsning, med at lave E4X på de tags som er ren XML og så laveen string sortering med Index, og subString på description..

det har været vildt godt med Jeres input, det har hjulpet meget :-)

hvordan vil du egenlig lave den html om til XML ?

Bruger #11506 @ 30.01.09 19:20

190

mja, det vil den ikke den siger at der er for mange fejl i den html der bliver loaded, men det er jo bare sådan det er.. det kommer fra et CMS.

oki syg nok forklaring det kan jeg bruge.

tak for hjælpen.

<< < 1 2 > >>

RegExp hente data ud html

Karma barometer (30 dage)

Modtaget

Givet

Favorit hos
Forum tråde
Artikler