RegExp hente data ud html

Tags:    diverse

<< < 12 > >>
hello, jeg vil høre om nogen gider at give noget input/hjælp (ikke nødvendigvis løsningen).

Mit problem er at jeg har to html-filer som jeg skal hente data ud af til Flash. Det skal gøres med RegExp.

1. den første html har nogen DIVclass som omkranser den info der skal ud. fx
<div class="data01">data som skal ud</div>, der er så flere div classes men det finder jeg nok ud af med et array.

2. den anden er langt sværere. Der er en enkelt XML description tag på fx <description> inde i den <des..> ligger 3 info:
- et http link
- et navn hvor der står Name foran
- et img som tilhører linket.


nogen gode ideer til patterns??





Indlæg senest redigeret d. 28.01.2009 21:13 af Bruger #11506
16 svar postet i denne tråd vises herunder
2 indlæg har modtaget i alt 5 karma
Sorter efter stemmer Sorter efter dato
Nej det var E4X men der er også mulighed for xpath, E4X virker bare mere intelligent. XMLListVar..description.@http_link får fat i attributten http_link uanset hvor description tagget befinder sig i dokumentet. Det gør det let at finde elementer der er begravet langt nede i et komplekst xml/xhtml dokument. Derfor 2 prikker og ikke 1



Indlæg senest redigeret d. 29.01.2009 18:10 af Bruger #10647
Denne RSS/XML er den hvor der kun er en description. I denne description skal hente :

Pris
Navn
Img link
Navn link

Men I har allerede givet mig en masse input. Men hvis nogen kan få noget ud af det ville det bare være for vildt..

Fold kodeboks ind/udKode 




Denne nummer 2 som er ren html. Hvor data skal hentes fra.

Fold kodeboks ind/udKode 



såå.. I kan godt se at jeg har noget at gå igang med..



Indlæg senest redigeret d. 29.01.2009 22:15 af Bruger #11506
Du skal starte med at læse om grundlæggende E4X i din flash dokumentation, så får du det hele foræret :) Der er vist endda et afsnit om at læse RSS feeds, og når du kan det så er det intet problem at læse HTML.



Det har jeg da læst 100 gange.
Problemet er at den ene kun indeholder en enkelt description, og det er rigtigt jeg har fået fisket de enkelte Items ud. Problemet er mere de tekststykker der står i tagget description.

ANYWAY. så tror jeg at jeg har fundet en løsning, med at lave E4X på de tags som er ren XML og så laveen string sortering med Index, og subString på description..

det har været vildt godt med Jeres input, det har hjulpet meget :-)

hvordan vil du egenlig lave den html om til XML ?





mja, det vil den ikke den siger at der er for mange fejl i den html der bliver loaded, men det er jo bare sådan det er.. det kommer fra et CMS.


oki syg nok forklaring det kan jeg bruge.

tak for hjælpen. :)




<< < 12 > >>
t