php - Link parser - regulært udtryk generelt. - Udvikleren.dk

Tags: php

Bruger #6389 @ 27.09.07 12:13

Hey folkens, sidder og fedter med følgende kode:

Kode

//Get the file contents
$lines = file_get_contents($URL);

//Find all links:
preg_match_all('/<[aA].*(href|Href|HREF)=(.*)>(.*)<\\/a>/',$lines,$out, PREG_PATTERN_ORDER);



Jeg vil her få fat i det der står mellem <a href=""> og </a>. Det virker fint for links som:

<a href="hej.html">noget tekst</a>

Der kan jeg på out sige:
echo($out[2][0]) 
udskriver "noget tekst"

Men følgende link bliver ikke snuppet:
<a href="hej.html"><img src="test.img"></a>

Der udskrives en blank linie når jeg vil printe indholdet af teksten. Det skyldes at mit regulære udtryk fanger slut > på billedet den slutning af den vilkårlige serie af tegn der skal slutte med > der var tiltænkt som sluttegnet på <a href="">.

Det er lidt svært at forklare på tekst, men håber i forstår. Jeg leder efter en ændring i mit regulære udtryk der gør at dette ikke kan ske. Tænkte selv noget i stil med:

Kode

preg_match_all('/<[aA].*(href|Href|HREF)=[ALLE TEGN UNDTAGEN >]*>(.*)<\\/a>/',$lines,$out, PREG_PATTERN_ORDER);

Men det virker meget overkill at skulle finde samtlige tegn for at at være sikker på dette virker 100% af tiden. Nogen forslag?

Indlæg senest redigeret d. 27.09.2007 12:13 af Bruger #6389

1 svar postet i denne tråd vises herunder
1 indlæg har modtaget i alt 1 karma

Sorter efter stemmer Sorter efter dato

Bruger #10216 @ 27.09.07 14:13

4.283

preg_match('/<a.*href="([^"]*)"[^>]*>(.*)<\\/a>/i',$str,$match);

Indlæg senest redigeret d. 27.09.2007 14:15 af Bruger #10216

Link parser - regulært udtryk generelt.

Karma barometer (30 dage)

Modtaget

Givet

Favorit hos
Forum tråde
Artikler