Opet ja sa mojim regularnim izrazima ali sam malo napredovao iako i dalje pojma nemam :)))
Trebam da iz celog HTML fajla pokupim <a href ...> tagove i to da uzmem adresu i da uzmem ono sto pise na linku ... Nesto kao:
$link[0] = "http://www.yahoo.com"
$data[0] = "Link to yahoo"
$link[1] = "/testurl/test.htm"
$data[1] = "Link internal"
ili
$link[0][0] = "http://www.yahoo.com"
$link[0][1] = "Link to yahoo"
$link[1][0] = "/testurl/test.htm"
$link[1][1] = "Link internal"
Ovo su neka pocetnicka resenja koja ne rade ... moze li koja pomoc?
page.html:
<html>
<body>
<a href="http://www.yahoo.com">Link to yahoo</a><br><br>
fdsjakljsdflkajsdflkjsadfkasjdflkasjdfkajsdf<br><br>
test <br><br>
test <br><br>
<a href="/testurl/test.htm">Link internal </a> <br><br>
sdkfjlasfdj <br><br>
</body>
</html>
Pocetnicki index.php: (izbaci gomilu gluposti)
<?php
echo "starting";
$text_native = implode ("", file("page.html"));
ereg("<a href=(.+)", $text_native, $link);
ereg(">(.+)</a>", $text_native, $data);
for ($i = 0;$i < count($data);$i++) {
echo "<br>link: ".$link[$i];
echo "data: ".$data[$i];
}
?>
'Izlet u nepoznato' index.php: (ispise samo starting a ako probam drugacije da ispisem ispisuje rec 'array' za svaku stvar koju je kao 'uhvatio')
<?php
echo "starting";
$text_native = implode ("", file("page.html"));
if (preg_match_all('!<a\s+href="((?>[^"]+))">((?>[^<]*))</a>!iU', $text_native, $matches))
{
print_r($files);
}
?>
Hvala unapred
LJUBA
Pozdrav
LJUBA
LJUBA