Помощник
|
регулярные выражения |
www3_hb
|
Сообщение
#1
|
||
|
|
||
|
|||
alexdrob |
13.12.2010, 18:09;
Ответить: alexdrob
Сообщение
#2
|
|
[PHP]<?php
$text = <<<HTML <table class="tele_td_setka"> <tr> <td>1</td> <td>2</td> <td>3</td> </tr> <tr> <td>4</td> <td>5</td> <td>6</td> </tr> </table> HTML; preg_match('/<table class="tele_td_setka">(.*)<\/table>/is',$text,$res); echo $res[1]; ?>[/PHP] |
|
|
www3_hb
|
Сообщение
#3
|
|
Вот код
[PHP]$html = file_get_contents("sait"); preg_match('/<table class="tele_td_setka">(.*)<\/table>/is',$html,$res); echo($res[0]); [/PHP] На обоих сайтах стоит кодировка utf-8 Но все равно выводит что-то типо такого(это маленький отрывок): Бэтмен будущего
31 серия Облаченный в плащ Бэтмена, отважный юноша Терри Макгиннис бросает вызов беспощадным преступникам и становится новым героем Готэм-сити. Только ему под силу отсановить беспощадных злодеев |
|
|
Mulder_hb |
13.12.2010, 18:33;
Ответить: Mulder_hb
Сообщение
#4
|
|
Нужно еще учесть, что в внутри таблицы tele_td_setka может находиться своя таблица и сама таблица tele_td_setka может быть вложена в другую. Приведенный выше пример подходит для сферического вакуума. Нужно самостоятельно программировать логику вложенных структур и регулярные выражения тут слабый помощник.
|
|
|
alexdrob |
13.12.2010, 18:35;
Ответить: alexdrob
Сообщение
#5
|
|
для утф8 нужно добавить модификатор ещё u
а $res[0] - вернёт всё содержимое, а не искомое |
|
|
www3_hb
|
Сообщение
#6
|
|
Ладно.
Вообщем хочу сделать типо такой маленький сайт о телеканале тв3 (В нем рассказывается про телеканал тв3) и вот решил если ктото поал на мой сайт ему ведь понадабится может телепрограмма ну и вот с этого сайта хотел взять http://tv3russia.ru/index.php/teleprogram.html p.s. я еще не знаю буду ли мой сайт в сеть ложить! |
|
|
alexdrob |
13.12.2010, 18:42;
Ответить: alexdrob
Сообщение
#7
|
|
Ну в заголовке сайта указанно что сайт XHTML и было бы легко и просто рассмотреть его как XML и распарсить всё что вам нужно)
Но вот беда) Как обычно тот кто писал сайт не учёл что XHTML Это не просто понты в заголовке но и закрывающиеся теги например) Но некоторые теги не закрыты, следовательно как xhtml не получится парсить. |
|
|
ZhukV |
14.12.2010, 13:01;
Ответить: ZhukV
Сообщение
#8
|
|
Если страница валидна, то намного лучше использовать парсера XML
|
|
|
alexdrob |
14.12.2010, 13:03;
Ответить: alexdrob
Сообщение
#9
|
|
|
|
|
www3_hb
|
Сообщение
#10
|
|
А ВОТ елси в поисковике набрать тв3 телепрограмма там много сайтов выходит они все договор зоглючили с тв3 чтоли?
Может с других сайтов можно грабинг сделать просто я слышал о xhtml но не смотрел подробно что это!(и все такое) |
|
|
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
База профилей+топики для Xrumer 12, регулярные обновления, скидки, бонусы. | 98 | xrumermaster | 48722 | 15.9.2019, 0:47 автор: -xrumer-master- |
|
База профилей+топики+гостевые+рефспам для Xrumer 12.ххх, регулярные обновления | 50 | xrumer-master | 12706 | 15.9.2019, 0:00 автор: xrumer-master |
|
Нужны рерайтеры. Простые и регулярные заказы. Оплата 30-35 рублей / 1000 символов б.п. |
3 | 13sanek | 1911 | 9.5.2017, 12:26 автор: Gadraser |
Текстовая версия | Сейчас: 29.3.2024, 2:11 |