X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

2 страниц V   1 2 >
Открыть тему
Тема закрыта
> регулярные выражения
www3_hb
www3_hb
Topic Starter сообщение 13.12.2010, 17:22; Ответить: www3_hb
Сообщение #1


Очень много раз читал про регулярные выражения но так и не совсем понял
Вообщем мне нужно чтобы можно было взять инфо с
<table class="tele_td_setka">

И до закрывающего тега этой таблицы
</table>

Как можно сделать?
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
alexdrob
alexdrob
сообщение 13.12.2010, 18:09; Ответить: alexdrob
Сообщение #2


[PHP]<?php
$text = <<<HTML
<table class="tele_td_setka">
<tr>
<td>1</td>
<td>2</td>
<td>3</td>
</tr>
<tr>
<td>4</td>
<td>5</td>
<td>6</td>
</tr>
</table>
HTML;

preg_match('/<table class="tele_td_setka">(.*)<\/table>/is',$text,$res);

echo $res[1];

?>[/PHP]
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
www3_hb
www3_hb
Topic Starter сообщение 13.12.2010, 18:31; Ответить: www3_hb
Сообщение #3


Вот код
[PHP]$html = file_get_contents("sait");
preg_match('/<table class="tele_td_setka">(.*)<\/table>/is',$html,$res);
echo($res[0]); [/PHP]
На обоих сайтах стоит кодировка utf-8
Но все равно выводит что-то типо такого(это маленький отрывок):
Бэтмен будущего
31 серия

Облаченный в плащ Бэтмена, отважный юноша Терри Макгиннис бросает вызов беспощадным преступникам и становится новым героем Готэм-сити. Только ему под силу отсановить беспощадных злодеев
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Mulder_hb
Mulder_hb
сообщение 13.12.2010, 18:33; Ответить: Mulder_hb
Сообщение #4


Нужно еще учесть, что в внутри таблицы tele_td_setka может находиться своя таблица и сама таблица tele_td_setka может быть вложена в другую. Приведенный выше пример подходит для сферического вакуума. Нужно самостоятельно программировать логику вложенных структур и регулярные выражения тут слабый помощник.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
alexdrob
alexdrob
сообщение 13.12.2010, 18:35; Ответить: alexdrob
Сообщение #5


для утф8 нужно добавить модификатор ещё u
а $res[0] - вернёт всё содержимое, а не искомое
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
www3_hb
www3_hb
Topic Starter сообщение 13.12.2010, 18:35; Ответить: www3_hb
Сообщение #6


Ладно.
Вообщем хочу сделать типо такой маленький сайт о телеканале тв3 (В нем рассказывается про телеканал тв3) и вот решил если ктото поал на мой сайт ему ведь понадабится может телепрограмма
ну и вот с этого сайта хотел взять
http://tv3russia.ru/index.php/teleprogram.html
p.s. я еще не знаю буду ли мой сайт в сеть ложить!
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
alexdrob
alexdrob
сообщение 13.12.2010, 18:42; Ответить: alexdrob
Сообщение #7


Ну в заголовке сайта указанно что сайт XHTML и было бы легко и просто рассмотреть его как XML и распарсить всё что вам нужно)
Но вот беда) Как обычно тот кто писал сайт не учёл что XHTML Это не просто понты в заголовке но и закрывающиеся теги например) Но некоторые теги не закрыты, следовательно как xhtml не получится парсить.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
ZhukV
ZhukV
сообщение 14.12.2010, 13:01; Ответить: ZhukV
Сообщение #8


Если страница валидна, то намного лучше использовать парсера XML
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
alexdrob
alexdrob
сообщение 14.12.2010, 13:03; Ответить: alexdrob
Сообщение #9


(ZhukV @ 14.12.2010, 15:01) *
Если страница валидна, то намного лучше использовать парсера XML

см. пункт 7 :)
(alexdrob @ 13.12.2010, 20:42) *
Но некоторые теги не закрыты, следовательно как xhtml не получится парсить.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
www3_hb
www3_hb
Topic Starter сообщение 14.12.2010, 13:18; Ответить: www3_hb
Сообщение #10


А ВОТ елси в поисковике набрать тв3 телепрограмма там много сайтов выходит они все договор зоглючили с тв3 чтоли?
Может с других сайтов можно грабинг сделать просто я слышал о xhtml но не смотрел подробно что это!(и все такое)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
2 страниц V   1 2 >
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Горячая тема (нет новых ответов) База профилей+топики для Xrumer 12, регулярные обновления, скидки, бонусы.
98 xrumermaster 48722 15.9.2019, 0:47
автор: -xrumer-master-
Горячая тема (нет новых ответов) База профилей+топики+гостевые+рефспам для Xrumer 12.ххх, регулярные обновления
50 xrumer-master 12706 15.9.2019, 0:00
автор: xrumer-master
Открытая тема (нет новых ответов) Нужны рерайтеры. Простые и регулярные заказы.
Оплата 30-35 рублей / 1000 символов б.п.
3 13sanek 1911 9.5.2017, 12:26
автор: Gadraser


 



RSS Текстовая версия Сейчас: 29.3.2024, 2:11
Дизайн