tag:blogger.com,1999:blog-3533262157176083768.post459392915106420607..comments2022-04-30T16:07:23.961+03:00Comments on Парсинг от А до Я: Навигация по DOM-дереву в htmlMashahttp://www.blogger.com/profile/10942350700995896379noreply@blogger.comBlogger8125tag:blogger.com,1999:blog-3533262157176083768.post-16534790484055863922010-12-19T13:29:50.135+03:002010-12-19T13:29:50.135+03:00Во время работы с этим инструментом столкнулся с п...Во время работы с этим инструментом столкнулся с проблемой невозможности удалять узлы. Считаю это большим упущением, т.к. это очень частая задача. Т.к. класс не обновляется и не развивается уже больше двух лет, к автору не обращался и нашел ответ в интернете. Рунет ничего не подсказал, но у зарубежных коллег ответ нашелся. Действительно, в классе нет метода удаления узлов, но по следующей ссылке есть описание этого метода. Его можно добавить прямо в класс, либо объявить в классе-наследнике. Я вставил прямо в класс, т.к. проект заброшен и обновляться не будет.<br /><br />Ссылка: http://stackoverflow.com/questions/1956850/html-parsing-using-simple-html-dom-parser<br /><br />Функция в первом ответе. Можно удалять все узлы по селектору, можно задать лимит. Причем лимит может быть отрицательным и тогда отсчет будет от последнего элемента.<br /><br />Надеюсь, кому-то поможет.Anonymousnoreply@blogger.comtag:blogger.com,1999:blog-3533262157176083768.post-1510971119708559572010-11-12T20:56:39.705+03:002010-11-12T20:56:39.705+03:00Спасибо за отличный блог :)Спасибо за отличный блог :)Anonymoushttps://www.blogger.com/profile/12760555698249976664noreply@blogger.comtag:blogger.com,1999:blog-3533262157176083768.post-9107553596048667842010-07-21T20:57:24.098+04:002010-07-21T20:57:24.098+04:00Если html с ошибками, нужно делать тоже что и фаер...Если html с ошибками, нужно делать тоже что и фаерфокс - пропустить его через tidy, соответственное расширение в php есть.AmdYhttp://amdy.su/noreply@blogger.comtag:blogger.com,1999:blog-3533262157176083768.post-28283852884284994292010-07-20T14:20:42.034+04:002010-07-20T14:20:42.034+04:00Дмитрий, да, это факт, на Firefox полагаться не ст...Дмитрий, да, это факт, на Firefox полагаться не стоит, надо проверять по исходному коду.<br />По поводу "не всегда правильно разбирает html" — может быть, не исключено. Хотя лично я пока не сталкивалась, но письма об этом не раз получала. Проверить и своими глазами посмотреть пока некогда.Mashahttps://www.blogger.com/profile/10942350700995896379noreply@blogger.comtag:blogger.com,1999:blog-3533262157176083768.post-1352917322191293022010-07-20T13:36:29.497+04:002010-07-20T13:36:29.497+04:00И все же PHP Simple Html DOM Parser не всегда норм...И все же PHP Simple Html DOM Parser не всегда нормально разбирает html с ошибками (не смотря на то что про него пишут).<br />А Firefox показывает не исходный текст страницы с ошибками, а тот , который перерабатывает сам браузер. Поэтому можно долго пыхтеть пытаясь найти причину неправильной навигации по DOM дереву в HTML.Дмитрийhttp://sanaDG.runoreply@blogger.comtag:blogger.com,1999:blog-3533262157176083768.post-77633377419588136962010-07-20T12:44:46.190+04:002010-07-20T12:44:46.190+04:00featzima, когда-нибудь напишу и про XPath. Тем у м...<b>featzima</b>, когда-нибудь напишу и про XPath. Тем у меня в блокноте много :), только вот свободного времени — не очень.Mashahttps://www.blogger.com/profile/10942350700995896379noreply@blogger.comtag:blogger.com,1999:blog-3533262157176083768.post-51672877567779878332010-07-20T10:25:29.395+04:002010-07-20T10:25:29.395+04:00Спасибо за Ваши статьи! Очень много нового для себ...Спасибо за Ваши статьи! Очень много нового для себя подчерпнул!Иванhttp://biznesguide.runoreply@blogger.comtag:blogger.com,1999:blog-3533262157176083768.post-11300479393311934762010-07-20T09:57:01.308+04:002010-07-20T09:57:01.308+04:00И не слова про XPath =$)И не слова про XPath =$)Anonymousnoreply@blogger.com