Обратимся к Wiki.
В информатике, синтаксический анализ (парсинг) — это процесс анализа входной последовательности символов с целью разбора грамматической структуры, обычно, в соответствии с заданной формальной грамматикой. Синтаксический анализатор (парсер) — это программа или часть программы, выполняющая синтаксический анализ.
При парсинге исходный текст преобразуется в структуру данных, обычно — в дерево, которое отражает синтаксическую структуру входной последовательности и хорошо подходит для дальнейшей обработки.
Меня больше интересует практическое применение парсинга. А именно — автоматический анализ данных, получаемых через Интернет. В настоящее время создано очень много продуктов, реализующих парсинг. В основном продукты заточены под узкую задачу. Например — парсинг выдачи поисковиков. По своему опыту знаю, что сложно найти какой-либо продукт, удовлетворяющий всем твоим запросам. Поэтому, целью — моей и, надеюсь, читателей, — будет научиться писать парсеры самостоятельно.
Скорее всего, большая часть материала будет посвящена созданию десктопных парсеров (с использованием среды разработки Borland Delphi и стандартного набора компонент; там, где набор будет отличаться от стандартного, я скажу), т.к. программирование приложений под винду мне гораздо ближе, нежели под инет. Но так как в последнее время стало появляться достаточно много серверных парсеров, то некоторое внимание планируется уделить и серверным технологиям.
Мария, Вы молодец ;) Очень интересную тему затронули, буду читать Ваш блог с самого начала
ОтветитьУдалить