Поиск по блогу

среда, 20 августа 2008 г.

Парсинг. А.

Начнем с самого простого и главного — с определения.

Обратимся к Wiki.

В информатике, синтаксический анализ (парсинг) — это процесс анализа входной последовательности символов с целью разбора грамматической структуры, обычно, в соответствии с заданной формальной грамматикой. Синтаксический анализатор (парсер) — это программа или часть программы, выполняющая синтаксический анализ.

При парсинге исходный текст преобразуется в структуру данных, обычно — в дерево, которое отражает синтаксическую структуру входной последовательности и хорошо подходит для дальнейшей обработки.

Меня больше интересует практическое применение парсинга. А именно — автоматический анализ данных, получаемых через Интернет. В настоящее время создано очень много продуктов, реализующих парсинг. В основном продукты заточены под узкую задачу. Например — парсинг выдачи поисковиков. По своему опыту знаю, что сложно найти какой-либо продукт, удовлетворяющий всем твоим запросам. Поэтому, целью — моей и, надеюсь, читателей, — будет научиться писать парсеры самостоятельно.

Скорее всего, большая часть материала будет посвящена созданию десктопных парсеров (с использованием среды разработки Borland Delphi и стандартного набора компонент; там, где набор будет отличаться от стандартного, я скажу), т.к. программирование приложений под винду мне гораздо ближе, нежели под инет. Но так как в последнее время стало появляться достаточно много серверных парсеров, то некоторое внимание планируется уделить и серверным технологиям.

Статьи схожей тематики:



1 комментарий:

  1. Мария, Вы молодец ;) Очень интересную тему затронули, буду читать Ваш блог с самого начала

    ОтветитьУдалить

Комментарии модерируются, вопросы не по теме удаляются, троллинг тоже.

К сожалению, у меня нет столько свободного времени, чтобы отвечать на все частные вопросы, так что, может, свой вопрос лучше задать на каком-нибудь форуме?

Поделиться