Gumbo – универсальный HTML5-парсер для всех

Как создать сайт, который будет одинаково адекватно отражаться во всех браузерах и не создаст для части пользователей неудобства в виде набора непонятных иероглифов вместо полезной и интересной информации. Благодаря компании Google и ее HTML-парсингу получившему название Gumbo данная проблема перестала существовать.  Правда, возникла иная – поскольку парсер написан на чистом Си, языке для его использования многим придется немного подучиться. Именно этот язык был выбран не случайно, поскольку он, по сути, является универсальным и значительно упрощает работу с сайтами, написанными на языке, не имеющими прямой совместимости с алгоритмом HTML.

Данный синтаксический анализатор своего рода блок в основании большого здания, на котором в дальнейшем без труда можно построить и различные инструменты для анализа кода и рефракторинга, и валидаторы, и языки шаблонов, и библиотеки. Несмотря на уверения разработчиков, Gumbo пока так и не стал более быстро действенным и не обзавелся возможностью распознавать только часть кода, однако, миллиарды  страниц в Google, на которых он уже был использован, говорят в его пользу. Тем более что в самом ближайшем времени ожидается и возможность получать от него полноценные отчеты об ошибках, чтобы быстро и эффективно их исправлять.
 

Коментарии

Plain text

CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.
Target Image