Parser 2: адреса с #

Главные вкладки

Аватар пользователя Petro Petro 1 июля 2018 в 7:01

Господа, помогите с настройкой Parser 2 от xandeadx. В адресах сайта который пытаюсь парсить содержится #: .../svetilniki/#p1
.../svetilniki/#p2
когда делаешь маску .../svetilniki/#p[mask:1,10] парсится только первая страница. Я так понимаю игнорируется # в адресе. Что можно сделать?

Комментарии

Аватар пользователя Semantics Semantics 1 июля 2018 в 10:56

Скорее всего, вы хотите спарсить SPA.
Сегмент URL после # не передаётся на сервер и логика выполняется на клиенте JS-ом.
Парсер великого и могучего xandeadx, как и любой другой парсер на PHP, не умеет выполнять JS, если говорить об общих случаях

Аватар пользователя gun_dose gun_dose 1 июля 2018 в 11:02
1

Хэш в адресах обрабатывается только в браузере. При программном получении кода страницы, хэш всегда будет игнорироваться. Поэтому вам остаётся одно : в девтулзах открываете вкладку Network и при переходе на страницу смотрите, какие запросы выполняются.