24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна.
Подробности случившегося. Мы призываем всех неравнодушных
помочь нам с восстановлением утраченного контента!
Пытаюсь парсить инфу с быдлятни.
Вот что получается:
Текст при указании селектора CSS "wall_post_text" парсится нормально, а с картинками при выборе селектора "page_post_sized_thumbs" с атрибутом "style" летит вся хрень которая в этом атрибуте есть "width: 510px; height: 510px;background-image: url(https://sun1-4.userapi.com/c7005/v7005763/17753d/WPoLrSnY1B4.jpg);""
Как же из атребута STYLE вытащить чисто ссылку? Это делаюется с помощью регулярных выражений или как-то по другому?
Вот содержимое поста:
текст:
--------------------------------------------------------------------------------------------------------
<div class="wall_post_text">Покой — это когда тебя не тревожат лишние мысли. Когда ты не беспокоишься, что завтра может произойти то, чего тебе не хочется. Когда тебе не нужно идти туда, куда ты не хочешь. Когда то, что ты делаешь, — это и есть радость. Это когда ты перестаешь анализировать окружающий мир и понимаешь — он просто есть. И ты — просто часть него. И на этом все вопросы замолкают. И вот если этот покой внутри найден, то можно и другим дарить это спокойное, умиротворённое, радостное состояние своей души.</div>
--------------------------------------------------------------------------------------------------------
картинка:
<div class="page_post_sized_thumbs clear_fix" style="width: 510px; height: 510px;"><a onclick="return showPhoto('-45378430_456252701', 'wall-45378430_15256', {"temp":{"base":"https://sun1-4.userapi.com/","x_":["c7005/v7005763/17753d/WPoLrSnY1B4",604,604],"y_":["https://sun1-21.userapi.com/c7005/v7005763/17753e/lK6k3tjyHfg",640,640]},queue:1}, event)" style="width: 510px; height: 510px;background-image: url(https://sun1-4.userapi.com/c7005/v7005763/17753d/WPoLrSnY1B4.jpg);" class="page_post_thumb_wrap image_cover page_post_thumb_last_column page_post_thumb_last_row"></a></div>