PyCon Russia 2015
18-19 сентября
под Екатеринбургом

Получаем текст веб-страниц из Python

Юрий Бабуров 11.10.2015

Мы рассмотрим python-библиотеку под названием readability-lxml (https://github.com/buriy/python-readability) , её применение и механизм работы для задачи извлечения текстов новостных страниц.

парсинг