Предоставляю вашему вниманию книгу Automated Data Collection with R. A Practical Guide to Web Scraping and Text Mining,автор - Simon Munzert.

Книгу можно как скачать, так и читать онлайн.


Читать книгу онлайн »

Скачать книгу »




Категория: Базы данных798

Издательство: John Wiley & Sons Limited




Описание книги:

A practical guide to searching the Internet and text mining for both beginners and advanced users. R Introduces the basic concepts of core network and database architecture and covers HTTP, HTML, XML, JSON, SQL. Provides basic methods for querying web documents and datasets (XPath and regular expressions). An extensive set of exercises is presented to help the reader in each technique. He studies both controlled and uncontrolled methods, and advanced methods such as data cleansing and text management. Case studies are presented along with examples for each of the methods presented. The R-code and exercise exercises presented in the book are presented on the support website.

Перевод:

Практическое руководство по поиску в сети и интеллектуальному анализу текста как для начинающих, так и для опытных пользователей R Представляет фундаментальные концепции основной архитектуры сети и баз данных и охватывает HTTP, HTML, XML, JSON, SQL. Предоставляет основные методы для запроса веб-документов и наборов данных (XPath и регулярные выражения). Обширный набор упражнений представлен, чтобы помочь читателю в каждой технике. Изучает как контролируемые, так и неконтролируемые методы, а также передовые методы, такие как очистка данных и управление текстом. Тематические исследования приведены вместе с примерами для каждого из представленных методов. R-код и решения упражнений, представленные в книге, представлены на вспомогательном веб-сайте.



Читать книгу онлайн »

Скачать книгу »