作者:朱雪宁等
出版社:中国人民大学出版社
出版年:2018-12-1
页数:356
定价:89
装帧:平装
ISBN:9787300263113
内容简介
······
如何从数据中挖掘价值?一是要锻炼数据思维;二是需要选择一个便利快捷的工具。R语言在数据分析方面有着灵活、高效的优势。本书以R语言为基础,深度讲解从数据思维到实战的全过程。在章节组织上,本从R语言简介及优势入手,再到数据读取、清洗、描述、建模等数据分析的各个环节,由浅入深逐个讲解,是一本实务分析中的“R语言指南”。同时,本书采用大量实际案例辅以说明,既有助于上手分析,也可用于教学使用。
本书所有代码、数据可在狗熊会官网(http://www.xiong99.com.cn/create.php)免费下载。同时,关注狗熊会微信公众号,可获取更多扩展资源。
作者简介
······
朱雪宁 复旦大学大数据学院助理教授。博士毕业于北京大学光华管理学院商务统计系,后于宾州州立大学(Pennsylvania State University)从事博士后研究工作。狗熊会创始团队成员、《R语千寻》专栏负责人;统计之都核心成员、编辑部主编。研究上关注社交网络数据分析、高维数据分析等问题。
目录
······
目录
第1章初识R语言
1.1初识R语言
1.2安装R语言
1.3获取R帮助文档
第2章R语言数据操作
2.1R中的数据类型
2.2数据读入
第3章R语言与统计分析
3.1描述分析及可视化
3.2统计检验
3.3回归分析
3.4代码规范与文档撰写
第4章R语言与非结构化数据分析
4.1文本分析
4.2图像分析
第5章R语言与机器学习
5.1机器学习概述
5.2数据预处理
5.3模型训练与调参
5.4模型训练与集成
第6章R语言爬虫初介
6.1HTML基础与R语言解析
6.2XML与XPath表达式以及R爬虫应用
6.3HTTP协议
6.4AJAX与网页动态加载
6.5正则表达式与字符串处理函数
6.6R语言爬虫实战
评论 ······
这是作者及其团队对国内R语言类数据科学图书的一个诚意贡献。具有很强的原创性,阅读价值较高。遗憾的是在数据处理上没有引入tidyverse世界,每个R用户都应该在tidyverse框架下得到培训,不然真的要走很多弯路。
好像买到了作者签名本,书的内容便于入门
说实话,写得太简单了……
2020034#算是比较友好的一本入门书籍,关于统计学的一些原理和细节讲解的还算细致,就是到后半部分的网页解析真的有点懵圈。越来越深刻的体会到,其实无论是数据分析还是其他的工作,真正上手去做才是实践的唯一真理,我现在只能先求个概念在脑中,回头还是要找到数据资源去尝试才行。
评论前必须登录!
注册