R语言数据分析、挖掘建模与可视化

作者:刘顺祥

出版:清华大学出版社

年代:2021 更多图书信息

电子纸书:¥64.34 定价: ¥99 纸质书最低¥74.2起,点此购买

图书简介

本书循序渐进地介绍R语言在数据分析与挖掘中的应用,涵盖数据分析与挖掘的常规流程,如数据预处理(清洗、整合与运算等)、数据可视化(离散型与连续型数据的绘图姿势)、数据建模(十大数据挖掘模型的应用)等内容。本书共分15章:第1章介绍R语言的基础知识,对于R语言初学者具有非常大的帮助;第2~4章讲解R语言的数据读写操作和数据的清洗与整理(如缺失值、异常值的处理,数据的聚合汇总计算,正则表达式等);第5~6章重点阐述R语言中的绘图神器ggplot2,详细介绍绘图模板和图形的处理细节;第9~15章讲解十大常用数据挖掘模型,如回归模型、树模型、集成模型等。通过本书的学习,读者既可以掌握R语言的实操技巧,也可以掌握数据分析与挖掘的理论和应用。
本书既适于统计学、数学、经济学、金融学、管理学以及相关理工科专业的本科生、研究生使用,也有助于提高从事数据咨询、研究和分析等工作人士的专业水平和技能。

(展开)

编辑推荐

本书一共分为三大部分,系统地介绍数据分析与挖掘过程中所涉及的数据清洗、整理、可视化以及建模等环节,具体内容如下:
第一部分(第1~4章)介绍R语言的一些基础知识和使用技巧,内容包含R语言中的数据结构、控制流语句和自定义函数、apply簇函数的使用、外部数据的读取、数据的清洗和整理以及正则表达式的使用。
第二部分(第5、6章)重点介绍绘图包ggplot2的使用,详细讲解各种统计图形的绘制方法(如条形图、环形图、瓦片图、直方图、小提琴图、折线图、面积图、散点图、地图等),以及图形绘制过程中的微调策略(如图例位置的摆放、自定义颜色的调整、图形形状的选择以及多图形的组合等)。
第三部分(第7~15章)一共包含了10种数据挖掘算法的应用,如线性回归、决策树、支持向量机、GBDT等。采用通俗易懂的手法介绍每一个挖掘算法的理论知识,并借助于具体的项目数据完成算法的实战。本部分内容既可以提高数据分析与挖掘的水平和技能,也可以作为数据挖掘算法实操的模板。

(展开)

书页展示

更多图书信息
数据来源于网络,如有问题,请反馈至此邮箱:service@bookask.com

作者:刘顺祥
出版:清华大学出版社

ISBN:9787302567622

出版日期:2021-01-01

清华大学出版社

清华大学出版社

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。作为来自一流大学的出版单位,清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。目前,清华版教材已在全国一百多所院校得到广泛使用。高品质、多层次的计算机图书是清华大学出版社的一大品牌支柱。20世纪80年代末,在席卷全球的信息化浪潮中,清华大学出版社快速切入计算机图书市场,逐渐成为并一直保持这一市场的领先地位,为发展中国计算机教育做出了巨大贡献。

(展开)
Copyright ©2022  BookAsk 书问  |  京ICP证160134号   |  

京公网安备 11010802026432号

  |  出版物经营许可证新出发京零字第海150168号   |  营业执照:91110108318038279C   |  网站地图   |  关于我们   |  合作伙伴   |  商务合作   |  友情链接