中国科学软件网-首页

数据挖掘与R软件实战演练中级培训


R是一套完整的数据处理、计算和制图软件系统,R是一种数学计算的环境,它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。在R网站上提供了统计及各个有关应用领域几乎所有最新的成果和代码公开的软件包。截至2012年7月底,CRAN库中的R包已经超过3900个,例如仅仅空间统计一个方向的软件包就有20多个。

 

主讲人:

程豪,2014年6月取得中国人民大学理学硕士学位,现已直博,继续攻读中国人民大学统计学博士学位,2015年-2016年由国家公派到美国哥伦比亚大学联合培养,继续深造。担任中国人民大学统计咨询研究中心机构管理员。研究方向包括机器学习、数据挖掘、统计预测、社会网络及结构方程模型。独立出版译著《R统计应用开发实战》,合作翻译了《R语言编程艺术》、《商务与经济统计》,合作发表6篇国内核心论文,担任10多个课题的主要负责人和研究员,合作单位有中国保险行业协会、全国人大预算工作委员会、北京市统计局、中国医疗保险研究会、中国中医科学院、中国人民解放军总医院、中国中医科学院中医临床基础医学研究所等等,统筹国内外会议7次,并在“海峡两岸CATI与数据挖掘合作20周年暨第十届中国数据挖掘与商业智能研讨会”中报告变量选择的方法和R实现。2014年获得“汇丰杯”中国高校SAS数据分析大赛冠军。

 

课程大纲

 

第一章 R软件简介与大数据时代理论概述

第二章 R软件基本操作

第三章 R软件数据描述性分析

第四章 R软件与回归建模:一元线性回归、多元线性回归、广义线性回归、非线性回归、boosting回归

第五章 R软件与决策树

第六章 R软件与bagging

第七章 R软件与adaboost

第八章 R软件与支持向量机

第九章 R软件与神经网络

第十章 R软件与随机森林

第十一章 R软件与lasso

第十二章 R软件与bootstrap抽样

第十三章 R软件与多元统计分析:主成分分析、因子分析、判别分析、聚类分析、典型相关分析、对应分析

第十四章 R软件与文本挖掘

第十五章 R软件与应用小结

 

学习时间:2017年3月19日22日(四天)

学习地点:北京

学习费用:学费及资料费2000元/人。

本课程针对学校和科研机构提供内训服务,具体费用根据培训需求,人数、天数等综合制定。

 

报名方式:

1、请登陆科学软件学习网www.ssstudy.com“行业专家培训”网址在线报名;

2、请登陆中国科学软件网www.sciencesoftware.com.cn“软件培训”网址在线报名;

 

电话:010-62669215  82890740  400 810 4003

传真:010-62981484

Email:service@ssstudy.com

QQ群:183627081