课程介绍: 本课程是炼数成金《机器学习》(http://f.dataguru.cn/thread-229688-1-1.html)课程的姐妹篇,学习本课程前较好先学过(或同时进修)《机器学习》,两门课程兼修可以起到更好的效果。参加本课程的初学者,建议同时参加《机器学习》快班(什么是快班?点击了解)。 相对于《机器学习》课程,本课程内容有以下特点: 1 对于《机器学习》中已经讲过的模型算法,我们会在更高的高度,更细的粒度,大纵深的予以扩充,例如决策树,本课程里会更详细地讲解剪枝过程,以及之前没有涉及的回归树。又例如贝叶斯分类,本课程里将扩展到贝叶斯学习的高度,很多模型其实都有其贝叶斯含义,我们可以从更高的视角去对贝叶斯思维进行俯瞰,同时推广至贝叶斯图以及一般的概率图模型。对于支持向量机,我们会讲更多的凸优化,对偶问题的背景,同时扩展到核方法。等等。 2 大幅度补充《机器学习》中没有涉及,但大家又非常感兴趣的内容,例如特征工程,半监督学习,被称为Kaggle神器的xgboost算法,流形学习等,这些都是大家梦寐以求的知识。 3 讲述机器学习的主流算法在python下的实现,学习者可以熟练的运用python下有关的资源包快速实现或书写部分代码,部署自己的模型,并且通过python代码实现的案例,了解这些模型的应用场景与调优方法。最近2年,python在机器学习领域得到长足发展,简便轻量,设计合理的语言特性使其成为人工智能的推荐语言,在算法模型封装积累上,也有了长足进步,呈现出爆炸式增长之势,学习好这门手艺,对于实现个人价值大有裨益 本课程的受众主要是没有经过专业训练的IT专业人员,他们可能是程序员,运维,IT系统架构师等等,也适合没有经过科班训练的数据分析师。数据分析是一个业务+算法+IT的交叉领域,同时熟悉这三方面知识的人,可以玩转大数据,产生无穷无尽的花样,产生巨大的价值。但很无奈的情况是这种人才太少,IT人员即使熟悉本公司的业务,但同时又熟悉算法的人极少。一般只能做一些简单的维度统计,指标计算等等,如果说到开发更高智能的系统,知识上鞭长莫及。本课程的目标,正是要打破知识的鸿沟,向IT人员普及算法知识,并把这些知识用于实际项目,把中国的机器学习应用能力提高一个台阶。 课程内容: 第1课 机器学习基础,有监督学习,无监督学习,半监督学习。机器学习与深度学习,人工智能的关系。部署Python机器学习环境,matplotlib、Numpy、Scipy、libsvm、OpenCV、pandas、Anaconda、scikit-learn、theano、Keras、Tensorflow。机器学习基础算法在python下实现。Python与R,Julia等对比。第2课 从贝叶斯网到概率图模型,贝叶斯统计学,贝叶斯思维,一切皆有贝叶斯。生成式模型与判别式模型。先验知识,贝叶斯统计在小数据学习中的应用。pyMC部署。手机短信发送行为分析案例。 第3课 吉布斯抽样,在贝叶斯统计中采用MCMC。网站转化率A/B测试案例。用贝叶斯回归进行金融预测的案例。 第4课 决策树,信息熵与相对熵,ID3,C4.5,CART等算法,剪枝过程。用scikit-learn实现决策树。 第5课 回归树。adaboost算法。提升树,分类提升树,回归提升树。梯度提升。用决策树构建随机森林。深度森林,及其与深度神经网络的对比?深度森林是否可以取代深度学习? 第6课 XGboost,原理及实现。计算学习理论,机器学习是骗局吗?VC维与样本复杂度。超参数如何选择?缺失数据处理方法。类不平衡的处理。特征工程。与上述问题有关的scikit-learn函数。 第7课 在海量短信中定位垃圾短信,半监督学习及其困难之处。聚类假设与流形假设。从k-means衍生的半监督学习算法。协同训练及其Python实现。co-forest算法,并应用于医学图像分析,半监督SVM及python实现。 第8课 基于EM算法的半监督学习生成式方法。基于图的方法,label propagation和label spreading的python实现,多种半监督学习方法效果比较。用label propagation进行手写体识别。 第9课 流形学习与降维,用scikit-learn实现流形学习 授课时间: 课程将于2024年10月07日开课。课程设计共9课,整个课程持续时间预计11周。 授课对象: 对机器学习有兴趣的朋友,特别适合想学习算法的IT专业人员或非科班出身的数据分析人员。较好能有一些线性代数,统计等数学基本知识,没有也无妨,可以在课程期间快速补强。 收获预期: 对于数据分析基础的朋友,可以提高其处理大数据的能力。对于IT基础的朋友,可以通过课程了解机器学习算法的原理与应用,进军大数据分析领域 授课讲师: tigerfish,知名数据库网站ITPUB创始人,知名数据分析网站炼数成金创始人。数据库专家,数据分析专家,有丰富的IT领域、数学领域的知识经验。他将带领他的数据分析团队完成整个授课工作。 课程试听: 新颖的课程收费形式:“逆向收费”约等于免费学习,仅收取100元固定收费+300元暂存学费,学习圆满则全额奖励返还给学员! 特别说明如下: 本门课程本来打算完全免费,某位大神曾经说过“成功就是正确的方向再加上适度的压力”。考虑到讲师本身要付出巨大的劳动,为了防止一些朋友在学习途中半途而废,浪费了讲师的付出,为此我们计划模仿某些健身课程,使用“逆向收费”的方法。 在 报名时每位报名者收取400元,其中100元为固定 收费,另外300是暂存学费,即如果学员能完成全部课程要求,包括完成全部的书面和互动作业,则300元全款退回。如果学员未能坚持到完全所有的学习计划任务,则会被扣款。期望这种方式可以转化为大家强烈的学习愿望和驱动力! 课程授课方式: 1、 学习方式:老师发布教学资料、教材,幻灯片和视频,学员通过网络下载学习。同时通过论坛互动中老师对学员进行指导及学员之间相互交流。 2、 学习作业:老师每周布置书面及互动作业,学员需按时按质完成作业。 3、 老师辅导:根据作业批改中发现的问题,针对性给予辅导,帮助大家掌握知识。 4、 结业测验:通过测验,完成学业。 您是否对此课程还有疑问,那么请 点击进入 FAQ,您的问题将基本得到解答 咨询QQ: 2222010006 (上班时间在线) 技术热点、 行业资讯,培训课程信息,尽在炼数成金官方微信,低成本传递高端知识!技术成就梦想!欢迎关注! 打开微信,使用扫一扫功能,即刻关注炼数成金官方微信账户,不容错过的精彩,期待您的体验!!! |