当前位置: 企业公开课 > 行业培训 > 其它行业
互联网大数据与机器学习算法设计与实践
课程安排: 上海

其它排期:

授课讲师:孙老师

课程价格:5800

培训对象:

报名热线:400-801-3929

请填写您的报名信息

您的称呼

报名企业

您的电话

< 返回继续选课
 时间地点: 2019-4-20 至 2019-4-21  上海      授课讲师孙老师
 学习费用: 5800 元/位
 培训对象: 对大数据、机器学习感兴趣的同学,最好有一定的机器学习基础。
 课程信息:        
  课程简介
随着智能时代(AI)的到来,数据量急剧增加,如何应用人工智能算法变得越来越有挑战,企业在规划和设计大数据和机器学习算法时,涉及到方方面面的知识点,可选的方案也很多,如何在各种各样,纷繁复杂的技术中构建最适合企业的智能机器学习算法,变成了一件极具挑战的事情。一个好的机器学习算法可以以最低的成本、更灵活的方式,满足企业用户需求。相反,糟糕的智能系统,不但花费了重金,而且算法及其工程架构过于复杂、过于笨重,效果不理想,线上故障不断,缺少灵活性差,将严重阻碍业务的发展。相信大家对大数据以及智能机器学习算法都有一定的认识,但结合业务场景如何在项目中落地实践,缺乏一些经验。
我个人一直从事大数据以及智能机器学习算法设计研发工作,根据在百度、58集团、转转公司等多年的智能系统算法实践及其架构设计经验,带领大家一起学习互联网大数据与智能机器学习算法如何设计实践。理论结合实践,并重点讲述案例,深入剖析大型智能机器学习算法的具体实践。并一同探讨如何满足贵企业的大数据与智能机器学习算法设计。
来吧,一起揭开“互联网大数据与机器学习算法设计与实践”的神秘面纱!

目标收益
1.掌握大数据的核心技能(ODS/DW/DM/APP等);
2.掌握机器学习的核心技能;
3.掌握机器学习训练的全流程(离线、在线等);
4.掌握个性化推荐的全流程;
5.掌握智能搜索的全流程;
6.掌握未来人工智能的发展趋势;
7.课程以理论讲解和案例实践的方式开展,重点让同学们对实际线上项目能够有很深刻的认知。

课程大纲
第一课:互联网大数据与机器学习之大数据知识原理篇
1.什么是大数据以及大数据应用场景是什么;
2.大数据平台如何驱动业务持续增长;
3.大数据平台发展三个阶段是什么(What->Why->How);
4.大数据平台发展阶段一(What):是什么,快速描述业务,提供数据原材料;
5.大数据平台发展阶段二(Why):为什么,分析波动 root cause;
6.大数据平台发展阶段三(How):怎么做,数据化运营实践落地;
第二课:互联网大数据与机器学习之大数据总体架构篇
1.为什么要构建大数据平台;
2.大数据平台构建的目标与方案是什么;
3.大数据仓库如何建设(数据接入清洗/数据仓库表设计与ETL);
4.大数据平台化与产品化建设(ODS->DW->DM->APP);
5.大数据指标体系化、分析框架设计;
6.大数据平台建设的重难点实践;
7.我们的实践案例;
第三课:互联网大数据与机器学习之机器学习知识原理篇
1.机器学习是什么;
2.机器学习与人工智能、深度学习关系;
3.机器学习应用场景是什么;
4.机器学习分类;
5.机器学习评估指标;
6.机器学习常用数学知识;
第四课:互联网大数据与机器学习之机器学习算法篇
1.机器学习算法分类方法;
2.机器学习之监督学习算法(Nave Bayes、LR、GBDT、FM、FFM、DeepFM、FTRL、Deep & Wide等);
3.机器学习之无监督学习算法(K-Means、PCA、LDA等);
4.我们的实践案例;
第五课:互联网大数据与机器学习之机器学习流程篇
1.样本如何抽取;
2.如何做特征工程(特征提取,特征离散化,特征交叉等);
3.如何大规模高效离线训练模型(训练集、测试集、验证集/评估指标AUC、ABTest 等);
4.模型上线;
5.特征上线;
6.我们的实践案例;
第六课:互联网大数据与机器学习之机器学习平台发展篇
1.机器学习平台之小作坊生产模式;
2.机器学习平台之流水线生产模式;
3.机器学习平台之大规模机器学习模式;
4.机器学习平台之大规模深度学习模式;
5.我们实践案例;
第七课:互联网大数据与机器学习之机器学习关键技术篇
1.用户画像系统;
2.系统冷启动;
3.评测指标与系统;
4.ABTest平台;
5.我们的实践案例;
第八课:互联网大数据与机器学习之语言工具篇
1.Python与Scala如何选择;
2.Spark使用及其性能优化;
3.Hadoop使用及其使用优化;
4.Redis使用及其使用优化;
5.Elasticsearch使用及其使用优化;
6.我们实践案例;
第九课:互联网大数据与机器学习之机器学习案例篇(推荐系统线上工程架构设计与实践)1.互联网大型系统架构演进(单体、水平分层、SOA、微服务架构);
2.推荐系统架构演进(石器时代、铁器时代、蒸汽时代);
3.我们的实践案例;
第十课:互联网大数据与机器学习之机器学习案例篇(推荐系统离线工程架构实践)1.离线训练作坊模式(单机);
2.离线训练流水线模式(ODS、DW、DM、分布式训练、线上预测等/DataPipeline、T raining Pipeline、Model Serving);
3.离线训练平台化模式(服务众多业务线,每个业务线一键接入);
4.在线特征系统生产调度架构演进;
5.我们的实践案例;
第十一课:互联网大数据与机器学习之机器学习案例篇(推荐系统召回算法设计与实践)1.商品主题模型;
2.商品物品词模型;
3.基于内容商品相似度模型;
4.基于用户行为的CF模型演进;
5.基于随机游走模型;
6.实时召回模型;
7.我们的实践案例;
第十二课:互联网大数据与机器学习之机器学习案例篇(推荐系统排序算法设计与实践)1.Al l In One阶段;
2.分层排序阶段;
3.人工权重阶段;
4.机器学习模型阶段;
5.实时模型阶段;
6.我们的实践案例;
第十三课:互联网大数据与机器学习之机器学习案例篇(搜索系统工程以及召回排序算法设计与实践)
1.搜索系统工程架构演进;
2.搜索系统召回算法演进;
3.搜索系统排序算法演进;
4.我们的实践案例;


专家介绍
孙老师
转转 首席架构师
转转公司首席架构师/架构算法部负责人,前58集团技术委员会主席,高级系统架构师,“架构之美”公众号作者。擅长系统架构设计,大数据,机器学习等技术领域。代表公司多次参加 Artificial Intelligence Conference、QCon、ArchSummit、SDCC、CCTC、DTCC、Top100、Strata + Hadoop World、WOT 等大会嘉宾演讲,并为《程序员》杂志撰稿 2 篇。 前百度高级工程师,参与百度社区搜索部多个基础系统的设计与实现。毕业于浙江大学。