其它排期:
2020-04-26至2020-04-29 上海
2020-05-28至2020-05-31 广州
2020-06-21至2020-06-24 北京
2020-09-24至2020-09-27 北京
2020-10-27至2020-10-30 上海
2020-12-26至2020-12-29 北京
2021-01-24至2021-01-27 杭州
授课讲师:张老师
课程价格:7800
培训对象:系统架构师、系统分析师、高级程序员、资深开发人员等
请填写您的报名信息
课程介绍
Python是数据分析最常用的语言之一,中文自然语言处理(简称NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。NLP是一门融语言学、机器学习、统计学、大数据以及人工智能等于一体的科学。本课程偏重实战,不仅系统介绍了NLP涉及的知识点,同时也教会大家如何实际应用与开发。
本次培训主要介绍NLP所需要了解的Python科学包、正则表达式以及检索技术的知识。包括NLP相关的各个知识点:词法分析技术、句法分析技术、常用的向量化方法,介绍机器学习的一些基本概念,重点突出NLP常用的分类算法、聚类算法,同时还分享了几个案例。每个部分都有对应源数据和完整代码,供实战使用。
自然语言处理(NLP)属于人工智能与计算机语言学的交叉领域,处理的是计算机与人类语言之间的交互问题。随着人机交互需求的日益增长,计算机具备处理当前主要自然语言的能力已经成为了一个必然趋势。
本培训适合通信、金融、保险、制造、医药、教育科研、市场调研、连锁零售和电子商务等行业的数据分析人员,通过本课程的学习,将对NLP与数据科学领域中的概念有一个充分的了解,并能将这些知识应用到日常工作中。
培训对象
1.系统架构师、系统分析师、高级程序员、资深开发人员。
2.牵涉到网络采集、处理和规划的负责人、设计人员。
3.政府机关,金融保险、移动等以互联网信息为数据来源单位的负责人。
4.高校、科研院所牵涉到人工智能与机器学习的项目负责人。
培训费用及须知
7800元/人(含教材、培训费、考证费以及学习用具等费用) 食宿统一安排,费用自理。
颁发证书
参加相关培训并通过考试的学员,可以获得:
工业和信息化部颁发的-《NLP自然语言处理证书》。该证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。注:请学员带一寸彩照2张(背面注明姓名)、身份证复印件一张。
详细培训内容介绍
课程模块课程主题主要内容及案例和演示
模块一 NLP和深度学习发展概况和最新动态
1. NLP历史现在及为什么需要学习NLP技术
2. NLP实现机器学习,聊天机器人,情感分析和语义搜索
模块二NLP与PYTHON编程
3. Python环境搭建及开发工具安装
4. NLP常用PYTHON开发包的介绍
5. Jieba安装、介绍及使用
6. Stanford NLP 在Python环境中安装、介绍及使用
7. Hanlp 在Python环境中安装、介绍及使用
模块三快速掌握NLP技术之分词、词性标注和关键字提取
08. 分词、词性标注及命名实体识别介绍及应用
09. 准确分词之加载自定义字典分词
10. 准确分词之动态调整词频和字典
11. 词性标注代码实现及信息提取
12. 人名、地名、机构名等关键命名实体识别
13. TextRank算法原理介绍
14. 基于TextRank关键词提取
模块四句法与文法
16. 依存句法与语义依存分析
17. 依存句法树解析(子树遍历,递归搜索,叶子节点提取等)
18. 名词短语块挖掘
19. 自定义语法与CFG
模块五N-GRAM文本挖掘
20. N-GRAM算法介绍
21. N-GRAM生成词语对
22. TF-IDF算法介绍应用
23. 基于TF-IDF挖掘符合语言规范的N-GRAM
模块六表示学习与关系嵌入
24. 语言模型
25. 词向量
26. 深入理解Word2vec算法层次sofmax
27. 深入理解Word2vec算法负采样
28. 6.4 基于Word2vec技术的词向量、字向量训练
模块七 深度学习之卷积神经网络
29. BP神经网络
30. 彻底理解深度学习指卷积神经网络
31. CNN文本分类
32. CNN文本分类算法模块
33. CNN文本分类模型详解数据预处理
34. CNN文本分类模型测试与部署
模块八深度学习之递归神经网络
35. 递归网络
36. LSTM
37. LSTM文本分类原理
38. LSTM文本分类代码架构
39. LSTM文本分类代码详解
40. LSTM文本分类模型预测与部署
模块九特定领域命名实体识别NER技术
41. 基于深度学习医药保险命名实体识别课题背景介绍
42. 医药保险命名实体和实体关系体系建立和命名实体分类规范
43. 医药保险命名实体识别相关前沿技术和难点
44. 基于深度学习医药保险命名实体识别的算法模块设计
45. 数据的采集,清洗,数据机器自动标注及转化为深度学习格式
46. 模型本地Lib库封装
47. 部署tensorflow训练好的模型为云服务
48. 算法设计及代码实现
49. 代码调试,参数优化及深度剖析(深入理解)
师资介绍
张老师:阿里大数据高级专家,国内资深的大数据、Python技术专家,在Python技术编程、NLP自然语言处理、CV领域有很深造诣技术进行了多年的深入的研究,更主要的是这些技术在大量的实际项目中得到广泛的应用,曾使用Tensorflow,Caffe,Keras等深度学习框架完成过多项图像,语音,nlp,搜索相关的人工智能实际项目,研发经验丰富。同时具有多年授课培训经验,讲课通熟易懂,代码风格简洁清晰。