小伙伴们,本公众号很久没用送书啦,是不是很是期待呀?放心啦,这次给联合5个大佬,每个大佬送5本书,一共30本!包邮到你家楼下,哈哈!以下书籍任选一本!书籍详细内容请往下看,有具体介绍的!
怎么送书呢?
方法当然是很简单啦,关注下面公众号,后台回复「抽奖」,弹出小程序二维码后长按就能参与抽奖啦!全部参与,中奖率提高很多倍!
开奖时间为:2019.8.25 20:00
中奖的小伙伴一定要记得加对应的公众号博主微信哈!告知具体信息!
Python数据科学
计算机视觉life
python爬虫人工智能大数据
深度学习自然语言处理
小小挖掘机
机器学习算法工程师
书籍内容
共两种书!
书籍一
内容介绍
《神经网络与深度学习实战:Python+Keras+TensorFlow》通过理论与项目实践相结合的方式领读者进入人工智能技术的大门。
《神经网络与深度学习实战:Python+Keras+TensorFlow》中首先从人工智能技术的数学基础讲起,然后重点剖析神经网络的运行流程,最后以大量的实际项目编码实践方式帮助读者扎实地掌握人工智能开发所需要的基本理论知识和核心开发技术。
《神经网络与深度学习实战:Python+Keras+TensorFlow》共15章,涵盖的内容有神经网络初体验;深度学习的微积分基础;深度学习的线性代数基础;神经网络的理论基础;用Python从零实现识别手写数字的神经网络;神经网络项目实践;使用神经网络实现机器
视觉识别;用深度学习实现自然语言处理;自动编解码网络和生成型对抗性网络;增强性学习网络的开发实践;TensorFlow入门;使用TensorFlow和Keras开发高级自然语言处理系统;使用TensorFlow和Keras实现高级图像识别处理系统;使用TensorFlow和Keras打造智能推荐系统;深度学习重要概念和技巧总结。
《神经网络与深度学习实战:Python+Keras+TensorFlow》尽可能通过细致的讲解降低读者入门人工智能编程的门槛。
《神经网络与深度学习实战:Python+Keras+TensorFlow》中案例丰富,内容非常实用,特别适合有志于投身人工智能领域的IT专业人士或学生阅读。
阅读《神经网络与深度学习实战:Python+Keras+TensorFlow》需要读者具有一定的数学基础。
作者介绍
陈屹,海南康康饼网络科技有限公司CEO。毕业于数学专业,拥有十几年的软件开发经验。曾经任职于联想、微软和Realnetworks等国内外知名公司,从事客户端及服务端开发工作。熟练掌握C++、Java和Python等开发语言,擅长算法逻辑和架构设计。目前致力于对人工智能技术的研究。
目录
前言本书内容导图第1章 神经网络初体验1.1 开发环境的安装1.2 快速构建一个识别手写数字图片的神经网络第2章 深度学习中的微积分基础2.1 实数中的无理数2.2 什么叫极限2.3 函数的连续性2.4 函数求导2.5 导数的一般法则2.6 间套函数的链式求导法则2.7 多变量函数与偏导数2.8 导数与极值2.9 使用导数寻求函数的最小值第3章 深度学习的线性代数基础3.1 常量与向量3.2 矩阵及相关操作3.3 tensor-多维向量3.4 向量范数第4章 神经网络的理论基础4.1 详解神经网络中的神经元激活函数4.2 使用矩阵运算驱动神经网络数据加工链4.3 通过反向传播算法回传误差改进链路权重4.4 使用矩阵和梯度下降法实现神经网络的迭代训练4.5 手算梯度下降法,详解神经网络迭代训练过程第5章 用Python从零实现识别手写数字的神经网络5.1 基本框架的搭建5.2 实现网络的迭代训练功能5.3 网络训练,识别手写数字图片第6章 神经网络项目实践6.1 使用神经网络分析电影评论的正能量和负能量6.2 使用神经网络实现新闻话题分类6.3 使用神经网络预测房价中位数第7章 使用神经网络实现机器视觉识别7.1 卷积神经网络入门7.2 从零开始构造一个识别猫、狗图片的卷积网络7.3 使用预先训练的卷积网络实现图像快速识别7.4 视觉化神经网络的学习过程7.5 揭秘卷积网络的底层原理第8章 用深度学习实现自然语言处理8.1 WordEmbedding单词向量化8.2 概率论的一些重要概念8.3 skip-gram单词向量化算法的数学原理8.4 使用预先训练好的单词向量实现新闻摘要分类8.5 RNN-具有记忆功能的神经网络8.6 LSTM网络层详解及其应用8.7 使用RNN和CNN混合的“鸡尾酒疗法”提升网络运行效率第9章 自动编解码网络和生成型对抗性网络9.1 自动编解码器网络的原理与实现9.2 去噪型编解码网络9.3 使用自动编解码网络实现黑白图片上色9.4 生成型对抗性网络9.5 生成型对抗性网络的代码实现9.6 条件性生成型对抗性网络……第10章 增强性学习网络开发实践第11章 TensorFlow入门第12章 使用TensorFlow和Keras开发高级自然语言处理系统第13章 使用TensorFlow和Keras实现高级图像识别处理系统第14章 使用TensorFlow和Keras打造智能推荐系统第15章 深度学习的重要概念和技巧总结
序言
2013年3月,人类社会迎来了历史性的转折点。谷歌的AlphaGo干脆利落地击败了围棋世界冠军李世石,由此掀起了人们对人工智能的关
热潮。与此同时,也标志着人类正式进入了智能时代。
围棋向来被认为是计算机永远无法攻克的人类智慧阵地,甚至很多人一度把围棋的“棋道”看做是“天道”在人间的表现。计算机要在围棋上战胜人类的确很难。长久以来,由于围棋走法的变化万千,传统思维下的计算机程序根本无法应对围棋所展现的复杂局面。
然而谷歌的DeepMind团队转换了思维方式,将围棋看做是一道数学题,看成是一种数理统计规律在现实世界的呈现。从这个角度来看,围棋“道”的神秘面纱被揭开。其实它并不神秘,而是一种概率性呈现。我们可以应用概率论、数理统计等原理,通过构建模型,然后使用大量实际数据来训练模型。于是我们可以看到,在围棋千变万化表面下的不变本质其实是蕴含在模型中的。
人工智能解决问题的思维是如此美妙!它是一种全新的思维方式,通过数学模型的方式对万事万物进行解构,然后再用强大的算力抽象出隐藏在事物表象下的规律,因此它是一种高阶思维方式。当你掌握了人工智能的思维方式,特别是人工智能开发技术,那就相当于你能执时代趋势之牛耳,在未来的激烈竞争中立于不败之地。
对于IT技术人员而言,人工智能的入门曲线极为陡峭,想要掌握它,需要非常扎实的数学理论基础,而且还要把原有的离散化逻辑思维方式转变为数据流似的连续型思维方式。图书市场上虽然已经有了不少人工智能技术书籍,但它们都很少考虑到如何帮助读者顺利度过思维模式转变的困难,本书希望在这方面能做一些有益的尝试。
书籍二
编辑推荐
适读人群 :Python大数据挖掘、机器学习、深度学习等相关从业人员与爱好者;机器学习算法爱好者;人工智能研发人员;高校与培训班学生
详解机器学习的常见算法与数据挖掘的10大经典实战案例
涵盖大数据挖掘、深度学习、强化学习和在线学习等内容
如何使用好数据?
如何对数据进行回归分析?
如何快速有效地掌握分类和聚类算法?
深度学习的核心技术有哪些?
如何做好图像识别?
如何进行在线学习?
如何做好强化学习?
如何实现聊天机器人?
如何构建基于卷积神经网络的雷达图像识别模型?
如何理解分类和回归等任务的损失函数?
如何实现中文分词系统?
……
通过阅读本书,你将了解这些复杂问题背后的原理,甚至你都可以自己解决这些问题。
本书核心知识:
机器学习基础
Python语言简介
回归分析
决策树与随机森林
支持向量机
隐马尔可夫模型
BP神经网络模型
卷积神经网络
循环神经网络
聚类与集成算法
其他机器学习算法
本书十大经典案例:
票务网站信息的爬取
环境检测数据异常分析与预测
鸢尾花和葡萄酒数据集分类
用SVM进行时间序列曲线预测
HMM模型在中文分词中的应用
基于CNN的雷达图像识别
朴素贝叶斯分类器在破产预测中的应用
用LSTM模型实现一个聊天机器人
用DCGAN网络生成人脸图像
用Adaboost算法实现马疝病的检测
本书赠送超值学习资料
实例源代码文件
实例素材文件
14段操作视频
专业教学PPT
内容介绍
本书作为数据挖掘和机器学习的读物,基于真实数据集进行案例实战,使用Python数据科学库,从数据预处理开始一步步介绍数据建模和数据挖掘的过程。书中主要介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带领读者轻松踏上数据挖掘之旅。本书采用理论与实践相结合的方式,呈现了如何使用逻辑回归进行环境数据检测,如何使用HMM进行中文分词,如何利用卷积神经网络识别雷达剖面图,如何使用循环神经网络构建聊天机器人,如何使用朴素贝叶斯算法进行破产预测,如何使用DCGAN网络进行人脸生成等。本书也涉及神经网络、在线学习、强化学习、深度学习和大数据处理等内容。
本书以人工智能主流编程语言Python 3版作为数据分析与挖掘实战的应用工具,从Pyhton的基础语法开始,陆续介绍了NumPy数值计算、Pandas数据处理、Matplotlib数据可视化、爬虫和Sklearn数据挖掘等内容。全书共涵盖16个常用的数据挖掘算法和机器学习实战项目。通过学习本书内容,读者可以掌握数据分析与挖掘的理论知识及实战技能。
本书内容丰富,讲解由浅入深,特别适合对数据挖掘和机器学习算法感兴趣的读者阅读,也适合需要系统掌握深度学习的开发人员阅读,还适合Python程序员及人工智能领域的开发人员阅读。编程爱好者、高校师生及培训机构的学员也可以将本书作为兴趣读物或教材使用。
作者介绍
方巍 博士,博士后,副教授,高级工程师,硕士生导师。美国佛罗里达大学访问学者,中国计算机学会高级会员,ACM会员,中国系统分析师协会(CSAI)顾问团专业顾问,江苏省计算机学会会员,江苏省人工智能学会委员,江苏省政府采购招标评审专家,江苏省高新技术企业认定评审专家。负责和参与国家、省部级科研项目12项。在国内外学术期刊上发表论文20余篇,其中被SCI和EI检索15篇。获国家发明专利授权8项、软件著作权9项。出版科技图书2部。
目录
前言 第1章 机器学习基础1 1.1 机器学习概述2 1.2 机器学习的发展历程2 1.3 机器学习分类3 1.3.1 监督学习3 1.3.2 无监督学习3 1.3.3 强化学习4 1.3.4 深度学习4 1.4 机器学习的应用4 1.5 开发机器学习的步骤7 1.6 Python语言的优势8 1.6.1 可执行伪代码8 1.6.2 Python语言使用广泛8 1.6.3 Python语言特色8 1.6.4 Python语言的缺点9 1.7 Python开发工具介绍9 1.7.1 IDLE简介10 1.7.2 IPython简介11 1.7.3 PyCharm简介11 1.7.4 Jupyter Notebook简介12 1.7.5 Anaconda和Spyder简介13 1.8 本章小结15 第2章 Python语言简介16 2.1 搭建Python开发环境16 2.1.1 安装Anaconda16 2.1.2 安装Spyder18 2.1.3 运行和保存Python程序19 2.2 Python计算与变量19 2.2.1 用Python做简单的计算20 2.2.2 Python的运算符20 2.2.3 Python的变量21 2.3 Python的字符串22 2.4 Python的列表23 2.5 Python的元组25 2.6 Python的字典27 2.7 网络爬虫的发展历史和分类28 2.7.1 网络爬虫的发展历史28 2.7.2 网络爬虫的分类30 2.8 网络爬虫的原理30 2.8.1 理论概述30 2.8.2 爬虫的工作流程31 2.9 爬虫框架介绍36 2.9.1 Scrapy介绍36 2.9.2 XPath介绍39 2.10 网络爬虫的设计与实现40 2.10.1 网络爬虫的总体设计40 2.10.2 具体实现过程40 2.10.3 爬虫结果与分析45 2.11 本章小结49 第3章 回归分析50 3.1 回归分析概述50 3.1.1 基本概念50 3.1.2 可以解决的问题51 3.1.3 回归分析的步骤51 3.2 线性回归51 3.2.1 简单线性回归分析51 3.2.2 多元线性回归分析52 3.2.3 非线性回归数据分析52 3.3 用Python实现一元线性回归53 3.4 用Python实现多 元线性回归56 3.4.1 使用pandas读取数据56 3.4.2 分析数据57 3.4.3 线性回归模型58 3.5 基于线性回归的股票预测62 3.5.1 数据获取62 3.5.2 数据预处理63 3.5.3 编码实现64 3.5.4 结果分析65 3.6 逻辑回归66 3.6.1 构造预测函数67 3.6.2 构造损失函数J68 3.6.3 梯度下降法求解最小值69 3.7 基于逻辑回归的环境数据检测71 3.7.1 数据来源71 3.7.2 数据处理72 3.7.3 异常数据分析72 3.7.4 数据预测74 3.8 本章小结76 第4章 决策树与随机森林77 4.1 决策树77 4.1.1 决策树的基本原理77 4.1.2 决策树的分类78 4.1.3 决策树的优缺点81 4.2 使用决策树对鸢尾花分类82 4.2.1 Iris数据集简介82 4.2.2 读取数据83 4.2.3 鸢尾花类别83 4.2.4 数据可视化84 4.2.5 训练和分类85 4.2.6 数据集多类分类86 4.2.7 实验结果86 4.3 随机森林87 4.3.1 随机森林的基本原理87 4.3.2 随机森林的收敛性88 4.3.3 随机森林的OOB估计89 4.3.4 随机森林的随机特征选取89 4.3.5 随机森林的优缺点90 4.4 葡萄酒数据集的随机森林分类91 4.4.1 数据收集91 4.4.2 相关库函数简介92 4.4.3 数据基本分析93 4.4.4 使用随机森林构建模型97 4.4.5 实验结果98 4.5 本章小结99 第5章 支持向量机100 5.1 SVM的工作原理及分类100 5.1.1 支持向量机的原理100 5.1.2 线性可分的支持向量机101 5.1.3 非线性可分的支持向量机102 5.2 核函数103 5.2.1 核函数简介103 5.2.2 几种常见的核函数104 5.2.3 核函数如何处理非线性数据104 5.2.4 如何选择合适的核函数105 5.3 SVR简介106 5.3.1 SVR原理106 5.3.2 SVR模型106 5.4 时间序列曲线预测107 5.4.1 生成训练数据集107 5.4.2 运用不同的核函数进行支持向量回归108 5.4.3 生成测试数据集109 5.4.4 预测并生成图表110 5.4.5 获取预测误差111 5.4.6 创建数据集112 5.4.7 选取最优参数112 5.4.8 预测并生成图表112 5.4.9 获取预测误差113 5.5 本章小结114 第6章 隐马尔可夫模型115 6.1 隐马尔可夫模型简介115 6.1.1 隐马尔可夫模型的概念115 6.1.2 详例描述116 6.1.3 HMM流程117 6.2 Viterbi算法117 6.3 HMM模型用于中文分词119 6.3.1 UI界面119 6.3.2 数据及其编码119 6.3.3 HMM模型121 6.3.4 实验结果122 6.4 本章小结124 第7章 BP神经网络模型125 7.1 背景介绍125 7.2 结构特点126 7.3 网络模型126 7.4 人工神经网络简介127 7.4.1 神经元127 7.4.2 单层神经网络128 7.4.3 双层神经网络129 7.4.4 多层神经网络130 7.5 BP神经网络131 7.6 通过TensorFlow实现BP神经网络132 7.7 本章小结134 第8章 卷积神经网络135 8.1 传统图像识别技术135 8.1.1 图像预处理135 8.1.2 图像特征提取136 8.1.3 图像分类方法136 8.2 卷积神经网络结构简介137 8.2.1 卷积神经网络发展历程137 8.2.2 卷积神经网络结构简介137 8.3 卷积神经网络的结构及原理139 8.3.1 卷积层139 8.3.2 池化层140 8.3.3 激活函数142 8.3.4 全连接层144 8.3.5 反馈运算144 8.4 卷积神经网络的优点146 8.5 雷达剖面图识别模型148 8.5.1 数据准备148 8.5.2 构建模型150 8.6 模型测试分析157 8.6.1 部署基本模块157 8.6.2 创建项目结构157 8.6.3 训练网络158 8.6.4 自动化测试158 8.7 本章小结160 第9章 循环神经网络161 9.1 自然语言处理161 9.1.1 自然语言处理概述161 9.1.2 自然语言处理应用162 9.2 对话系统163 9.2.1 对话系统分类163 9.2.2 聊天机器人分类164 9.3 基于LSTM结构的循环神经网络165 9.3.1 循环神经网络165 9.3.2 通过时间反向传播166 9.3.3 长短期记忆网络(LSTM)169 9.4 Seq2Seq模型172 9.4.1 Encoder-Decoder框架173 9.4.2 Attention机制174 9.5 聊天机器人的程序实现176 9.5.1 准备数据176 9.5.2 创建模型178 9.5.3 训练模型179 9.5.4 测试模型180 9.6 本章小结181 第10章 聚类与集成算法182 10.1 聚类方法简介182 10.1.1 聚类定义183 10.1.2 聚类要 求183 10.2 聚类算法184 10.2.1 划分方法184 10.2.2 层次方法184 10.2.3 基于密度的方法184 10.2.4 基于网格的方法185 10.2.5 基于模型的方法185 10.3 K-Means算法185 10.3.1 K-Means算法概述185 10.3.2 K-Means算法流程185 10.3.3 K-Means算法实现186 10.3.4 实验结果及分析188 10.3.5 K-Means算法存在的问题188 10.4 K-Means++算法189 10.4.1 K-Means++的基本思想189 10.4.2 K-Means++的数学描述190 10.4.3 K-Means++算法流程190 10.5 K-Means++的实现191 10.5.1 数据集191 10.5.2 代码实现192 10.5.3 K-Means++实验结果193 10.6 Adaboost集成算法的原理194 10.6.1 Boosting算法的基本原理194 10.6.2 Adaboost算法介绍195 10.6.3 Adaboost分类问题的损失函数优化197 10.6.4 Adaboost二元分类问题的算法流程198 10.6.5 Adaboost回归问题的算法流程199 10.6.6 Adaboost算法的正则化200 10.6.7 Adaboost的优缺点200 10.7 Adaboost算法实现201 10.7.1 数据集处理201 10.7.2 实现过程201 10.7.3 实验结果分析206 10.8 本章小结208 第11章 其他机器学习算法209 11.1 贝叶斯分类器210 11.1.1 概率基础知识210 11.1.2 贝叶斯决策准则211 11.1.3 极大似然估计212 11.2 贝叶斯分类模型213 11.2.1 朴素贝叶斯分类模型213 11.2.2 半朴素贝叶斯分类模型216 11.2.3 贝叶斯网络分类模型217 11.3 朴素贝叶斯分类器在破产预测中的应用219 11.3.1 数据集219 11.3.2 训练多项式朴素贝叶斯模型220 11.4 在线学习222 11.4.1 线性模型的在线学习222 11.4.2 非线性模型的在线学习224 11.5 Bandit在线学习算法225 11.5.1 Bandit算法与推荐系统226 11.5.2 常用Bandit算法226 11.6 Bandit算法原理及实现228 11.7 GAN网络229 11.7.1 GAN产生的背景230 11.7.2 模型结构230 11.7.3 GAN的实现原理232 11.8 DCGAN网络236 11.8.1 模型结构236 11.8.2 反卷积237 11.9 DCGAN人脸生成240 11.9.1 实验准备240 11.9.2 关键模块的实现240 11.9.3 实验结果展示243 11.10 本章小结245 附录A 机器学习常见面试题246 附录B 数学基础257 B.1 常用符号257 B.2 数学基础知识259 B.2.1 线性代数259 B.2.2 概率论261 B.2.3 信息论262 参考文献264
序言
Python是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。作为一门编程语言,其魅力远超C#、Java、C和C++等编程语言,被昵称为“胶水语言”,更被热爱它的程序员誉为“最美丽的”编程语言。从云端和客户端,再到物联网终端,Python应用无处不在,同时它还是人工智能(AI)首选的编程语言。
近年来,人工智能在全世界掀起了新的科技浪潮,各行各业都在努力涉足人工智能技术。而机器学习是人工智能的一种实现方式,也是最重要的实现方式之一。深度学习是目前机器学习比较热门的一个方向,其本身是神经网络算法的衍生,在图像、语音等富媒体的分类和识别上取得了非常好的效果。数据挖掘主要利用机器学习界提供的技术来分析海量数据,利用数据库界提供的技术来管理海量数据。例如,在对超市货品进行摆放时,牛奶到底是和面包摆放在一起销量更高,还是和其他商品摆在一起销量更高,就可以用相关算法得出结论。由于机器学习技术和数据挖掘技术都是对数据之间的规律进行探索,所以人们通常将两者放在一起提及。而这两种技术在现实生活中也有着非常广阔的应用场景。例如,分类学习算法可以对客户等级进行划分,可以验证码识别,可以对水果品质自动筛选等;回归学习算法可以对连续型数据进行预测,以及对趋势进行预测等;聚类学习算法可以对客户价值和商圈做预测;关联分析可以对超市的货品摆放和个性化推荐做分析;而深度学习算法还可以实现自然语言处理方面的应用,如文本相似度、聊
天机器人及自动写诗作画等应用。
纵观国内图书市场,关于Python的书籍不少,它们主要偏向于工具本身的用法,如关于Python的语法、参数、异常处理、调用及开发类实例等,但是基于Python数据挖掘与机器学习类的书籍并不是特别多,特别是介绍最新的基于深度学习算法原理和实战的图书更少。本书将通过具体的实例来讲解数据处理和挖掘技术,同时结合最新的深度学习、强化学习及在线学习等理论知识和实用的项目案例,详细讲解16种常用的数据挖掘和机器学习算法。
本书有何特色
1.全程使用Python 3编程语言
本书通过Anaconda和Spyder提供的Python编程功能实现各种算法:
* 介绍了Scrapy框架和XPath工具;
* 重点介绍了TensorFlow工具的开发和使用;
* 以票务网为例,实现了网站票务信息的爬虫案例。
2.剖析回归分析的基本原理
回归分析是一种应用极为广泛的数量分析方法。本书中的回归分析相关章节实现了如下几个重要例子:
* 对于线性回归,介绍了如何使用一元线性回归求解房价预测的问题;
* 实例演示了使用多元线性回归进行商品价格的预测,以及使用线性回归对股票进行预测;
* 通过环境检测数据异常分析与预测这个实验,用实例具体实现了逻辑回归的过程。
3.详解分类和聚类机器学习算法
在数据挖掘领域中,对分类和聚类算法的研究及运用非常重要。书中着重研究了决策树、随机森林、SVM、HMM、BP神经网络、K-Means和贝叶斯等算法,并实现了以下例子:
* 使用决策树算法对鸢尾花数据集进行分类;
* 使用随机森林对葡萄酒数据集进行分类;
* SVM中采用三种核函数进行时间序列曲线预测;
* HMM模型用于中文分词;
* 用TensorFlow实现BP神经网络;
* 朴素贝叶斯分类器在破产预测中的应用。
4.详细地描述了常用的深度学习算法
本书相关章节中详细地描述了卷积神经网络、循环神经网络、生成对抗网络等。主要有如下实例演示:
* 采用卷积神经网络实现了雷达剖面图识别实例;
* 使用LSTM模型实现了一个聊天机器人的程序;
* 通过DCGAN网络来训练数据,从而产生人脸图像。
5.讨论了其他常用机器学习算法
本书中还讨论了在线学习和强化学习等常见的机器学习算法,例如:
* 演示在线学习Bandit算法与推荐系统;
* 使用Adaboost算法实现马疝病的检测。
6.提供了丰富而实用的数据挖掘源代码,并提供了操作视频和教学PPT
本书详尽地描述了各种重要算法,并提供了很多来源于真实项目案例的源代码。另外,还特别为本书制作了相关操作的教学视频和专业的教学PPT和操作视频,以方便读者学习。
* 卷积神经网络雷达图像识别项目;
* LSTM聊天机器人项目;
* HMM中文分词系统;
* DCGAN的人脸生成模型。
本书内容及知识体系
第1章主要对机器学习的基本概念进行了概述,介绍了5种Python开发工具,分别是IDLE、IPython、PyCharm、Jupyter Notebook、Anaconda和Spyder,对它们的特点进行了阐述,并选择Anaconda和Spyder作为本书的开发工具。
第2章主要介绍了Python开发环境、计算规则与变量,并详细介绍了Python常用的数据类型,分别是字符串、列表、元组和字典;还介绍了爬虫的基本原理,其中重点介绍了Scrapy框架和XPath工具,并且以票务网为例实现了网站票务信息的爬取。
第3章首先介绍了数据挖掘中的回归分析
和线性回归的基本概念,然后介绍了如何使用一元线性回归求解房价预测的问题,最后介绍了使用多元线性回归进行商品价格的预测。本章通过环境检测数据异常分析与预测这个实验,对逻辑回归做出了具体的表现分析。
第4章是关于常用分类算法的讲解,主要对决策树和随机森林的基本概念和算法原理进行了详细阐述。本章使用决策树对鸢尾花数据集进行分类,并使用随机森林对葡萄酒数据集进行分类。通过学习本章内容,读者会对决策树算法和随机森林算法有更进一步的认识。
第5章主要介绍了基于统计学习理论的一种机器学习方法——支持向量机,通过寻求结构风险最小来提高泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本较少的情况下也能获得良好的统计规律的目的,可利用SMO算法高效求解该问题。针对线性不可分问题,利用函数映射将原始样本空间映射到高维空间,使得样本线性可分,进而通过SMO算法求解拉普拉斯对偶问题。
第6章介绍了隐马尔可夫模型要解决的三个基本问题,以及解决这三个基本问题的方法,带领读者深入学习解码问题,并掌握解决解码的Viterbi算法,运用Viterbi算法思想精髓“将全局最佳解的计算过程分解为阶段最佳解的计算”,实现对语料的初步分词工作。此外,本章还介绍了HMM模型用于中文分词的方法。
第7章介绍了人工神经网络(Artificial Neural Network,ANN)的基本概念、特点、组成部分和前向传播等内容;阐述了单层神经网络、双层神经网络及多层神经网络的概念和原理;使用TensorFlow实现BP神经网络,进一步强化对BP神经网络的理解和使用。
第8章主要介绍了卷积神经网络的原理及其在图像识别领域中的应用。本章带领读者掌握卷积神经网络的各层,包括输入层、卷积层、池化层、全连接层和输出层;利用卷积神经网络进行雷达图像识别,实现了对雷暴大风灾害性天气的识别,并以地面自动站出现7级大风作为出现灾害性雷暴大风天气的判据,从而建立一套集雷暴大风实时识别、落区预报及落区检验于一体的综合系统。
第9章从自然语言处理的基础知识引入了循环神经网络,并详细阐述其原理及强大之处,最后使用它来实现聊天机器人。循环神经网络常用于处理序列数据,例如一段文字或声音、购物或观影的顺序,甚至可以是图片中的一行或一列像素。
第10章介绍了聚类与集成算法的相关知识。K-Means聚类是一种自下而上的聚类方法,其优点是简单、速度快;Adaboost算法是Boosting方法中最流行的一种算法。集成算法便是将多个弱学习模型通过一定的组合方式,形成一个强学习模型,以达到提高学习正确率的目的。
第11章介绍了贝叶斯分类器分类方法,在一个真实数据集上执行了朴素贝叶斯分类器的训练预测,取得了理想的效果;在围绕实时大数据流分析这一需求展开的研究中,对在线学习Bandit算法的概念进行了阐述,并用Python进行了实验分析;还对生成对抗网络(GAN)进行了讲解,同时也介绍了DCGAN网络模型,并且使用DCGAN网络进行了人脸生成实验。
本书配套资源获取方式
本书涉及的源代码文件、教学视频、教学PPT视频和Demo需要读者自行下载。请登录华章公司的网站www.hzbook.com,在该网站上搜索到本书页面,然后单击“资料下载”按钮即可在页面上找到“配书资源”下载链接。
本书读者对象
* Python程序员;
* 对数据挖掘感兴趣的人员;
* 对机器学习和深度学习感兴趣的人员;
* 想转行到人工智能领域的技术人员;
* 想从其他编程语言转Python开发的人员;
* 喜欢编程的自学人员;
* 高校计算机等专业的学生;
* 专业培训机构的学员。
本书阅读建议
* 没有Python开发基础的读者,建议从第1章顺次阅读并演练每一个实例。
* 有一定Python数据挖掘基础的读者,可以根据实际情况有重点地选择阅读各个模块和项目案例。对于每一个模块和项目案例,先思考一下实现的思路,然后再亲自动手实现,这样阅读效果更佳。
* 有基础的读者可以先阅读书中的模块和Demo,再结合配套源代码理解并调试,这样更加容易理解,而且也会理解得更加深刻。
本书作者
本书由方巍主笔编写。其他参与编写和程序调试工作的人员还有王秀芬、丁叶文和张飞鸿。本书能得以顺利出版,要感谢南京信息工程大学计算机与软件学院2017级的全体研究人员,还要感谢在写作和出版过程中给予笔者大量帮助的各位编辑!
由于笔者水平所限,加之写作时间有限,书中可能还存在一些疏漏和不足之处,敬请各位读者批评指正。联系邮箱:hzbook2017@163.com。
最后祝大家读书快乐!
编著者
看到这里啦,还不赶紧去上面扫二维码领书呀!