Home

前置机器学习(五):30分钟掌握常用Matplotlib用法

Matplotlib 是建立在NumPy基础之上的Python绘图库,是在机器学习中用于数据可视化的工具。 我们在前面的文章讲过NumPy的用法,这里我们就不展开讨论NumPy的相关知识了。 Matplotlib具有很强的工具属性,也就是说它只是为我所用的,我们不必花太多的精力去精进它。我们只需要知道它可以做那些事,可以绘制哪些图形,有一个印象就足够了。我们在实际使用中用什么拿什么,我们用到了自然就熟练了,用不到的功能也就说明它对你没什么用。 这就是按需学习(Learn on Demand) 。这点我在《如何成为十倍速程序员》里提到过类似的理念。 一、Matplotlib常见用法 1. 绘制简单图像 我们以机器学习中最常见的激活函数sigmoid举例,我们来绘制它。 imp...

Read more

防卒指南:996+健身≈猝死

刚刚看了条新闻,像聊家常似的说两句。希望程序员的心脏能永远“跳动”,指尖的“字节”能永远流淌。 聊聊猝死。 我试着在中文语境下找一些资料来佐证我标题的观点,“运动能锻炼身体的原理”。可惜只能搜到各种健身指南、健身技巧。显然,健身市场很红火, 这些关键字都被买断了。我只能做一些不那么严谨的论证。 在我看来,锻炼是对身体的适当惩罚以达到身体机能补偿的过程。 人类在自然界中生存,物竞天择,我们的身体已经做出了选择。当你总是在奔跑,就奖励你腿部发达的肌肉。当你总是在举重,就奖励你手臂发达的肌肉。但这里有一个借和还的过程。你消耗一定的身体机能再通过自身的调节收获更强大的机能的过程。有借有还,连本带利。 这很公平。但如果你借不出了呢?我是说,你的身体无法承受一次惩罚来获得更大的收益。你的...

Read more

机器学习速查表(cheatsheet)资源汇总分享

本文收集整理了机器学习相关速查表(Machine Learning Cheatsheet),包含机器学习、Python、Numpy、Pandas、Matplotlib、线性代数、微积分、统计学、概率论等相关速查表。我已经建立了开源项目MachineLearningCheatsheets,我将持续更新机器学习相关的各种cheatsheet,欢迎star。 机器学习 神经网络架构 神经网络结构速查表,包括感知机、前馈神经网络、径向基函数网络、循环神经网络等。 Azure 机器学习算法 Microsoft Azure机器学习拥有来自分类,推荐系统,群集,异常检测,回归和文本分析系列的大型算法库。每个都旨在解决不同类型的机器学习问题。 每种机器学习算法都有自己的风格或归纳偏差。...

Read more

前置机器学习(四):一文掌握Pandas用法

Pandas提供快速,灵活和富于表现力的数据结构,是强大的数据分析Python库。 本文收录于机器学习前置教程系列。 一、Series和DataFrame Pandas建立在NumPy之上,更多NumPy相关的知识点可以参考我之前写的文章前置机器学习(三):30分钟掌握常用NumPy用法。 Pandas特别适合处理表格数据,如SQL表格、EXCEL表格。有序或无序的时间序列。具有行和列标签的任意矩阵数据。 打开Jupyter Notebook,导入numpy和pandas开始我们的教程: import numpy as np import pandas as pd 1. pandas.Series Series是带有索引的一维ndarray数组。索引值可不唯一,但必须是...

Read more

前置机器学习(三):30分钟掌握常用NumPy用法

NumPy支持大量的维度数组与矩阵运算,是针对数组运算的Python库。 本文收录于机器学习前置教程系列。 一、Python基础 我们首先巩固一下Python的基础知识。Python有6种标准数据类型:Number(数字),String(字符串),List(列表),Tuple(元组),Set(集合),Dictionary(字典)。 其中: 不可变数据:Number(数字)、String(字符串)、Tuple(元组)。 可变数据:List(列表)、Dictionary(字典)、Set(集合)。 1. List[列表] 列表由方括号 [ ] 包裹,每个位置的数值可变。 list = [1, 2, 3, 4, 5, 6] 根据位置取值,如取第2个位置的值: list[1] ...

Read more

戒烟、写作、赚美金:我的2020年终总结

我在外企工作。 从疫情开始的远程办公,到后来A\B周(一周远程,一周办公室),再到后来的每周远程一天,算上疫情的延长假,我可能在办公室办公100多天。 然后我的作息就不规律了,总见不到人,也有点抑郁。 没有约束的自由,不是真正的自由。 我想到了罗翔老师的这句话,特别准确。如果你没有超强的自制力,时间自由并不能提高你的效率,你会养成很多不好的习惯。所以今年除了上班的本职工作以外我并没有特别的收获。 一、与尼泊尔GDG举办TFUG活动 TFUG是谷歌赞助的公益组织,它的全称是TensorFlow User Group。我本人有幸担任TFUG大连的组织者。受疫情影响,所有线下活动都不能举办,我们采取了线上的方式举办人工智能的分享活动。因为没有了地理限制,我们邀请到了尼泊尔的GD...

Read more

前置机器学习(二):30分钟掌握常用Jupyter Notebook用法

相较于Pycharm执行py文件来说,Jupyter Notebook可保存执行过程,添加图表、注释等富文本说明的功能,使其对机器学习的开发者格外友好。 本文包含机器学习环境安装,Jupyter Notebook常见用法:常见使用、命令、快捷键等。进阶用法:LaTeX数学公式、魔法命令等。 本文收录于机器学习前置教程系列。 一、机器学习环境安装 网上安装机器学习环境的资料非常多,我没有必要过分详细介绍。此处推荐我个人的安装方式Miniconda+清华镜像,因为使用国内镜像所以非常快。 1. Miniconda Miniconda 是Anaconda的最小安装版。只包含conda和Python以及它们依赖的少量软件包,包括pip, zlib等。 Miniconda下载地址:h...

Read more

前置机器学习(一):数学符号及希腊字母

本文收录于机器学习前置教程系列。 本文列出了常用的机器学习数学符号(Mathematical notations),包含代数、微积分、线性代数、概率论、集合论、统计学以及希腊字母。 代数 符号 名称 描述 例子 (f∘g) 复合函数 嵌套函数 (f∘g)(x)=f(g(x)) ∆ 德耳塔 变化/区别 ∆x=x_1-x_0 e 欧拉数 e=2.718281828 $ s= \frac{1}{1+e^{-z...

Read more