自然数
数学归纳法
下面的定理都可以用数学归纳法证明,但是我随便复习一下原始的推导。
等差级数
复习一下等差级数求和公式的推导过程:
Sn=1+2+...+(n−1)+n
Sn=n+(n−1)+...+2+1
两条式子相加,得:
2Sn=(1+n)+(1+n)+...+(1+n),共n个(1+n)相加
Sn=2(1+n)∗n
推导到一般形式:
$ S_n = a + (a + d) + (a + 2d) + ... + (a + (n - 1)d) + (a + nd) =
\dfrac{(2a + nd) * (n + 1)}{2} $
等比级数
复习一下等比级数求和公式的推导过程:
Gn=a+aq+aq2+...+aqn−1+aqn
qGn=aq+aq2+...+aqn−1+aqn+aqn+1
两式相加,得:
Gn−qGn=a−aqn+1
Gn=a1−q1−qn+1
前n项平方和
由立方公式:
(a+b)3=a3+3a2b+3ab2+b3
得:
(n+1)3=n3+3n2+3n+1
所以有:
23=13+3∗12+3∗1+1
33=23+3∗22+3∗2+1
...
(n+1)3=n3+3n2+3n+1
两边相加,得:
$ 2^3 + 3^3 + ... + n^3 + (n + 1)^3 = (1^3 + 2^3 + ... + n^3) + 3(1^2 + 2^2 + ... + n^2) +
3(1 + 2 + ... + n) + n $
所以:
(n+1)3=13+3(12+22+...+n2)+23n(1+n)+n
$ (1^2 + 2^2 + ... + n^2) = \dfrac{(n + 1)^3 - 1 - \dfrac{3n(1 + n)}{2} - n}{3} \
=\dfrac{2(n + 1)^3 - 2 - 3n(1 + n) - 2n}{6} \
=\dfrac{2(n^3 + 3n^2 + 3n + 1) - 2 - 3n(1 + n) - 2n}{6} \
=\dfrac{2n^3 + 6n^2 + 6n + 2 - 2 - 3n - 3n^2 - 2n}{6} \
=\dfrac{2n^3 + 3n^2 + n}{6} \
=\dfrac{n(2n^2 + 3n + 1)}{6} \
=\dfrac{n(2n^2 + 3n + 1)}{6} \
=\dfrac{n(n + 1)(2n + 1)}{6}
$
练习题
第6节,4,5,6,7,8,9,10还没做
数论
素数
素数定理
设An为1~n中素数的个数,由An/n表示密度,画出密度函数,是一条在第一向限的双曲线。高斯发现,An/n近似等于lnn1,n越大越相似。
同余
congruence
a≡b(modd), 表示对于模d,a和b同余,并且a−d=nd
性质:
a≡b(modd), 则b≡a(modd)
如果a≡b(modd), b≡c(modd), 则a≡c(modd)
如果a≡a′(modd), b≡b′(modd), 则
a+b≡a′+b′(modd), a−b≡a′−b′(modd),
ab≡a′b′(modd),
罗马数字
I II III IIII V VI VII VIII IX X XI XIII:
1V: 5X: 10L: 50C: 100D: 500M: 1000VI = 5 + 1 = 6IX = -1 + 10 = 9
若A则B == 不是A,或BA => B 等于 (!A) || B
- 卡诺图:简化逻辑表达式,把重复的逻辑去掉,留下必要的
- Polya原理,TODO
三角函数
基本函数英文缩写表达式语言描述
正弦函数sinesin
a/c
∠A的对边比斜边
余弦函数cosinecos
b/c
∠A的邻边比斜边
正切函数tangenttan
a/b
∠A的对边比邻边
余切函数cotangentcot
b/a
∠A的邻边比对边
正割函数secantsec
c/b
∠A的斜边比邻边
余割函数cosecantcsc
c/a
∠A的斜边比对边
贝叶斯定理条件概率:
P(A∣B)=P(B)P(AB)
贝叶斯定理
P(B∣A)=P(A)P(A∣B)P(B)
信息论
- 随机变量(Random Variable), 指变量的值无法预先确定仅以一定的可能性(概率)取值的量
- 熵,表示随机变量的不确定性。熵越大,不确定性越大,“太阳从东方升起”的熵是0
- 条件熵,在某一条件下,随机变量的不确定性
- 信息增益
信息增益 = 熵 - 条件熵
如,明天下雨的信息熵是2,如果是阴天明天下雨的信息熵是0.01,那信息增益就是2 - 0.01 = 1.99。信息增益大,说明阴天这个条件对于明天会下雨这个随机事件是很重要的。
导数
- 幂函数, x−1=>−x−2
- 指数函数, ax=>axlna
- 对数函数,lnx=>x1
简单线性回归
总偏差平方和(又称总平方和,SST,Sum of Squaresfor Total):是每个因变量的实际值(给定点的所有Y)与因变量平均值(给定点的所有Y的平均)的差的平方和,即,反映了因变量取值的总体波动情况回归平方和(SSR,Sum of Squares forRegression):因变量的回归值(直线上的Y值)与其均值(给定点的Y值平均)的差的平方和,即,它是由于自变量x的变化引起的y的变化,反映了y的总偏差中由于x与y之间的线性关系引起的y的变化部分,是可以由回归直线来解释的残差平方和(又称误差平方和,SSE,Sum of Squaresfor Error):因变量的各实际观测值(给定点的Y值)与回归值(回归直线上的Y值)的差的平方和,它是除了x对y的线性影响之外的其他因素对y变化的作用,是不能由回归直线来解释的判定系数R^2 = SSR / SST
向量的积
- 点积,又叫内积,数量积,各个位相乘然后加起来,结果是一个数
- 向量积,又叫叉积,外积,结果是一个向量
概率
- 联合概率这类包含多个条件且所有条件同时成立的概率称为联合概率, 其实就是各个概率相乘
- 边缘概率也叫边际概率。对于单个随机变量有关的概率称为边缘概率
- 概率函数,就是用函数的形式来表达概率
- 对于连续型随机变量,概率密度函数, 就是分布函数的导函数离散型随机变量,不讨论概率密度函数,因为分散的点,我们知道概率,而连续型,一个点是无限小的。
概率密度函数就像密度一样:
ρ=V→0limΔVΔm
求质量,对密度积分就可以了,所以要求概率,对概率密度函数积分就可以了。
欧氏空间
欧式空间是满足欧几里得《几何原本》中几何五公理的空间
最大似然估计
很多情况下,我们拿不到总体的数据,只能拿到样本集的数据,从样本集中估计总体的分布。假设我们获得了一个样本X=x1,x2,...,xn, 服从正太分布N(μ,σ) ,μ和σ是不知道的,记为θ=(μ,σ)T, θ就是我们要估计的将这个总体分布的概率密度函数写成P(x∣θ), 我们的样本集X中的每个样本都是独立抽取的,抽到n个样本的概率,就是联合概率(各个概率相乘):
L(θ)=L(x1,...,xn;θ)=Πi=1np(xi;θ)
x是已经的,θ是未知的,L(θ)就认为是似然函数最大似然: 反过来想,能从无穷大的总体中抽到样本集X,说明样本集出现的概率最大由于L(θ)是连乘的,为了方便计算,变成取自然对数:
H(θ)=lnL(θ)=lnΠi=1np(xi;θ)=Σi=1nlnp(xi;θ)
仿射函数
f(x)称为仿射函数,如果它满足f(x)=a⋅x+b,a∈Rn,b∈R,x∈Rn