基础数学

自然数

数学归纳法

下面的定理都可以用数学归纳法证明,但是我随便复习一下原始的推导。

等差级数

复习一下等差级数求和公式的推导过程:

Sn=1+2+...+(n1)+nS_n = 1 + 2 + ... + (n - 1) + n

Sn=n+(n1)+...+2+1S_n = n + (n - 1) + ... + 2 + 1

两条式子相加,得:

2Sn=(1+n)+(1+n)+...+(1+n),n(1+n)相加2S_n = (1 + n) + (1 + n) + ... + (1 + n), 共n个(1 + n)相加

Sn=(1+n)n2S_n = \dfrac{(1 + n) * n}{2}

推导到一般形式:

$ S_n = a + (a + d) + (a + 2d) + ... + (a + (n - 1)d) + (a + nd) =

\dfrac{(2a + nd) * (n + 1)}{2} $

等比级数

复习一下等比级数求和公式的推导过程:

Gn=a+aq+aq2+...+aqn1+aqnG_n = a + aq + aq^2 + ... + aq^{n - 1} + aq^n

qGn=aq+aq2+...+aqn1+aqn+aqn+1qG_n = aq + aq^2 + ... + aq^{n - 1} + aq^n + aq^{n + 1}

两式相加,得:

GnqGn=aaqn+1G_n - qG_n = a - aq^{n + 1}

Gn=a1qn+11qG_n = a\dfrac{1 - q^{n + 1}}{1 - q}

前n项平方和

由立方公式:

(a+b)3=a3+3a2b+3ab2+b3(a + b)^3 = a^3 + 3a^2b + 3ab^2 + b^3

得:

(n+1)3=n3+3n2+3n+1(n + 1)^3 = n^3 + 3n^2 + 3n + 1

所以有:

23=13+312+31+12^3 = 1^3 + 3 * 1^2 + 3 * 1 + 1

33=23+322+32+13^3 = 2^3 + 3 * 2^2 + 3 * 2 + 1

...

(n+1)3=n3+3n2+3n+1(n + 1)^3 = n^3 + 3n^2 + 3n + 1

两边相加,得:

$ 2^3 + 3^3 + ... + n^3 + (n + 1)^3 = (1^3 + 2^3 + ... + n^3) + 3(1^2 + 2^2 + ... + n^2) +

3(1 + 2 + ... + n) + n $

所以:

(n+1)3=13+3(12+22+...+n2)+3n(1+n)2+n(n + 1)^3 = 1^3 + 3(1^2 + 2^2 + ... + n^2) + \dfrac{3n(1 + n)}{2} + n

$ (1^2 + 2^2 + ... + n^2) = \dfrac{(n + 1)^3 - 1 - \dfrac{3n(1 + n)}{2} - n}{3} \

=\dfrac{2(n + 1)^3 - 2 - 3n(1 + n) - 2n}{6} \

=\dfrac{2(n^3 + 3n^2 + 3n + 1) - 2 - 3n(1 + n) - 2n}{6} \

=\dfrac{2n^3 + 6n^2 + 6n + 2 - 2 - 3n - 3n^2 - 2n}{6} \

=\dfrac{2n^3 + 3n^2 + n}{6} \

=\dfrac{n(2n^2 + 3n + 1)}{6} \ =\dfrac{n(2n^2 + 3n + 1)}{6} \ =\dfrac{n(n + 1)(2n + 1)}{6} $

练习题

第6节,4,5,6,7,8,9,10还没做

数论

素数

素数定理

AnA_n为1~n中素数的个数,由An/nA_n / n表示密度,画出密度函数,是一条在第一向限的双曲线。高斯发现,An/nA_n / n近似等于1lnn\dfrac{1}{\ln n},n越大越相似。

同余

congruence

ab(modd)a \equiv b \pmod d, 表示对于模d,a和b同余,并且ad=nda - d = nd

性质:

如果aa(modd)a \equiv a\prime \pmod d, bb(modd)b \equiv b\prime \pmod d, 则

a+ba+b(modd)a + b \equiv a\prime + b\prime \pmod d, abab(modd)a - b \equiv a\prime - b\prime \pmod d,

abab(modd)a b \equiv a\prime b\prime \pmod d,

罗马数字

I II III IIII V VI VII VIII IX  X XI XIII: 
1V: 5X: 10L: 50C: 100D: 500M: 1000VI = 5 + 1 = 6IX = -1 + 10 = 9
若A则B == 不是A,或BA => B 等于 (!A) || B

三角函数

基本函数英文缩写表达式语言描述

正弦函数sinesin a/c ∠A的对边比斜边

余弦函数cosinecos b/c ∠A的邻边比斜边

正切函数tangenttan a/b ∠A的对边比邻边

余切函数cotangentcot b/a ∠A的邻边比对边

正割函数secantsec c/b ∠A的斜边比邻边

余割函数cosecantcsc c/a ∠A的斜边比对边

贝叶斯定理条件概率:

P(AB)=P(AB)P(B)P(A|B) = \dfrac{P(AB)}{P(B)} 贝叶斯定理 P(BA)=P(AB)P(B)P(A)P(B|A) = \dfrac{P(A|B)P(B)}{P(A)}

信息论

信息增益 = 熵 - 条件熵

如,明天下雨的信息熵是2,如果是阴天明天下雨的信息熵是0.01,那信息增益就是2 - 0.01 = 1.99。信息增益大,说明阴天这个条件对于明天会下雨这个随机事件是很重要的。

导数

简单线性回归

总偏差平方和(又称总平方和,SST,Sum of Squaresfor Total):是每个因变量的实际值(给定点的所有Y)与因变量平均值(给定点的所有Y的平均)的差的平方和,即,反映了因变量取值的总体波动情况回归平方和(SSR,Sum of Squares forRegression):因变量的回归值(直线上的Y值)与其均值(给定点的Y值平均)的差的平方和,即,它是由于自变量x的变化引起的y的变化,反映了y的总偏差中由于x与y之间的线性关系引起的y的变化部分,是可以由回归直线来解释的残差平方和(又称误差平方和,SSE,Sum of Squaresfor Error):因变量的各实际观测值(给定点的Y值)与回归值(回归直线上的Y值)的差的平方和,它是除了x对y的线性影响之外的其他因素对y变化的作用,是不能由回归直线来解释的判定系数R^2 = SSR / SST

向量的积

概率

欧氏空间

欧式空间是满足欧几里得《几何原本》中几何五公理的空间

最大似然估计

很多情况下,我们拿不到总体的数据,只能拿到样本集的数据,从样本集中估计总体的分布。假设我们获得了一个样本X=x1,x2,...,xnX = {x_1, x_2, ... , x_n}, 服从正太分布N(μ,σ)N(\mu, \sigma) ,μ\muσ\sigma是不知道的,记为θ=(μ,σ)T\theta = (\mu, \sigma)^T, θ\theta就是我们要估计的将这个总体分布的概率密度函数写成P(xθ)P(x|\theta), 我们的样本集XX中的每个样本都是独立抽取的,抽到n个样本的概率,就是联合概率(各个概率相乘): L(θ)=L(x1,...,xn;θ)=Πi=1np(xi;θ)L(\theta) = L(x_1, ..., x_n; \theta) = \Pi_{i=1}^n p(x_i;\theta) x是已经的,θ\theta是未知的,L(θ)L(\theta)就认为是似然函数最大似然: 反过来想,能从无穷大的总体中抽到样本集XX,说明样本集出现的概率最大由于L(θ)L(\theta)是连乘的,为了方便计算,变成取自然对数: H(θ)=lnL(θ)=lnΠi=1np(xi;θ)=Σi=1nlnp(xi;θ)H(\theta) = lnL(\theta) = ln\Pi_{i=1}^n p(x_i;\theta) = \Sigma_{i=1}^nlnp(x_i;\theta)

仿射函数

f(x)f(x)称为仿射函数,如果它满足f(x)=ax+b,aRn,bR,xRnf(x) = a \cdot x + b, a \in R^n, b \in R, x \in R^n