1.极限与连续-——“机器学习中的数学”
创始人
2024-01-28 00:38:40
0

1.通过集合相等来讲解什么是映射关系

上面问的这个问题(2N+ = N2)说明了什么?

——两个无穷集合,如果能找到一种对应关系(映射关系),那么我们就可以说这两个集合是等价的。

  数列的极限就是趋势

极限就是无限接近,但是不等于

下面这是一个数列的极限,当n趋近于正无穷,数列趋近于自然数e

\LARGE \lim _{n \rightarrow+\infty}\left(1+\frac{1}{n}\right)^n=\mathrm{e}

用画图表示就是这样,无限逼近于自然数e

 洛必达法则

若函数f(x)和g(x)满足下列条件:

随着x逼近a, 本身f(x)和g(x)都是逼近于正无穷的,但是通过f(x)和g(x)做比,可以得出这个“比”趋近于某个数A。如果A大于1,比如说A等于2,说明f(x)比g(x)趋近于正无穷的速度快。A表示的是一种趋近速度。

        (1)随着x不断向a逼近,如果f(x)和g(x)是趋近于一个常数,那么A越大,f(x)的收敛速度越快。

        (2)随着x不断向a逼近,如果f(x)和g(x)趋近于无穷,那么A越大,f(x)发散的速度越快

 像我们做机器学习追求的就是“单调有界收敛”,像下面这个图,

        单调:从小于e到逼近e这个方向走,说明这个数据是有规律的。如果方向一会增,一会减就是无规律的,就是噪声。

        有界:收敛的过程中,走了一段时间,和e的差距小于某个值,epsilon,比如0.1

和单调有界收敛相反的是“无界发散”,其实就是噪声

夹逼准则

假设一个函数是c,这个c介于a和b之间。这个函数c的极限不好求,我去求c所在区间的两个端点的极限值,进而推出c的极限值。这个过程可以叫做双参设计

 上夹逼趋近于c,下夹逼也趋近于c。上夹逼和下夹逼不断逼近c,离c越来越近,直到我们找到上夹逼或者下夹逼中的一个更加贴近c,我们就把这个夹逼拿出来作为c的近似函数。这个无限接近的过程就是我们所所的“拟合“。

        过拟合就是上夹逼和下夹逼趋近到最中间了(我认为不对)

        欠拟合就是,上下夹逼距离我们的的拟合目标c距离太远了。

函数的极限

什么是函数?

函数表达式 是为了以数学符号的形式 表示函数图像。

函数起源于信号学里面的函数图像。(1)比如一个函数图像像下面这样,每一次我们给别人说我们讨论一下下面这样的一个函数的时候,我们都得把这个函数的图像画一遍。每次都要画图真的很累,于是这帮专家发现我们可以用sin(x)这样一个简单的函数表达式来表示下面这张图,所以才有了函数表达式的广泛应用。(2)只有把函数图像转换成数学表达式以后,就可以使用丰富多彩的数学工具,运用过去数学家积累的一些定理和推论。单单拿过一张函数图像,我们是没有工具来处理和分析的。

函数的间断点

一个连续的函数,它一直走,走着走着,到一个点,它忽然断了,后面有继续连续走下去。对于这种间断点,我们该如何处理呢?

(a)这个间断点叫缺失值。因为他是和左右两侧的趋势是相同的。这种情况,如何填充这个缺失值呢?让这个点继续保持左右两点的趋势,就得出缺失值的预测值了。

(b)缺失的值是异常值outlier。这个值反映不出整体趋势,应该舍弃掉这个值,否则会影响到我们模型对于数据的拟合。

(c)这种间断,间断的两侧,属于不同的cluster。这种数据,适合用聚类。

因此我们得出结论,如果数据能够保持连续、没有间断点的话,它的泛化能力很大可能性是不错的(比如上面这个b情况,这种有间断点的情况,如果把间断点再引入进来,训练出来模型泛化性就不好)

介值定理

        介值定理的定义:如果定义域为[a,b]的连续函数f,那么在区间内的某个点,它可以在f(a)和f(b)之间取任何值,也就是说,介值定理是在连续函数的一个区间内的函数值肯定介于最大值和最小值之间。

        我的理解::对于定义域为[a,b]的连续函数f。我们可以拿到函数f的最大值最小值。对于函数值y介于这个最大值和这个最小值之间,一定发 能找到至少一个对应的自变量x的取值范围介于[a,b]之间。

利普希茨连续性

 这个性质将(a-b)这个问题,转换成了f(a)-f(b)的问题。f(a)-f(b)始终"小于等于"K(a-b)体现的就是f(a-b)逼近K(a-b).

\large |f(a)-f(b)|- K|a-b| \leq 0

我们可以把利普西斯连续性的公式移项,得到上面这个式子。我们可以发现,K|a-b|是我们的目标|f(a) - f(b)|无限的逼近于K|a - b|。实际上这个逼近的程度,可以用0这么小,我们自己是可以调整的,比如小于\large \epsilon,比如0.1,0.01这样一个人为可控的小量。


本文来自于,笔者收听“点头教育”的课程《机器学习数学基础》过程中记录的笔记。为了尊重教学视频的版权,这里列举一下点头教育的联系方式。

点头教育官网:

https://www.diantouedu.cn/index

《机器学习数学基础》

相关内容

热门资讯

山海接力情系世界屋脊——记医疗...   光明日报记者 汪媛 尕玛多吉 傅强  2024年6月26日,少年达娃吉拉的歌声,响彻上海体育场中...
我的青春我“职”道|大学生体验...   近日,华中师范大学学生郑璞龙晖和武汉体育学院学生张钰涵化身“大学生职业体验官”,来到位于湖北的大...
idg技术创业投资基金 idg...   IDG技术创业投资基金简介作为最早进入中国市场的外资投资基金,IDG资本已成为中国风险投资行业的...
2019cctv中国创业榜样视... 寻找创业榜样,点亮时代梦想中国创业榜样揭晓中国创投领域的年度盛事中央广播电视总台央视财经频道《创业英...
5000元创业项目 5000元... 首页信息服务详情适合上班族的25个5000元创业项目做什么比较好时间:2021-03-适合上班族的2...
5000元以内小本创业项目 你... 清补凉是没有资金没有经验小本创业者的最佳项目。它具有投资少,只需购置几张简单的桌椅,三百元的原料,三...
投资一部电5000元创业项目影... 投资一部电影,成功上映后,除了票房分红,还有各大网络媒体平台的网络版权分红。先说一期分红:就是票房分...
创业板开户条件创业板开户规则 ... 本文创业板开户条件由呢哇股票网整理提供!想了解更多和创业板开户条件、华谊兄弟股份股吧、长江润发股票股...
什么是创业板以及开户条件 什么... 创业板只在深交所上市,股票代码为300开头的。只要在股市当中,看到300开通的股票代码,那么这就是创...
新型中小投资项目 5个项目 新... 提起适合穷人的18个创业项目小投资的都有哪些,想必大家都有一定了解,有人问请问现在新型投资项目有哪些...