机器学习中的数学--数学知识复习

机器学习

机器学习三个部分:编程能力+数学统计知识+业务知识

机器学习分类

1 监督学习:例如分类、房价预测
2 无监督学习:例如聚类
3 强化学习:例如动态系统、机器人控制系统

机器学习算法

是否连续无监督有监督
连续聚类 && 降维回归
      PCA    线性回归/多项式回归
      SVD决策树
      K-means随机森林
不连续隐马尔科夫分类
  相关性分析    KNN/Trees
      FP-Growth/Apriori    逻辑回归/朴素贝叶斯/SVM

机器学习一般思路

这里写图片描述
分析得到多个特征:高、富、帅、潜等;
观察多个数据得到每个数据的每个特征值;
设计得分函数;
设计损失函数;
损失函数最小化,求得特征权重;
根据得分函数,对新数据预测。

微积分

微积分用于求损失函数的最小值。

1 夹逼定理

2 导数

导数定义与意义:导数是曲线的斜率;二阶导数是斜率变化快慢的反应。
常用函数的导数

3泰勒公式

4方向导数与梯度

方向导数:是标量
这里写图片描述
梯度:是有方向的,是一个向量;是f函数对坐标轴求偏导得到的。

这里写图片描述
梯度的方向是函数在该点增长最快的方向。

5梯度下降法

在损失函数最小值计算中用到。

6凸函数

凸函数的定义:x,ydom,0<θ<1,∀x,y∈dom,0<θ<1,f(θx+(1θ)y)<=θf(x)+(1θ)f(x)f(θx+(1−θ)y)<=θf(x)+(1−θ)f(x)
这里写图片描述
凸函数判定依据:=0二阶导数>=0,f(x)是凸的。

概率与数理统计

1概率公式

条件概率:
全概率公式:
贝叶斯公式:

2常见概率分布

3概率与统计的区别

概率:已知总体,已知概率分布参数,求某种情况发生的概率。已知总体,求抽样(某事件)发生的概率。
数理统计:已知总体分布,但不知道具体参数,从抽样数据中推出总体参数。
在有监督的机器学习中,已知数据,求得权重的过程是数理统计的过程:从样本推出总体参数;这是机器学习的训练过程。
在有监督的机器学习中,已知数据和权重,求得标签的过程是概率:已知总体,求抽样发生的概率;这是机器学习的预测过程。

4 根据各个分布特性评估模型和样本

观察已有数据的标签分布、每个特征的分布;评估了分布后,大致可以得到某些特征和标签的相关性较强,某些特征和标签的相关性较弱。
统计估计的是分布,机器学习训练出来的是模型。模型可能包含了多个分布。
模型是有误差的。误差本身可以是概率的形式。

5 常见统计量

期望
方差
协方差:可以评价特征与标签的相关性;用于特征选择
相关系数

线性代数

A.x的含义
SVD的几何意义
矩阵乘法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/424762.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【数据结构与算法】【算法思想】拓扑排序

一、拓扑排序 拓扑排序是基于依赖关系的节点&#xff0c;根据依赖关系而生成的序列。节点和依赖关系往往要生成有向无环图。类似的问题有&#xff1a;穿衣服裤子的先后关系&#xff0c;生成穿衣序列/专业课程与前置课程形成的课程学习序列/代码编译依赖关系形成的编译顺序序列…

java面试题5 牛客:下列关于JavaBean的说法正确的是:

下列关于JavaBean的说法正确的是&#xff1a; A:Java文件与Bean所定义的类名可以不同&#xff0c;但一定要注意区分字母的大小写 B:在JSP文件中引用Bean&#xff0c;其实就是用语句 C&#xff1a;被引用的Bean文件的文件名后缀为.java D:Bean文件放在任何目录下都可以被引用…

Depth-first Search深度优先搜索专题3

473. Matchsticks to Square 思路&#xff1a;有n根长度不一的火柴&#xff0c;这些火柴可以拼接在一起&#xff0c;但不能被折断。这些火柴能够围城一个正方形吗&#xff1f;每个火柴可以并且必须使用一次。分析得到每个边的长度应该是所有火柴长度和的1/4。接下来就是将火柴…

mysql数据库之事务与存储过程

事务 什么是事务&#xff1f; 事务是指一些SQL语句的集合&#xff0c;这些语句同时执行成功完成某项功能 事务的CAID特性&#xff1a; 原子性&#xff1a;一个事务的执行是整体性的&#xff0c;要么内部所有语句都执行成功&#xff0c;要么一个都别想成功 一致性&#xff1a;事…

java面试题6 牛客:哪个关键字可以对对象加互斥锁?

哪个关键字可以对对象加互斥锁&#xff1f;&#xff08;&#xff09; A synchronized B volatile C serialize D static synchronized的4种用法 1.方法声明时使用,放在范围操作符(public等)之后,返回类型声明(void等)之前.这时,线程获得的是成员锁,即一次只能有一个线程进…

[Leetcode][第347题][JAVA][前K个高频元素][优先队列][堆][遍历set/map]

【问题描述】[中等] 【解答思路】 1. 堆 复杂度 class Solution {public int[] topKFrequent(int[] nums, int k) {Map<Integer, Integer> occurrences new HashMap<Integer, Integer>();for (int num : nums) {occurrences.put(num, occurrences.getOrDefault…

Depth-first Search深度优先搜索专题4

576. Out of Boundary Paths 思路&#xff1a;这道题目难倒了我。最直接的思路是暴力搜索。要注意的问题1是需要仔细观察Example2&#xff0c;轨迹不同意思是可以从A点到B点&#xff0c;再从B点到A点也可以&#xff0c;只要step够用。所以暴力搜索&#xff0c;在(i,j)点在步骤…

java面试题7 牛客:关于AWT和Swing说法正确的是?

关于AWT和Swing说法正确的是&#xff1f; A Swing是AWT的子类 B AWT在不同操作系统中显示相同的风格 C AWT不支持事件类型&#xff0c;Swing支持事件模型 D Swing在不同的操作系统中显示相同的风格 AWT和Swing都是java中的包。 AWT(Abstract Window Toolkit)&#xff1a;…

bwa比对软件的使用以及其结果文件(sam)格式说明

一、bwa比对软件的使用 1、对参考基因组构建索引 bwa index -a bwtsw hg19.fa # -a 参数&#xff1a;is[默认] or bwtsw&#xff0c;即bwa构建索引的两种算法&#xff0c;两种算法都是基于BWT的&#xff08;BWT search while the CIGAR string by Smith-Waterman alignment.…

【小技巧】【map】【set】【Java】map /set 的遍历

map public static void main(String[] args) {// 构建一个Map 初始值为3条数据Map<String, String> map new HashMap<String, String>();map.put("1", "xiaqiu");map.put("2", "pangzi");map.put("3", "…

java面试题8 牛客:在Web应用程序中,( )负责将HTTP请求转换为HttpServletRequest对象

在Web应用程序中&#xff0c;( )负责将HTTP请求转换为HttpServletRequest对象 A Servlet对象 B HTTP服务器 C Web容器 D JSP网页 首先我们来看看web程序的整个过程 web的基本工作流程 首先&#xff0c;我们先来思考一下我们平常在上网浏览网页时候的场景&#xff0c;…

2018-2019-2-20175225 实验四《Android开发基础》实验报告

一、实验报告封面 课程&#xff1a;Java程序设计 班级&#xff1a;1752班 姓名&#xff1a;张元瑞 学号&#xff1a;20175225 指导教师&#xff1a;娄嘉鹏 实验日期&#xff1a;2019年5月14日 实验时间&#xff1a;13:45 - 21:00 实验序号&#xff1a;实验四 实验名称&#xff…

Depth-first Search深度优先搜索专题5

329. Longest Increasing Path in a Matrix 思路&#xff1a;计算某个位置i,j&#xff0c;最长路径的长度。计算长度的条件是&#xff1a;如果i,j的相邻位置newi&#xff0c;newj不能出matrix的边界&#xff0c;并且matrix[newi][newj]>matrix[i][j]matrix[newi][newj]>…

【小技巧】【Java】 创建指定数目m的Set数组

1. Set[] 并初始化 Set[] sets new Set[m]; //均会指向同一对象 // Arrays.fill(sets,new HashSet()); for(int i 0;i<m;i){sets[i] new HashSet<Integer>();}2. Stream 流 Set[] sets Stream.generate(HashSet::new).limit(m).toArray(Set[]::new); for循环初始…

第七十六期:3000台服务器不宕机,微博广告系统全景运维大法

微博现在日活达到了 2 亿&#xff0c;微博广告是微博最重要且稳定的收入来源&#xff0c;没有之一&#xff0c;所以微博广告系统的稳定性是我们广告运维所有工作中的重中之重。 作者&#xff1a;孙燕来源 微博现在日活达到了 2 亿&#xff0c;微博广告是微博最重要且稳定的收入…

第六章小结

本章&#xff0c;我们学习了图。 首先是图(GRAPH)的定义 一种非线性数据结构&#xff0c;由有穷、非空的点集V(G)和边集E(G)组成。当G中的每条边有方向时&#xff0c;称G为有向图&#xff0c;有向边&#xff08;用一对尖括号<a,b>&#xff09;又称为弧&#xff0c;起始顶…

753 Cracking the Safe

方法一 Hierholzer’s Algorithm 相关概念&#xff1a; 1 欧拉路径&#xff1a;在无向图中&#xff0c;每个边只经过一次&#xff0c;形成的路径。在有向图中&#xff0c;是指每条有向边只使用一次&#xff0c;形成的路径。 2 欧拉回路&#xff1a;欧拉路径是一个环。 3 在…

【小技巧】【堆】【优先队列】优先队列初始化

大小堆的建立&#xff08;其他类比&#xff09; 1.1 Map的小堆 //a - b 小堆&#xff08;前减后&#xff09; PriorityQueue<Integer> queue new PriorityQueue<>((a,b)->map.get(a)-map.get(b));1.2 Map的大堆 //b - a 大堆&#xff08;后减前&#xff0…

java面试题9 牛客:不同的服务器之间,哪种通信方式是不可行的

在一个基于分布式的游戏服务器系统中&#xff0c;不同的服务器之间&#xff0c;哪种通信方式是不可行的&#xff08;&#xff09;&#xff1f; A管道 B消息队列 C高速缓存数据库 D套接字 首先看到这道题我是懵逼的&#xff0c;我们分别介绍一下各个的概念 管道为运行在同…

MySQL查询语句的45道练习

一、设有一数据库&#xff0c;包括四个表&#xff1a;学生表&#xff08;Student&#xff09;、课程表&#xff08;Course&#xff09;、成绩表&#xff08;Score&#xff09;以及教师信息表&#xff08;Teacher&#xff09;。四个表的结构分别如表1-1的表&#xff08;一&#…