数学优化1-数学优化的类型

同步于CSDN;音尘杂记

数学优化(Mathematical Optimization)问题,也叫最优化问题,是指在一定约束条件下,求解一个目标函数的最大值(或最小值)问题。

数学优化问题的定义为:给定一个目标函数(也叫代价函数)$f : \cal{A} → \Bbb{R}$,寻找一个变量(也叫参数)$x^* \in \cal{D}$,使得对于所有$\cal{D}$中的$x,f(x^∗) ≤ f(x)$(最小化);或者$f(x^∗) \geq f(x)$(最大化),其中$\cal{D}$为变量$x$的约束集,也叫可行域;$\cal{D}$中的变量被称为是可行解。

阅读更多

概率论2-随机过程

同步于CSDN;音尘杂记

随机过程(Stochastic Process) 是一组随机变量$X_t$的集合,其中$t$属于一个索引(index)集合$\cal{T}$。索引集合$\cal{T}$可以定义在时间域或者空间域,但一般为时间域,以实数或正数表示。当t为实数时,随机过程为连续随机过程;当t为整数时,为离散随机过程。

日常生活中的很多例子包括股票的波动、语音信号、身高的变化等都可以看作是随机过程。常见的和时间相关的随机过程模型包括伯努利过程、随机游走(Random Walk)、马尔可夫过程等。和空间相关的随机过程通常称为随机场(Random Field)。比如一张二维的图片,每个像素点(变量)通过空间的位置进行索引,这些像素就组成了一个随机过程。

阅读更多

概率论1-随机事件和概率

同步于CSDN;音尘杂记

主要回顾概率论中关于样本空间、随机事件和常见概率分布的基础知识。

1. 样本空间

样本空间 是一个随机试验所有可能结果的集合。例如,如果抛掷一枚硬币,那么样本空间就是集合{正面,反面}。如果投掷一个骰子,那么样本空间就是{1, 2, 3, 4, 5, 6}。随机试验中的每个可能结果称为样本点。

有些试验有两个或多个可能的样本空间。例如,从52 张扑克牌中随机抽出一张,样本空间可以是数字(A到K),也可以是花色(黑桃,红桃,梅花,方块)。如果要完整地描述一张牌,就需要同时给出数字和花色,这时样本空间可以通过构建上述两个样本空间的笛卡儿乘积来得到。

阅读更多

利用numpy.vectorize提升计算速度


同步于CSDN;音尘杂记

在实际项目中,对超大矩阵进行计算或者对超大的DataFrame进行计算是一个经常会出现的场景。这里先不考虑开发机本身内存等客观硬件因素,仅从设计上讨论一下不同实现方式带来的性能差异,抛砖引玉。

阅读更多

微积分2-常见函数的导数

同步于CSDN;音尘杂记

在微积分1中已经附上了一个常见函数形式的导数,下文主要是关于向量函数及其导数,以及在机器学习和神经网络中常见的 Logistic 函数、Softmax 函数的导数形式。

阅读更多

微积分1-导数

同步于CSDN;音尘杂记

微积分1,主要回顾关于微积分中关于导数的相关知识。纰漏之处,还望诸君不吝指教。

阅读更多

线性代数1-向量和向量空间

同步于CSDN;音尘杂记

后续几篇笔记主要想回顾整理一下需要用到的数学基础知识,主要包括了线性代数、微积分、概念论、数学优化和信息论等内容。相对比较基础,权当复习回顾完善整个知识体系结构。错误之处,还望诸君不吝指教。

阅读更多

分位数回归简介

同步于CSDN;音尘杂记

最近在做一个比较有意思(难搞…)的项目。大致介绍一下相关背景:根据历史的一个工作情况(历史表现,也就是多少人做了多少工作量),以及未来的一个预估工作量(预测值),我们需要预估一个合理的人员投入;一言概之,根据历史表现和预测件量预估人员投入。

阅读更多

Logistic loss函数

同步于CSDN;音尘杂记

前面在浏览sklearn中关于Logistic Regression部分,看到关于带正则项的LR目标损失函数的定义形式的时候,对具体表达式有点困惑,后查阅资料,将思路整理如下。

阅读更多