0%

支持向量机的假设函数和损失函数

回忆一下逻辑回归的损失函数:

$$min_\theta\frac{1}{m}\sum_{i=1}^{m}[y^{(i)}(-logh_\theta(x^{(i)})+(1-y^{(i)})(-log(1-h_\theta(x^{(i)}))]+\frac{\lambda}{2m}\sum_{j=1}^n\theta_j^2$$

支持向量机的损失函数与之类似:

$$min_\theta C\sum_{i=1}^{m}[y^{(i)}cost_1(\theta^Tx^{(i)})+(1-y^{(i)})cost_0(\theta^Tx^{(i)})]+\frac{1}{2}\sum_{j=1}^n\theta_j^2$$

Read more »

在解决一个机器学习问题时,如果算法效果不理想,要怎么办呢?直觉上,我们可以有一些解决方法:

  • 增加训练数据
  • 减小特征集
  • 增加特征
  • 增加多项式特征
  • 减小\(\lambda\)
  • 变大\(\lambda\)

然而,这些方法并不是在所有情况下都适用的,有时候,花很多时间增加训练数据也许根本不能使分类结果变得更好。因此,我们需要使用一些简单的技巧来选择使用哪些方法,这样的技巧被称为机器学习诊断(machine learning diagnostics)

Read more »

Why Neural Networks?

当遇到特征数量很大(n is large)复杂非线性问题时,简单的逻辑回归(加入二次项或三次项)不再适用,因为会导致太多的特征量参与计算(不仅仅是\(x_n, x_n^2,x_n^3\),还有\(x_i{x_j},x_i^2{x_j}\)等二次项和三次项)—— 带来巨大的计算代价和过拟合问题。

神经网络其实很早就出现了(A pretty old algorithm),始于80年代,90年代有所衰减而现在又火了起来(计算机计算能力的提升)。神经网络模拟人脑神经的计算机制,在解决许多机器学习问题时有很好的效果。

人脑使用一种学习算法来处理无数不同的问题,这使得我们模拟它的计算机制成为可能。人脑甚至可以学习任何传感数据,这让神经网络成为最有可能实现人工智能的方法。

Read more »

分类表达式

分类和回归

  • 分类问题和回归问题的形式是相似的,但它的预测值是一组有限的离散值。
  • 分类问题的求解可以看做是找边界线(面)的过程,即拟合边界曲线(面),特征空间内的点分布在该曲线(面)分割出来的不同子空间中;
  • 而回归问题的求解是拟合特征-预测值曲线(面),特征空间内的点分布在该曲线(面)上或者附近。

分类问题的假设表达式

逻辑函数(Logistic Function or Sigmoid Function)

使用逻辑函数\(g(z)\)将预测值映射到[0, 1]区间中,使假设函数更适用于分类问题。

$$\begin{align}&
h_\theta (x) = g ( \theta^T x )
\newline
\newline& z = \theta^T x
\newline& g(z) = \dfrac{1}{1 + e^{-z}}
\end{align}$$

Read more »

多变量线性回归假设函数

多变量假设函数的标准形式(multivariable hypothesis function)

$$
\begin{align}h_\theta(x) =\begin{bmatrix}\theta_0 \hspace{2em} \theta_1 \hspace{2em} … \hspace{2em} \theta_n\end{bmatrix}\begin{bmatrix}x_0 \newline x_1 \newline \vdots \newline x_n\end{bmatrix}= \theta^T x\end{align}
$$

Read more »

对于音频信号处理而言,离散傅里叶变化(DFT)是最最常用的函数工具。它将信号的时域采样变换为其离散时间傅里叶变化(DTFT)的频域采样(在\([0,2\pi]\)之间进行均匀采样),最后得到数字信号在区间\([0,(k-1)f_s/N]\)内的离散频谱值。

在形式上,变换两端(时域和频域上)的序列是有限长的,而实际上这两组序列都应当被认为是离散周期信号的主值序列。即使对有限长的离散信号作DFT,也应当将其看作其周期延拓的变换。

DFT的变化等式为:
$$X[k]= \sum_{n=0}^{N-1}{x[n]e^{−j2{\pi}kn/N}} (k=0,…,N−1)$$

Read more »

实验目的

为后续的大规模音乐数据集建立工作试水,希望能在这个过程中发现之前没有注意到的问题,并提出相应解决方案。

Read more »