0%

台湾国立清华大学开设了一门Music Information Retrieval课程来介绍一些音乐信息检索的基础技术,主讲教师是在MIR领域有名的大牛Yi-Hsuan YangLi Su。虽然没有视频公开课,但是在其课程网站上公开了授课PPT,值得对这方面感兴趣的同学翻看一下。

Read more »

This blog will introduce a well-evolved feature set for automatic recognition of audio emotion, ie. 2013 ComParE Feature Set[1]. The ComParE feature set contains 6373 features. It consists of some generic acoustic emotion descriptors and their statistical functionals.

Read more »

特征集和提取工具

最近的任务目标是:确定音乐情感特征集(声学特征)提取方法

Read more »

由于在同时使用GithubGit@OSchina(Github私有库需要收费且Git@OSchina在国内的访问速度较快),所以需要设置两组SSH-Key。

Read more »

简而言之,数形结合的思想。

贝叶斯网络

即有向图模型

马尔可夫随机场

即无向图模型

会其意,知其形。

Markov Chain

服从马尔可夫性(无记忆性):当前状态只与前一个状态有关,与更往前的状态无关。

HMM(Hiden Markov Model)

一个概率模型,用于描述系统隐性状态的转移和隐性状态的表现(输出)概率。

  • 可见状态链
  • 隐含状态链
  • 隐含状态数量
  • 隐含状态之间的转换概率(transition probability)
  • 隐含状态到可见状态的输出概率(emission probability)

HMM能做什么,怎么做?

  1. 估计(evaluation)
    转换概率+输出概率 -> 可见状态出现的概率 (动态规划、forward algorithm)
  2. 解码(decoding)
    转换概率+输出概率+可见状态链 -> 隐含状态链 (极大似然、Viterbi algorithm)
  3. 学习(learning)
    a. 有可见状态链和隐含状态链->HMM模型
    b. 只有可见状态链->HMM模型

  1. 零均值化:每个属性值减去其均值
  2. 求协方差矩阵
  3. 求协方差矩阵的特征值和特征向量
  4. 保留主成分

Hoeffding不等式

用于确认精确度,适用于所有有界的随机变量。假设有两两独立的变量X1…Xn,其中Xi都是几乎有界的变量,即满足

1
P(ai<=Xi<=bi) = 1

则其期望满足:

1
P(|mean(X)-E(mean(X))|>=t) <= 2exp(-2(nt)^2/sum((bi - ai)^2))

Regression回归分析

Bias-Variance Tradeoff

  • 欠拟合 underfitting 高偏差 bias
  • 过拟合 overfitting 高方差 variance

解决方法:1、减少选取的特征数量;2、正则化 regularization

Polynomial Curve Fitting

1
2
3
Y = XA 
#使用法向量计算最小二乘法结果
A = (X.T * X) * X.T * Y

相似性衡量

  • 距离
  • 相似性
  • 核函数
  • DTW(dynamic time warping 一种特殊的距离算法)

聚类算法

  • 划分聚类(Partition-based methods)
    确认聚类数量,挑选初始点 -> 类内的点足够近,类间的点足够远。

  • 密度聚类(Density-based methods)
    指定圈的最大半径,包含的最少点数量 -> 画圈。

  • 模型聚类(Model-based methods)
    基于概率模型和神经网络模型 -> 同一类属于同一概率分布

  • 层次聚类(Hierarchical methods)
    自下而上法 (bottom-up) 和自上而下法 (top-down),根据linkage迭代联合或者排异。

  • 网格聚类(Grid-based methods)
    将数据空间划分为网格单元,将数据对象集映射到网格单元中。计算每个单元的密度,根据阈值确定高密度单元 -> 相近的高密度单元组成类

Read more »