None
S
sadscv
发布于
不需要学得太深 多学一些工程常用的模型,按下面的顺序
- NN 神经网络 掌握梯度下降优化方法,掌握BP(利用动态规划来优化求导的计算量)
- crf 序列模型 知道还有其他的优化算法(牛顿法和拟牛顿法),不过不必深究LBFGS,掌握前向后向算法(一种针对线性链模型的概率推断算法,同样是利用动态规划来减少计算量)
- lda 掌握多项分布(一种最常用的分布),了解贝叶斯,了解生成模型的建模方法和常用的估计推断算法(变分推断和采样),趁机搞懂gibbs 采样。理解EM算法(又是一种优化算法)。对于推断算法,可主要专注于gibbs采样的实现。
把这三个的推导搞懂 关注原始的模型 不需花太多时间研究什么变种 做做笔记 然后实现一遍 把你的代码放在github上 进行一定的消化理解。
机器学习的代码都很短,尤其是核心代码,这三个模型的核心算法,根据你用的语言和库的不同,实现大概在50-1000行。当然,如果要考虑复用性和性能,代码要稍微长点。
阅读 2
评论 0