None

S

发布于

不需要学得太深多学一些工程常用的模型，按下面的顺序

NN 神经网络掌握梯度下降优化方法，掌握BP（利用动态规划来优化求导的计算量）
crf 序列模型知道还有其他的优化算法（牛顿法和拟牛顿法），不过不必深究LBFGS，掌握前向后向算法（一种针对线性链模型的概率推断算法，同样是利用动态规划来减少计算量）
lda 掌握多项分布（一种最常用的分布），了解贝叶斯，了解生成模型的建模方法和常用的估计推断算法（变分推断和采样），趁机搞懂gibbs 采样。理解EM算法（又是一种优化算法）。对于推断算法，可主要专注于gibbs采样的实现。

把这三个的推导搞懂关注原始的模型不需花太多时间研究什么变种做做笔记然后实现一遍把你的代码放在github上进行一定的消化理解。

机器学习的代码都很短，尤其是核心代码，这三个模型的核心算法，根据你用的语言和库的不同，实现大概在50-1000行。当然，如果要考虑复用性和性能，代码要稍微长点。

阅读 2 评论 0

评论区

请登录后发表评论

暂无评论

成为第一个发表评论的人吧！