前辈您好,非常有幸看到您关于机器学习相关岗位面试的回答,对我帮助很大。我现在正被职业规划所困扰,于是想请您关于我目前的状态给点建议,冒昧之处望请见谅!
首先介绍一下我自己,我是一名研二学生。现在学习机器学习相关知识,研究方向偏向自然语言处理。您说了解常用决策树算法,以及决策树如何解决overfit问题。这样的人姑且算合格,我便厚颜称自己是合格地学生。但我也意识到自己的基础知识并不扎实,在其它答案中提及到的推导优化相关知识,很多都非常地陌生,能推导的仅有简单的感知机和LR的公式这些,没能详细研究更加深入的概念,也没有实际的工程项目。看过一些书籍如入门科普书《数学之美》,IR领域著作《信息检索导论》,NLTK工具书《Python自然语言处理》。以及李航《统计学习方法》等。但是对书中的概念没能做到融会贯通,对于机器学习的认识只停留在理论上,这是我非常大的缺陷之处。
在那个问题中有个答案说到"无paper、无开源项目开发、无kaggle比赛的三无研究生说自己做机器学习,本身就有问题。"这让我非常难过,因接触时间较晚,有很多工作确实来不及做,在年初的时候曾犹豫过是做个kaggle或天池的比赛,还是了解一下深度学习的领域。最终我选择了后者。
您在"深度学习入门必看的书和论文"中提及到的ufldl与cs224d正好是我当初选择的学习路线。经过约2个月的学习,现在的我即将完成cs224d课程。其中包括认真听完视频课程,阅读课程笔记,浏览课程大纲提到的论文,以及做完布置的作业如实现word2vec、命名实体识别、语言模型等。为此花了不小的工夫,最近在完成cs224d的大作业,尝试用神经网络解决一些基于中文文本的的分类问题。而ufldl教程我也阅读了很大一部分,不过并没有cs224d这么完整,看到您的回答我决定这两天把ufldl完整地过一遍。
除此之外,我曾经做过一些web项目,了解一些工程方面的常识,日常工作都基于linux,其它的如github,云服务的也都经常使用。也不知是否会对之后的工作有所帮助。
说了这么多,很感谢您有耐心看下来。现在回到正题,我学习机器学习的时间较短,对之后的道路也很迷茫。作为研二学生,在学校学习的时间也不多了。我在犹豫是在接下来的暑期找到一份实习工作尽快接触业界,还是好好利用这几个月继续打基础。将欠缺的知识点补全,并复习一些诸如算法,操作系统之类的知识以准备秋季招聘。并且我也不清楚如bat之类的大公司对于机器学习和数据方向的实习生以及应届毕业生的具体要求。或者作为非名校硕士我是否更合适考虑其它公司。我应该往哪方面花时间准备才能在招聘中更有把握,您作为过来人,请您针对我的现状给出宝贵的建议。万分感谢。
期待您的回复。