开始机器学习之旅

May 5, 2017


  去年的这个时候还在风风火火的找工作,应该还没找到,哈哈。当时也曾一度情绪低落,转眼已经一年过去了,我已经在搜狗实习了4个月的时间。最近提交了毕业论文的初版,压力稍微小了一点,可以在空下来的时候接着写写东西。
  虽然自己的毕业论文已经交了,可毕业季还是有很多琐碎的事情牵扯精力,公司的工作不是很好干,个人感觉做的也不是很好。导师交给项目,一直进展缓慢,当然也还有一些其他的事情十分耗费精力,但是无论事情有多少,还是应该坚持写下去。我在搜狗大数据中心做策略相关工作,但是自己的底子确实不好,积累不够,以前更多的时候还是在做工程相关的工作,还好研究生阶段学习过相关课程,也算勉强可以完成工作。最近自学了吴恩达老师的机器学习课程,又对着《机器学习实战》这本书,敲了部分python的机器学习代码,同时熟悉下sklearn库,对机器学习也算有一些感觉了。下面谈谈自己这段时间,做策略工作的体会吧。
  其实,与其说这段时间我在做机器学习相关工作,还不如说我在做原始数据积累相关的工作,这听起来真是个悲伤的故事。关于工作的具体内容我不方便在这里细说,但是我相信很多策略工作者的最先思考的问题一定是“我要干什么!”,而最担心的问题一定是“我有没有训练数据!”。现阶段,人工智能真的很火,百度李彦宏和我狗的小川都把人工智能作为公司的未来战略重心来对待,这么说一点也不夸张。但是,人工智能的发展其实并没有想象的那么快,外行跟风可以理解,如此多的业内专家炒作人工智能倒是让我十分不解,难道是为了忽悠投资人?机器学习算法在实际应用中还必须依赖良好的训练数据集来训练相关模型参数,而原始训练数据的积累真的是个耗时费力的工作。现在劳务的价格不低,一般的小公司恐怕也是烧不起这个钱的。但是,这些工作一定是没有捷径可走的,找捷径的结果就是给自己挖坟。反思这段时间的工作,我自己思考不够,导致浪费了大量的时间和精力做了一些无意义的事情,这种现象以后一定要避免。
  公司推行了OKR制度,我也制定了工作中的OKR,今天这篇博客是机器学习博客系列的开篇,也希望是自己的一个新的开始。我要制定一个个人发展的OKR,与公司的OKR不冲突不重合。同时在后续的博客中,我也会总结自己的OKR,激励自己。

  • O1:专注机器学习基础理论学习,对SVM和LR模型做到理解原理,会推导,能实现。
    • KR1:完成SVM学习,写一篇高质量的总结博客。
    • KR2:完成LR学习,写一篇高质量总结博客。
    • KR3:读完《机器学习实战》,手敲全部代码上传博客。
  • O2:进一步加强自己的工程能力,做到能够独立负责小型线上系统后端开发任务。
    • KR1:重读《Effective Java》和《Java并发编程实战》,并分别写一遍二次阅读总结。
    • KR2:阅读《高性能MySQL》150页以上,完成三篇总结博客。
    • KR3:着手开发一个多级数据标注系统框架,争取能够上线使用,并写好总结博客。
  • O3:加强自己的前端开发能力,做到能够完成大部分常规前端需求。
    • KR1:系统学习JavaScript和JQuery,分别写一篇总结博客。
    • KR2:把个人博客主页美化一下,现在太丑了,不能看!

  对了,个人生活质量也要进步,租个好房子并买个摩托车,同样在6月末之前完成!