ZMonster's Blog 巧者劳而智者忧,无能者无所求,饱食而遨游,泛若不系之舟

2016 年第三季度总结


生活方面

计划内容有:

  1. 开始晨跑
  2. 改造卧室

第一个计划,嗯,没有执行 —— 懒惰如我……事实上这和以前制定然后没有执行的计划具有同样的问题,那就是不具体。当然根本原因是,我在心理上,并没有在这方面进行改变的强烈欲望。第二个计划倒是完成了,拆掉并且扔掉了笨重的衣柜,把我的床变了一下形 —— 我的床其实是那种储物床,相当于由两个大储物箱拼接起来的,我把其中一个旋转了 90 度,这样就能把房间尽头暖气片附近那点空间利用上了,如下图所示。

my_bed.jpg

然后把大量暂时没有看的书、冬天的衣服全塞进了床底下,就把夏天的一些衣服挂在了外面。

第三季度的生活状态,稍微有点乱。六月份离开前公司后,花了挺多的时间面试想尝试一些新的机会,直到八月份才安稳下来,并且决定以后就在 NLP 这个方向上走下去 —— 其实我在这个方向上并没有什么积累,但是已经毕业三年了,我想我必须要专注在某个特定的方向上。此外就是集智俱乐部在这期间开始了「自然语言处理与深度学习读书会」,我自告奋勇上去主讲了三期,倒是感觉自己收获非常大。

目前已经工作快两个月了,同事老板都很 nice,我对目前的境况是感到比较满意的。

Q4 就是秋冬时期了,除了有雾霾和静电,是我比较喜欢的时期:有风,温度比较低。我也就不提晨跑什么的啦,内心没有在这方面改变的想法,制定了计划也是白搭。外出锻炼、健身对我来说还是比较大的改变,我想我可以先从做一些更小的改变开始,比如早睡早起,比如吃早饭。

所以 Q4 的计划是:

  1. 至少 60 天 11 点半前睡觉, 6 点半前起床
  2. 至少 60 天去吃早饭
  3. 至少 60 天不玩游戏
  4. 看 30 部电影

是很小的计划,所以我会坚持去做好。

专业能力方面

计划内容有:

  1. 在 panic-notebook 中增加 Theano 的笔记
  2. 使用 Keras 在 Kaggle 上完成一些至少十个任务
  3. 完成集智俱乐部 NLP 线上读书会(其中 RNN 的部分由我主讲)
  4. 掌握 Dialogue/QA 的技术,实现一个对话系统

第一项和第二项未完成,第三和第四项完成。Theano 笔记未完成的原因是因为我对 Theano 并没有真正很熟悉,所以要写的时候不知道要写什么,就搁置了;kaggle 任务未完成的原因,在于我的动手能力太弱,每次一动手写什么东西,我就想在一开始尽善尽美,考虑效率考虑扩展性考虑代码的美观 —— 这种习惯在某些场景下可能是好事,但在有些时候并不是,而我设定这个任务的目的,本来就是为了对抗自己这种习性,希望能在快速的练习里提高自己的解决问题的能力和效率。

第三项之所以完成,是因为这是一个受到别人监督的任务,尽管如此,在这期间我仍然一再拖延。第四项因为是和现在工作内容紧密相关的,不过完成度不算高。

Q4 的话,我会更加专注在 NLP 上,但是这块内容很多,我可能更多地会跟着工作内容走。除此以外,我还会去了解一下网络信息抽取和爬虫,以及 Docker。根据以上目标,暂时设定 Q4 的计划为:

  1. 熟练掌握句法分析: 能用之进行句法成分地提取、句型的检测和转换等任务
  2. 熟练掌握 Scrapy、PhantomJS 和 Selenium: 完成至少 5 个爬虫
  3. 熟练掌握使用 Docker 进行项目部署、测试的流程
  4. 阅读 40 篇以上的 paper(大概两天一篇),主题不限,做了笔记并发布到博客或公众号上的记为有效结果

除此以外,还买了几本 NLP 相关的书,也计划在 Q4 把它们读完。

个人修养方面

计划内容:

  1. 读完《中国神话传说》、《神话与诗》、《失落的天书:山海经与古代华夏世界观》、《中国小说史略》、《雪人》和《火星崛起》六本书
  2. 坚持每天日记
  3. 坚持每周输出论文阅读笔记或书籍阅读笔记
  4. 建立起自己的 PKM 系统

阅读方面,《中国小说史略》和《神话与诗》尚未读完,其他四本都完成了。其中刘宗迪的《失落的天书》给了我很多惊喜,特别是其中对「龙星纪时」的论述,因此 Q4 会追着读过的几本中国古代神话、山海经相关著作的参考文献深入下去,《中国小说史略》暂时搁置,Q4 也不打算去阅读。闻一多的《神话与诗》打算快速翻一遍,然后之前买的顾颉刚的《三皇考》也快速翻一遍,再挑一本讲稷下学宫的书和一本讲中国天文学史的书看一看。小说就比较随意了,但作为一个科幻爱好者,我决定还是多读一点科幻小说,保持自己在这方面的触感。

每天日记这个没有坚持,大部分时间是靠自己自觉,我想还是需要靠自动提醒的一些手段来帮助加固这个习惯。

至于写作,九月共计有三篇博客输出和一篇论文笔记输出,并不达标。我写博客或笔记的一个自我限制是,总想把事情表达地很全面细致,这就要求我为之付出很多考证和查漏补缺的功夫,后面可以考虑稍微牺牲一下完整性和系统性来加快输出速度。另外之前尝试在公众号中进行写作,但是公众号里的写作体验很糟糕,后面决定还是统一发布到自己的博客上,然后挑选一些对别人有意义的文章放到公众号上去,就当给博客引流了。

第四项是我为之付出了大量精力的一项任务,并在这几天完成了收尾工作。

我所设想中的 PKM 系统,总的来说包含两个部分:

  1. 信息收集、筛选部分
  2. 知识提取、归纳和输出部分

第一部分一开始想用 Huginn 来完成,但是它并没有自己想象中那么好用,而且和我在使用的其他工具整合度不高,所以后来放弃了以 Huginn 作为核心工具,转而购买了 Inoreader 专业版,用 Inoreader 来进行信息的汇总和过滤,然后通过 IFTTT 来进行二次过滤和中转。如下图所示。

information_collect.jpg

第二部分通过 Emacs 的 org-mode 来进行 —— 之前也是一直使用 org-mode 来进行知识的整理,但是尚未形成自洽的系统。系统的大致结构如下图所示。

knowledge_process.jpg

除此以外,发现自己房间空白的墙相当于一块大白板,我现在会把自己在家时的一些读书笔记、杂乱的一些想法写到便签上然后贴在墙上,感觉很不错。

stickynotes_on_wall.jpg

关于 PKM 的设计,后面我会单独写一篇文章来讲。

所以 Q4 的计划是:

  1. 至少写 70 篇日记
  2. 早起后手抄一篇古诗文,至少完成 70 次
  3. 阅读完这几本书籍:
    • 顾颉刚《三皇考》
    • 闻一多《神话与诗》
    • 《稷下学研究》(要去三联买耶……)
    • 冯时《中国天文考古学》
    • 迟卉《荆棘双翼》
    • 《上帝的图书馆》
    • 《6号泵》
    • 《献给阿尔吉侬的花束》
    • 《24个比利》

然后,不再对自己的输出设立目标,因为实际上我的输出效果和效率是受我的 PKM 系统影响的,所以让自己的 PKM 系统真正地运转起来后,自然就能达到自己的期望了!