从第一期之后拖延了很久,先是花了比较多精力做 2023 年的回顾总结,之后则因为即将过年回家比较焦虑而导致没有办法集中精力,看下过完年后能不能争取专注一些。下一期准备集中了解下幻觉的检测与缓解方法。
两年前我写完《我的2021》后有些朋友问我用到了什么工具和方法,前阵子写完《我的2023》后又有一些朋友询问,所以就来简单写一下好了。
总的来说,2023 年就是玩游戏、阅读、和朋友聊天以及吃吃吃的一年,是开心的一年!我觉得这样的日子我可以一直过下去。
一周AI笔记,读了点 In-Context Learning 的论文,了解了下 Gemini API、Perplexity API 和 Dify
去成都和乐山玩了几天,旅行总体还是开心的,我很享受那种四处闲逛的感觉。
9月是充实的。
不工作后我的生活要比工作时候丰富多了,只要人的闲暇时间多了,生活自然就会丰富起来。
离职后的第二个月,平平淡淡
离职后的第一个月
梳理下使用最近 K 轮历史记忆这种方法的问题
接下来的一小段时间,大概会尝试去过一过「没有计划」的生活,尽力、尽情地做一些自己想做、能做的事情,等待并拥抱变化的自然发生,不再自欺欺人地假装做了计划后未来的不确定性就会收束。
在 ChatGPT 的帮助下,给项目起好了名字,并实现了最简单的一个原型。
作为一个工程师,我不认为自己具备预测未来的宏观视野,但我想我还是可以参与到新生态建设里去的。针对语言模型应用目前尚存的一些问题,准备写一个项目,通过代码的方式来展示我对这些问题的应对方法的思考和尝试。
早上五点半起来了,地铁去了汇合点,简单吃了早饭后就出发了。天气多云,本来还担心今天看不到什么云,路上看到,开车窗拍了下。
以后就统一在自己博客里写 microblog 然后再同步到其他平台了
近期生活记录
近期生活记录
一次数据化分析总结的尝试
近期生活记录
近期生活记录
近期生活记录
近期生活记录
应网友要求制作了北青深一度和谷雨实验室的全文RSS
近期生活记录
近期生活记录
中学的时候,我开始写日记,记录琐事和当时再正常不过的一些小心情,就这么一写一直写纸质日记到 2020 年。工作之后,我把上学时候写的日记也带在了身边,不过中学时候的只剩了高三复读时候那一本,早...
近期生活记录
7月生活记录
2021年上半年的收获和感悟。
本周想法和生活记录
本周想法和生活记录
本周想法和生活记录
为减轻服务器的压力,我选出了一批公众号RSS,关闭了他们的全文输出
本周想法和生活记录
本周想法和生活记录
今天发现我用 Huginn 制作的微信公众号全部没有更新了,持续了大概三到四周,对各位订阅者表示歉意。
本周想法和生活记录
本周想法和生活记录
本周想法和生活记录
本周想法和生活记录
本周想法和生活记录
本周想法和生活记录
梳理一下 2020 年的一些收获、得失,为新的一年做点准备
尝试了在本周连续五天输出当日摘要到博客上,这里是一点总结
尝试在本周每天写一个当日摘要发到博客上,对于当日摘要要写些什么东西,暂定会有「笔记」和「时间」两块,不过我的想法随时可能会变,也许会在之后的几天产生新的想法,这一周时间一来是想确认一下我每天可以输出什么东西,然后也看一下自己是否能坚持这种写作方式吧。
尝试在本周每天写一个当日摘要发到博客上,对于当日摘要要写些什么东西,暂定会有「笔记」和「时间」两块,不过我的想法随时可能会变,也许会在之后的几天产生新的想法,这一周时间一来是想确认一下我每天可以输出什么东西,然后也看一下自己是否能坚持这种写作方式吧。
尝试在本周每天写一个当日摘要发到博客上,对于当日摘要要写些什么东西,暂定会有「笔记」和「时间」两块,不过我的想法随时可能会变,也许会在之后的几天产生新的想法,这一周时间一来是想确认一下我每天可以输出什么东西,然后也看一下自己是否能坚持这种写作方式吧。
尝试在本周每天写一个当日摘要发到博客上,对于当日摘要要写些什么东西,暂定会有「笔记」和「时间」两块,不过我的想法随时可能会变,也许会在之后的几天产生新的想法,这一周时间一来是想确认一下我每天可以输出什么东西,然后也看一下自己是否能坚持这种写作方式吧。
尝试在本周每天写一个当日摘要发到博客上,对于当日摘要要写些什么东西,暂定会有「笔记」和「时间」两块,不过我的想法随时可能会变,也许会在之后的几天产生新的想法,这一周时间一来是想确认一下我每天可以输出什么东西,然后也看一下自己是否能坚持这种写作方式吧。
一些资讯类的 RSS 通常都会有较高的更新频率,但我只是想保持关注,了解一下大致有什么事情发生,并不想在一天内接收到几十上百个更新,于是用 Huginn 把一段时间内更新的条目合并起来再输出一个更新频率更低的 RSS。
我对自我的建模
最近 Roam Research 一类的以网状结构来关联笔记、并以 backlink 来展现笔记上下文的工具非常热门,Emacs 上也出现了一个类似的工具 org-roam,本文将简单介绍该工具及个人初步使用感受
微广场关闭之后,我开始自己去为微信公众号输出 RSS,在这三年里尝试了多种方法,在此分享一下。
花了点时间,又制作了一批微信公众号的全文 RSS。
周二的时候,一位高中同学调动到我所在的乡政府工作,到我家小坐,我们讨论了一下疫情。
基于 Github Pages 的博客可以很简单地就启用 HTTPS 了。
公布一下目前为止我制作好的微信公众号RSS
谈谈我对数字生活的一些想法
2019 年有很多东西发生了变化,也有很多东西一如既往。
更新了下关于页面,见 http://www.zmonster.me/about.html
阅读了几篇 Few-Shot Learning 方面的经典论文,索性写一起吧。
常见文本分类工具的使用方法罗列
Facebook 的 DrQA 项目的原理解析
来北京后第三次搬家,时隔四年,再度独居。
本文介绍了 Neo4j Server 的不同部署方式,并以豆瓣电影图谱数据为例说明了不同的数据导入方式,并简单介绍了 Cypher 查询语言的使用。
有三年没有写年末总结了,2018 年觉得似乎可以写一下。
目录 作者 观点与事实 相关工作 数据集 模型/方法/结论 总结
目录 作者 观点 数据集 模型/方法/结论 相关工作 概念和术语
目录 作者 观点 数据集 模型/实验/结论
目录 简介 实验和结论
三位来自 Google 的作者在这篇论文中提出了一种以两个 RNN 组合方式构成的网络结构,用来处理英语到法语的翻译问题,并且认为对于传统的深度神经网络(Deep Neural Network...
作者在这篇论文中提出了一种新的模型,并用来进行机器翻译和比较不同语言的短语/词组(phrase)之间的语义近似程度。这个模型由两个 RNN 组成,其中一个(Encoder)用来将输入的序列表示...
目录 作者 观点 数据集 模型/实验/结论
目录 作者 观点 数据集 模型/实验/结论 概念和术语 总结
近一年来心理、精神状态总体上来说都不佳,一方面是工作上琐事繁多,另外一方面家庭方面的压力也开始上来了。
说一下在做自然语言处理的工作时会涉及到的一些小知识以及相关的工具
自然语言处理是一门旨在利用计算机技术来理解并运用自然语言的学科
决定开一个系列,专门讲讲 NLP 的东西
目录 简介 最小配置 capture 模板的五个部分 用于快速选择模板的 key 描述模板的 description 设置新增内容类型的 type 设置新增内...
目录 基础模块构成 其他
目录 基础配置 Emacs + Python3 的问题 company + jedi-core 的 Python3 配置 结合 virtualenv 来使用 f...
目录 简介 深度学习在自然语言处理中的应用 可微数据结构(Differentiable Data-structure) 语言学习的范式
目录 信息的取舍 信息的收集 RSS 和「即刻」 Feed43: 从静态网站生成 RSS 输出 微广场: 从微信公众号、知乎、简书、百度百家生成 RSS 输出...
目录 生活方面 专业能力方面 个人修养方面
目录 Linux, Lisp: ID "Linusp" 的由来 异或门, 邮件人和「电子怪兽」
目录 前言 Cygwin 的安装 Cygwin 的界面设置 Python 的安装和使用 安装 Python/Python3 安装 pip 使用 virtual...
目录 计划及总结 生活方面的计划 专业能力方面的计划 个人修养方面的计划 计划之外
目录 简介 自然语言处理的基本任务 对语言进行建模的若干方法 语言模型简介 N-gram 语言模型 基于神经网络的语言模型 语言的表示方法 词的表示: ...
注意:本文仅适用于 nltk<3.2.5 及 2016-10-31 之前的 Stanford 工具包,在 nltk 3.2.5 及之后的版本中,StanfordSegmenter 等接口相当于已经被废弃,按照官方建议,应当转为使用 nltk.parse.CoreNLPParser 这个接口
目录 Org mode 中的表格 表格的创建 表格的基本操作 表格公式 表格绘图 org-plot/gnuplot With source block 总...
目录 Sequence to Sequence Model Keras 简介 Pig Latin: Sequence to Sequence 实践
目录 计划及总结 生活方面的计划 专业能力方面的计划 个人修养方面的计划 计划之外
目录 最长公共子序列 问题定义 求解方法 数学表示与相似度量 编辑距离 所谓编辑距离 求解方法 从编辑距离到相似度量 一点看法 本文是《文本...
目录 切片(slicing)操作 索引(indexing) 操作 最简单的情况 获取多个元素 切片和索引的同异
目录 Numpy 及 ndarray 简介 ndarray 的创建 从已有数据中创建 创建特定形状的多维数组并进行填充 从 numerical range 创...
目录 词形还原(Lemmatization) 词形还原的工具 Python: NLTK Python: Pattern Python: TextBlob Tr...
目录 2015 年计划完成情况 2015 年总结 2016 年展望与计划
目录 Redis 简介 从遇到的问题说起 用于分析 Redis 性能的一些命令(参数) redis-cli 参数 redis-cli 子命令 Redis ...
目录 距离度量与相似度量 文本相似度量方法一览 String Based Methods Character Based Methods Term Based...
目录 从做过的工作说起 再谈这个职位 参考
目录 更易配置和使用的训练工具 获取工具 配置 训练 字符识别歧义校正 旧版本格式 新版本格式 词典: DAWG 文件 续上篇: 《Tess...
目录 Caffe 简介 Caffe 的安装 相关概念 Blob Layer Net 使用 Caffe 进行训练 训练参数设置 网络结构定义 数据准备 训...
目录 基本的任务管理 自定义状态序列 添加新的状态 为状态设置不同外观 多个终结状态及快速选择 进入与离开时的额外操作 基于列表的任务 子任务、任务进度与...
目录 简介 安装与基础设置 基本使用 所谓大纲(outline) 基本语法
目录 $RANDOM /dev/random seq + sort shuf
目录 设置环境变量 修改、设置程序中的变量 查看变量的类型 调用函数
目录 百度 OCR API 初探 用 Python 调用百度 OCR API 与 Tesseract 的简单对比 百度 OCR API 初探 近日得...
STRING 类是 Tesseract 中自定义的字符串类,封装了一些字符串操作,该类定义于 ccutil/strngs.h 中,同样的,不知道出于什么目的,其设计让人一开始摸不着头脑。
Synapse 是一个类似 Gnome-Do 的语义型启动器(sementic launcher),只要输入部分字符就可以匹配相应的文件或程序,能够有效地提高工作效率 —— 特别是对于 Ema...
目录 ELIST_LINK ELIST ELIST_ITERATOR 实际单链表的实现方法 Tesseract 中实际被使用的单链表类 因为工作以及个人...
目录 资源文件 资源文件的训练 数据准备 图像与BOX文件生成 字符集文件与字体信息文件生成 特征文件生成 聚集 [可选]添加配置文件、歧义修正文件、DAWG...
目录 窗口 窗口的新增 窗口的删除 窗口的切换 默认的方法 windmove package 窗口布局的保存与恢复 窗口 这里的窗口并不是指桌...
Tesseract是一款被广泛使用的开源 OCR 工具,本文将对其进行简单的介绍
2015年3月22日,9点37分。
目录 缘起 适用于Linux的方法 适用于Windows的方法 跨平台的方法
目录 What is process substitution? Process substitution on Linux Some more Wha...
目录 2014年计划完成情况 回顾与总结 2015年展望与计划 本来应该在跨年夜或者昨天来完成这篇博客的,不过12月31日身体不太舒服,昨天的话在解决 ...
目录 工作 生活 阅读
目录 工作 生活 阅读 工作 8月我所做的工作,主要有: 稳定了新版本说话人分割,同时解决了接入引擎时的种种bug; 在引擎中实现了新增的协议内...
来北京工作后,我住在了北京昌平区沙河的于新庄,步行到地铁十分钟,对我上班来说还是比较方便的。这儿住着大量的外来人口,其中有不少一部分和我一样,是IT从业者,然而其他形形色色人等,估计也是不缺的...
目录 概念说明 开始前的设定 创建场地 双向连接与单向连接 创建区域 名字缩写 一图胜千言
目录 使用特殊变量 条件表达式 变量使用 处理文件 后记 自工作以来,写了不少脚本,有自己临时需要而写的,也有给测试妹子编写的工具。在这个过程中,碰到了...
目录 手工解析 getopts getopt getopts处理长选项 在函数中解析参数
目录 配置及配置文件 配置: Section user 配置: Section core 配置: Section color 配置及配置文件 Git...
目录 问题 Bash 版本 后记
目录 工作日志分析 编程以外的工作总结 工作以外的生活 阅读与写作
目录 bt/backtrace 打印数组内容 设置源代码目录
目录 烦人的Hot Corner 系统设置:失败 Gnome Shell 扩展:失败 改代码吧混蛋 烦人的Hot Corner 在Gnome She...
目录 生命游戏(The Game of Life) Python实现 后记 生命游戏(The Game of Life) 生命游戏 是数学家John...
目录 什么是交互式小说(Interactive Fiction, IF) Inform 下载 & 安装 项目创建 开始创作 编译 & 运行 ...
目录 ucc简介 主体框架 第一部分:参数检查: 第二部分:环境准备 第三部分:参数解析 第四部分:动作执行 ucc简介 ucc 是早些年一位...
目录 工作 生活 阅读
目录 extern "C": 指示编译器以C形式进行链接 nm: 查看目标文件中的符号是C形式还是C++形式 "undefined reference": 诡异...
目录 问题 加锁 取消编译器优化 局部变量,循环变量
最近在为公司一个项目的一个模块写API,在API基本完成后,我写了几个demo把各种情况测试了一下。通过简单测试后,一时兴起,用valgrind进行了一下内存检查,真是不看不知道,一看吓一跳。
目录 asciinema简介 安装与使用 录制!分享!社交!
4月的我依然是不及格的呢。
4月15日,Github向用户发出邮件,建议使用Github Pages服务的用户,应当将使用Github Pages服务搭建的站点的Markdown文件解析器替换成 Kramdown ——在...
三月份来北京找工作,接受了红点直播的offer,然后和封诚打了个招呼跑回家处理一些杂七杂八的事情去了。万万没想到有个公司在51job上看了我的简历,认可了我的能力,然后打了电话过来劝说我。
目录 string.h 字符串拷贝(strcpy, strncpy) strcpy strncpy 字符串比较(strcmp, strncmp, strc...
二月份我只写了一篇博客(算上这篇的话时两篇),没有完成任务。如果可以的话,三月份多写一点吧。
目录 在Org-mode中编写数学公式 所见即所得:在org-mode中即时显示特殊字符、数学公式
2014年的第一个31天就这么过去了,而这个月的最后一天,刚好又是农历新年的第一天。
目录 堆排序概述 堆排序实现 节点访问 建立大顶堆 实现堆排序 发散:TOP K问题
目录 归并排序 算法思想 完整实现 发散:外排序应用 References
目录 快速排序 原理 数组划分 完整实现 发散
目录 思维导图 使用ox-freemind.el ox-freemind.el中的bug 思维导图 思维导图是一个很好地整理知识、表达思维的工具。因...
12月断断续续地看着Andrew Ng的机器学习公开课视频,因为网速还有对细节太较真的毛病,进度一直很慢——当然这和我的基础比较薄弱以及还不适应全英文学习环境有关系。
所谓“Emacs小指综合症”,是指由于长期使用Emacs导致左手小指疼痛的问题——嗯,没错,这是我下的定义——英文说法是 *Emacs Pinky Problem* 。这一问题的根源是因为Emacs的快捷键频繁使用键盘的 *ctrl* 键,而由于现在被普遍应用的 *QWERTY* 键盘布局上的 *ctrl* 键都只能用小指来按下(不过通常Emacser只使用左侧的 *ctrl* 键),且在按下 *ctrl* 时小指的负荷很大。
目录 经历 阅读 学习 人工智能 程序设计 2014年计划
今天收到了Ghost的邮件,通知说Ghost已经开启了博客托管服务,于是就去了解了一下。
org-mode导出项目时会检查项目中的文件,然后仅发布被修改且未被发布过的文件,而有时候因为项目导出设置的变化,需要重新发布项目中的所有文件.
开始系统学习机器学习以及相关的人工智能领域的知识
说实话,其实我还是更享受在纸上写日记的感觉。奈何现在大部分事情是在电脑上做的,通常做完就玩一会游戏睡觉,睡前经常记不起来要写日记,而每天其实都是有很多事情可以记录的。所以我想尝试在电脑上写日记...
有一个朋友要结婚了,不知道有没有邀请我呢。
通过形象通俗的方式来解释GFW的工作原理
在Heroku上部署Tornado应用需要在Procfile、requirements.txt中指定相关配置
图床是对图片托管服务的一种称呼,本文对国内外的主流图床进行了一些对比
因为在配置文件中少写了一个逗号,而导致我被这一条出错信息折磨得差点疯掉
将org-mode更换为8.x版本后,按照之前的经验,无论怎么设置,导出成html时都不能产生语法高亮效果
在org-mode 8.x中org-remember.el已经不复存在,其功能被org-capture.el替换,模板设置方式也发生了变化
目录 公务员考试 后续计划
Show the following lists in box notation:
Describe what happens when the following expressions are evaluated:
目录 DocViewMode 安装 感受
对于Linux系统来说,双显卡一直都是一个很令人头疼的问题,本文提供了一种简单的办法来解决双显卡风扇狂转的问题
之前说过,要将博客划分为三部分,分别通过site44、Gitcafe Paegs和Github Pages来进行发布。现在已经基本完成这一计划了,尚待改进的就是一些字体啊、布局啊的细微调整了。
今天实现了中英文的选择,当然,并没有对可能出现的错误情况进行处理,比如说选项指明是英文而文本内容是中文……
准备将博客分拆成三部分——笔记、小说和博客。当然了,这个博客实际上不包含笔记部分,这是我打算做的。
今天在commandlinefu.com 上面看到一个函数的定义,挺有意思的,来看一下:
目录 Ghost是什么 本地安装 使用 总结
由于Github Pages在后端使用jekyll来处理博客文件,对于文章内部插入的原本用来做示例的liquid语句,会被它解析而不是展示原本的内容,比如说,我在文中插入这样的示例(org-m...
今天更换了主题,其实就是jekyll-bootstrap的 twitter主题 。
今年夏天我有了我的智能手机,仅仅是一台799价格的安卓手机而已。一度我为和大家一样能有一台智能设备而高兴,尝试着各种应用和游戏。但到今天我变得很担忧。
为了简化在借助Github Pages建立的博客写博客的过程,我尝试使用elisp编写脚本来减少重复性的工作
博客平台writings.io即将关闭。其实我挺喜欢writings.io这个平台的
纯静态博客写作有响应速度快等优势,本文总结了一些常见的静态博客写作方案
使用什么博客平台取决于个人的需求,如果追求简洁的话,可以使用Github Pages来建立个人博客
这是用Jekyll+Github搭建的博客上的第一篇文章,以作纪念