前言

看到了一个 NLP\text{NLP} 研究等位基因的算法,虽然感觉不是很科学,但是这确实是一个入门的点,值得学学。

内容

词性标注&分词

这个就是查字典,显然这个是语文/英语等语言学科研究的内容

然后有些算法,比如AC自动机这些。

标记词性是一个隐马尔可夫模型,以及一个贝叶斯网络

上面可能写的很民科,后头在仔细研究一下。

句法分析

关键词提取

摘要提取

感知机词法分析器

短语提取

拼音转换

英译人名识别(这都可以?)

日记

11月

报名了百度的那个 nlp 比赛,选的赛道 1 。

11.23

2.27