我们的小天地
10
28
21
基于BOW实现垃圾邮件分类 基于BOW实现垃圾邮件分类
基于BOW实现垃圾邮件分类上一节我们基于朴素贝叶斯的词频统计,做了垃圾邮件分类,这一节我们采用BOW模型,在相同数据集上使用BOW模型再次进行分类任务,并且使用各种经典的机器学习模型。 jieba加入自定义词典首先我们来做一个自定义分词功能
2021-10-21
20
九叶重楼 相思怎解 九叶重楼 相思怎解
九叶重楼 相思怎解 我问大夫,什么药可以医相思之苦。 大夫说:“九叶重楼二两,冬至蝉蛹一钱,煎入隔年雪, 可医世人相思疾苦。“ 可重楼七叶一枝花,冬至何来蝉蛹,雪又怎能隔年,终是相思无解。 大夫说,殊不知夏枯即为九重楼,掘地三尺寒蝉现,除夕
2021-10-20
20
19
朴素贝叶斯分类器实现垃圾邮件分类 朴素贝叶斯分类器实现垃圾邮件分类
朴素贝叶斯分类器实现垃圾邮件分类本文主要参考这个github项目来实现。 代码运行使用git clone下载项目,然后将数据集 解压到仓库路径下即可 运行:python new.py 实验结果我在本地运行得到的结果为 Building pr
2021-10-19
12
2021年下半年目标 2021年下半年目标
2021年下半年目标新学期新打算,小仙女和油油要制定好目标,一起努力呀: 小仙女的目标: NBY论文投出去(不晚于11月底) 产生2~3个新的idea 一个NLP 一个survey 一个case 推进其中一到两个idea,年底做好数据处
2021-10-12
11
NLP常见Python包简介 NLP常见Python包简介
NLP常见Python包简介Python依然是做NLP研究的主力,本文我们主要介绍NLP常用的Python包。 pypinyinpypinyin是将汉字转为拼音的常用包,可以用于汉字注音、排序、检索等,有时候需要把汉字先变为拼音再做处理。主
2021-10-11
10
NLP基本研究方向简介 NLP基本研究方向简介
NLP基本研究方向简介自然语言处理(英语:Natural Language Processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言处理包括多方面和步骤,基本有认知、理解、生成等部分
2021-10-10