我们的小天地
微调transformers进行BERT垃圾邮件分类 微调transformers进行BERT垃圾邮件分类
微调transformers进行BERT垃圾邮件分类现在我们使用Hugging Face的transformers包提供的预训练模型,在我们之前做的垃圾邮件分类任务上做一个微调,为将来我们的具体任务做准备。 本文主要参考这篇英文博客,并结合
2021-11-03
微调transformers BERT文本分类预训练模型 微调transformers BERT文本分类预训练模型
微调transformers BERT文本分类预训练模型本节我们为Hugging Face的transformers包中提供的文本分类预训练模型做一个Fine-tune,即微调,令其更适应于我们使用的数据集,并做一个分类任务。 主要参考了t
2021-11-01
Hugging Face与NLP预训练模型 Hugging Face与NLP预训练模型
Hugging Face与NLP预训练模型这一节我们来学习基于Hugging Face的NLP预训练模型的使用方式,包括Bert。 先来了解一些背景知识。 背景深度学习我们前面用的BOW,贝叶斯,SVM,LR,XGBoost都是传统机器学习
2021-11-01
基于BOW实现垃圾邮件分类 基于BOW实现垃圾邮件分类
基于BOW实现垃圾邮件分类上一节我们基于朴素贝叶斯的词频统计,做了垃圾邮件分类,这一节我们采用BOW模型,在相同数据集上使用BOW模型再次进行分类任务,并且使用各种经典的机器学习模型。 jieba加入自定义词典首先我们来做一个自定义分词功能
2021-10-21
朴素贝叶斯分类器实现垃圾邮件分类 朴素贝叶斯分类器实现垃圾邮件分类
朴素贝叶斯分类器实现垃圾邮件分类本文主要参考这个github项目来实现。 代码运行使用git clone下载项目,然后将数据集 解压到仓库路径下即可 运行:python new.py 实验结果我在本地运行得到的结果为 Building pr
2021-10-19
2021年下半年目标 2021年下半年目标
2021年下半年目标新学期新打算,小仙女和油油要制定好目标,一起努力呀: 小仙女的目标: NBY论文投出去(不晚于11月底) 产生2~3个新的idea 一个NLP 一个survey 一个case 推进其中一到两个idea,年底做好数据处
2021-10-12
NLP常见Python包简介 NLP常见Python包简介
NLP常见Python包简介Python依然是做NLP研究的主力,本文我们主要介绍NLP常用的Python包。 pypinyinpypinyin是将汉字转为拼音的常用包,可以用于汉字注音、排序、检索等,有时候需要把汉字先变为拼音再做处理。主
2021-10-11
NLP基本研究方向简介 NLP基本研究方向简介
NLP基本研究方向简介自然语言处理(英语:Natural Language Processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言处理包括多方面和步骤,基本有认知、理解、生成等部分
2021-10-10
Sublime破解及汉化 Sublime破解及汉化
Sublime破解及汉化终于找到了可用的Sublime破解方式,主要参考这篇文章,这里我们做一下破解,避免烦人的购买提示。如有必要再做一下汉化。 破解 在软件的安装目录找到 sublime_text.exe 文件,进行备份; 使用hexed
2021-09-30
小仙女的学习笔记 小仙女的学习笔记
小仙女的学习笔记这篇文章用来帮小仙女记录在学习中遇到的需要笔记的知识点。 快捷键与命令文件处理快捷键 使用 作用 Ctrl+N 新建文件 Ctrl+C 复制 Ctrl+X 剪切 Ctrl+V 粘贴 Ctrl+F 搜
2021-09-26
2 / 3