我们的小天地
11
17
CV基本研究方向简介 CV基本研究方向简介
CV基本研究方向简介CV全称Computer Vision,即计算机视觉,是人工智能里面很大、应用很广泛、工业化程度很高的一个研究领域,主要研究对象是图像和视频,本文我们简单介绍以下CV领域整体上的主要研究内容。 分类常见的包括图片分类和视
2021-11-17
16
Python3的PDF文件读取与处理 Python3的PDF文件读取与处理
Python3的PDF文件读取与处理由于财报和社会责任报告都是PDF格式的,所以为了与我们的BERT分类工作衔接起来,需要读取并且简单处理一下PDF文件,变成我们需要的字符串格式,并且从中提取我们需要的信息。 PDF文件读取首先我们把PDF
2021-11-16
14
祝贺小爸爸荣获Best Paper 祝贺小爸爸荣获Best Paper
祝贺小爸爸荣获Best Paper悲喜千般语仓皇,不枉日日苦奔忙。 字字看来皆辛苦,三年磨砺不寻常。 嚼得菜根终成事,覆雪梅花分外香。 今朝痛饮庆功酒,更立壮志来日长。
06
04
transformers BERT预训练模型度量文本相似性 transformers BERT预训练模型度量文本相似性
transformers BERT预训练模型度量文本相似性经过与专业人士交流,了解到目前业内常用的度量文本相似性的做法有两种,效果差不多: 把文本A和文本B拼接起来,进行二分类任务,分类标签为相似或不相似。这种做法需要微调BERT模型,和
2021-11-04
03
微调transformers进行BERT垃圾邮件分类 微调transformers进行BERT垃圾邮件分类
微调transformers进行BERT垃圾邮件分类现在我们使用Hugging Face的transformers包提供的预训练模型,在我们之前做的垃圾邮件分类任务上做一个微调,为将来我们的具体任务做准备。 本文主要参考这篇英文博客,并结合
2021-11-03
01
微调transformers BERT文本分类预训练模型 微调transformers BERT文本分类预训练模型
微调transformers BERT文本分类预训练模型本节我们为Hugging Face的transformers包中提供的文本分类预训练模型做一个Fine-tune,即微调,令其更适应于我们使用的数据集,并做一个分类任务。 主要参考了t
2021-11-01
01
Hugging Face与NLP预训练模型 Hugging Face与NLP预训练模型
Hugging Face与NLP预训练模型这一节我们来学习基于Hugging Face的NLP预训练模型的使用方式,包括Bert。 先来了解一些背景知识。 背景深度学习我们前面用的BOW,贝叶斯,SVM,LR,XGBoost都是传统机器学习
2021-11-01
10
28
21
基于BOW实现垃圾邮件分类 基于BOW实现垃圾邮件分类
基于BOW实现垃圾邮件分类上一节我们基于朴素贝叶斯的词频统计,做了垃圾邮件分类,这一节我们采用BOW模型,在相同数据集上使用BOW模型再次进行分类任务,并且使用各种经典的机器学习模型。 jieba加入自定义词典首先我们来做一个自定义分词功能
2021-10-21
2 / 5