技术文档链接汇总

NLP方面

小结：

这篇博客将文本情感分析任务分为词级、句子/文档级、目标级；目标级又分为TG-ABSA、TN-ABSA、T-ABSA三种，分别表示文本中出现的实体的某些属性的情感正负倾向、文本中出现的实体的情感正负向、文本中出现的实体和属性组合的情感正负倾向，三者例子如下。并且介绍了华为云在这几种任务上的进展。

有借用本文档相关工作的文献：

小结：

命名实体识别（Named Entity Recognition, NER）是指从自由文本中识别出属于预定义类别的文本片段，现有一些公开语料库如NER标注语料库，举个例子，假如有这么一句话：

ACM宣布，深度学习的三位创造者Yoshua Bengio， Yann LeCun，以及Geoffrey Hinton获得了2019年的图灵奖。

那么NER的任务就是从这句话中提取出

有一些公开的学术界和工业界的NER工具可以使用。有一些基于CNN、RNN、transformer的模型可以使用。

有借用文档相关工作的文献：

这段话主要是再说，细粒度（Fine-Grained）命名实体识别可以为特定个体识别其最合适的身份属性。概念（概念一般是自定义的）级别的情绪挖掘技术可以用于理解身份标签所包含的情绪含义。引文[5]从电影评论中提取了特定人物角色的语义特征，类似于身份identities。

FGNER是给定候选实体 (Mention)及其上下文 (Context)，预测可能的类别集合。FGNER与NER的区别在于：

识别边界
- NER从文本序列中识别实体的边界和类型，一般当作序列标注任务来处理
- FGET任务实体边界通常已经给定，一般当作有层级的多标签分类任务来处理
类别层级
- NER面向的类别数量较少，因为序列标注问题搜索空间比较大，限制了实体的类别数量
- FGET面向几十个或者上百个类别，需要考虑类别之间的subClassOf关系

比如如下几句话：