Save you from anything

0%

itag的baseline——tagspace的实验

这东西有现成代码,可以直接跑,唯一的问题是代码在win下运行比较麻烦,最后在linux下完成的实验。

实验大约进行于2019年10月左右。

实验比较简单,这里仅简单记录结果。

tagspace简介

直接搜tagspace会搜出一个同名软件,这里的tagspace指的是Weston等在2014年的论文#TAGSPACE: Semantic Embeddings from Hashtags中发表的模型,这个模型基于CNN对文本进行tag推荐,是一个单tag推荐模型。

实验条件

数据集:ask Ubuntu论坛问答数据集

数据集处理:单词表按词频截取前25000个词,tag按词频截取前2500个,文本最长保留100词,tag最长保留5个

由于tagspace是单标签推荐模型,故学习时只学习每篇文档的第一个tag,预测时按照期望的输出tag数,从高到低取前X个。

实验结果

itag/@1 tagspace/@1 itag/@3 tagspace/@3 itag/@5 tagspace/@5
精确 0.759 0.155 0.527 0.204 0.389 0.174
召回 0.278 0.152 0.579 0.249 0.712 0.299
F1 0.407 0.54 0.552 0.225 0.503 0.218

结论:结果基本和itag论文一致