这东西有现成代码,可以直接跑,唯一的问题是代码在win下运行比较麻烦,最后在linux下完成的实验。
实验大约进行于2019年10月左右。
实验比较简单,这里仅简单记录结果。
tagspace简介
直接搜tagspace会搜出一个同名软件,这里的tagspace指的是Weston等在2014年的论文#TAGSPACE: Semantic Embeddings from Hashtags中发表的模型,这个模型基于CNN对文本进行tag推荐,是一个单tag推荐模型。
实验条件
数据集:ask Ubuntu论坛问答数据集
数据集处理:单词表按词频截取前25000个词,tag按词频截取前2500个,文本最长保留100词,tag最长保留5个
由于tagspace是单标签推荐模型,故学习时只学习每篇文档的第一个tag,预测时按照期望的输出tag数,从高到低取前X个。
实验结果
itag/@1 | tagspace/@1 | itag/@3 | tagspace/@3 | itag/@5 | tagspace/@5 | |
---|---|---|---|---|---|---|
精确 | 0.759 | 0.155 | 0.527 | 0.204 | 0.389 | 0.174 |
召回 | 0.278 | 0.152 | 0.579 | 0.249 | 0.712 | 0.299 |
F1 | 0.407 | 0.54 | 0.552 | 0.225 | 0.503 | 0.218 |
结论:结果基本和itag论文一致