第三十九届国际计算机学会信息检索国际会议(ACM SIGIR2016)日前在意大利比萨举行,我校计算机学院软件工程国家重点实验室硕士研究生王浩然、张芷芊在李晨亮副教授的指导下完成的论文《Topic Modeling for Short Texts with Auxiliary Word Embeddings》被大会录用发表,获得本届大会最佳学生论文荣誉奖,李晨亮副教授与研究生王浩然受邀参加了大会并做现场报告。
论文《Topic Modeling for Short Texts with Auxiliary Word Embeddings》针对传统主题模型技术在短文本集上效果不佳的现状,利用深度学习技术对单词语义和句法相似性的优秀表达能力,提出了利用语义句法相似单词相互促进主题抽取的短文本集主题模型技术,有效地提升了生成主题的语义一致性,并且对短文本生成的主题表达具有更出色的区分度。这项研究成果对短文本理解、用户画像、主题检测、用户评论分析、以及分类等文本分析挖掘任务具有重要意义。
SIGIR会议 (ACM SIGIR International Conference on Research on Development in Information Retrieval)是国际计算机学会信息检索专委会组织的年度会议,被公认为信息检索领域最顶级的学术会议,同时是中国计算机学会(CCF)推荐的A类国际学术会议。SIGIR创始于1971年,至今已有40多年历史,近十几年来一直都是互联网业内关注的焦点。SIGIR2016共收到投稿341篇,录用62篇,录用率为18%。