哈希标签是微型博客中的重要元数据,用于标记主题或索引消息。 但是,统计数据显示,大多数微型博客都没有哈希标签。 这对这些无标签的微博客的检索和分析提出了巨大的挑战。 在本文中,我们总结了微博客和短消息新闻之间的相似性,然后提出了一种基于5W(何时,何地,谁,什么,如何)模型的5WTAG算法,用于检测微博客主题。 由于5W属性是事件描述中的核心组件,因此从理论上保证5WTAG可以正确提取微博客的语义。 我们介绍了5WTAG的详细过程,包括候选哈希标签的构建和推荐计算。 最后,我们使用新浪微博的真实数据集来验证候选哈希标签的语义正确性以及推荐计算的有效性。