TREC2004Robust任务有一项新要求,就是要把检索主题按照从易到难的顺序排列。针对新的要求,提出了基于单词歧义性大小的检索主题难易度模型。根据WordNet和它附带的Brown语料库构造了单词义项分布词典,再把检索主题中的单词按歧义性大小分为7类,通过计算平均单词容易度来度量检索主题的难度。实验结果表明,该模型有一定的预测能力。最后用此模型预测了TREC2004Robust任务的250个检索主题的难易度。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~