开源哈萨克语语料库 我们已经从Wikipedia dump( )为哈萨克语构建了语料库。 使用WikiExtractor( )解析数据,然后使用nltk构建n-gram。 总共收集了2100万个单词。 具有将近60万个单词的不同派生词。 链接到语料库
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~