下载频道  >  ggf0101的资源
  • pyltp使用的cws_V3.4.0.model

    使用哈工大的ltp,少不了分词模型,由于ltp_data全量模型包太大,经常遇到下载不下来的问题,可以通过下载cws.model直接解决。该文件需要放置到全英文名的路径下才能用: import pyltp from pyltp import Segmentor #导入Segmentor库 math_path = "D:\ltp340\cws.model" #LTP分词模型库 segmentor = Segmentor() #实例化分词模块 segmentor.load(math_path) #加载分词库 words = segmentor.segment("中国是一个自由、和平的国家") print(' '.join(words).split()) #分割分词后的结果

    2020-02-14
    2
  • kenlm_20200110.rar

    统计语言模型工具有比较多的选择,目前使用比较好的有srilm及kenlm,其中kenlm训练速度也更快,号称单机版训练超级快,支持大规模的语料训练,文件的输入格式一行行以空格隔开的文本。kenlm训练语言模型用的是传统的“统计+平滑”的方法。

    2020-01-15
    3
  • synonym_detection-master.zip

    同义词挖掘一般有三种思路,借助已有知识库,上下文相关性,文本相似度。该zip包实现了4种同义词挖掘的方法:百度百科同义词,word2vector,语义共现网络的节点相似度,Levenshtein距离。感兴趣的同学可以下载下来研究下

    2020-01-15
    1
  • boost_1_72_0(1).tar.bz2

    在编译kenlm的时候需要安装boost,下载一直超时,为了方便大家下载boost安装包,提供该包。 ./bootstrap.sh ./b2 install

    2020-01-15
    2
  • java下进行抓包使用的jpcap.dll和jpcap.rar资源

    java下进行抓包使用的jpcap.dll和jpcap.rar,64位,适合win10下eclipse和idea使用

    2018-09-20
    1
  • 文书查询网地址

    整理罗列了一些常用的文书查询网地址,方便检索文书时使用

    2017-10-18
    5
  • Git-2.11.0-64-bit.exe

    64位windows下的git客户端工具,不用再在网上来回查找,直接下载安装使用

    2017-10-18
    2
  • NLP常用开源地址

    提供NLP常用开源地址,涉及到词性标注 句法分析 依存分析 命名实体识别 语义角色标注 UIMA等开源地址

    2017-10-18
    10
  • 常用中文分词器及地址链接

    列举了当前常用的中文分词器及其地址链接,不用再进行网络查找,直接可以进行使用。

    2017-10-18
    9
  • axure rp 6.5破解版

    axure rp 6.5破解版,方便进行原型设计,汉化,操作简单方便

    2013-04-02
    3
img

关注 私信


用户积分:29