# entity_words_identification
CRF++实现实体词识别
标注规则:产品词P(实体词,都是名词)/类目词C/品牌词B/地址L/性别S/材料词M/款式词ST/效果E
数据清洗:人工与规则结合
crf++可以横向添加左右熵,长度等特征,可以提升效果,目前没有添加。
没有合适的资源?快使用搜索试试~ 我知道了~
基于python,应用crf++,进行电商命名实体识别
共87个文件
dic:21个
scel:13个
txt:12个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 120 浏览量
2024-04-23
07:38:23
上传
评论
收藏 3.11MB ZIP 举报
温馨提示
CRF++实现实体词识别 标注规则:产品词P(实体词,都是名词)/类目词C/品牌词B/地址L/性别S/材料词M/款式词ST/效果E 数据清洗:人工与规则结合 crf++可以横向添加左右熵,长度等特征,可以提升效果,目前没有添加。
资源推荐
资源详情
资源评论
收起资源包目录
entity_words_identification-code.zip (87个子文件)
entity_words_identification-code
.DS_Store 6KB
README 0B
src
tagging.py 3KB
clean.py 2KB
国家和地区词库.scel 17KB
eval.py 605B
template 492B
prepare_train_data.py 580B
get_and_clean_brand_dict.py 780B
crf_test.rst 0B
new_word_find.py 0B
get_and_clean_style.py 0B
get_and_clean_product.py 0B
crf_train.rst 13KB
model 799KB
train_terms_weight_model.py 624B
train.sh 175B
test 5KB
scel2txt.py 5KB
sample_train_data 9KB
brand_from_search 72KB
model.txt 1.5MB
data
sex_ext.dic 144B
.DS_Store 6KB
location_dict 0B
stopword.dic 4KB
国家和地区词库.scel 17KB
product_dict 0B
alibabadict
阿里巴巴产品词汇-礼品、工艺品及饰品.scel 16KB
国家和地区词库.scel 17KB
阿里巴巴产品词汇-精细化学品.scel 19KB
化妆品成分.scel 14KB
阿里巴巴产品词汇-服饰鞋帽.scel 20KB
阿里巴巴产品词汇-家居用品.scel 22KB
化妆品品牌大全.scel 21KB
product_fuzhuang.txt 2KB
常用国家名.scel 11KB
product_fushixiemao.txt 4KB
阿里巴巴产品词汇-服装.scel 14KB
product_hufu.txt 14KB
美容词汇大全【官方推荐】.scel 61KB
material.txt 2KB
product_lipingongyijishipin.txt 3KB
brand_huazhuangpin.txt 4KB
product_meirong.txt 18KB
化妆、美容、护肤.scel 49KB
product_jingxihuaxuepin.txt 4KB
scel2txt.py 5KB
product_jiajuyongpin.txt 5KB
clean.sh 138B
location_ext.dic 3KB
product_ext.dic 5KB
color_ext.dic 1KB
category_ext.dic 42B
tmp 39KB
prepare_data 1.17MB
effect_ext.dict 152B
material_ext.dic 894B
attr_dict 0B
brand_dict 30KB
ext.dic 259B
synonym_ext.dic 342B
style_ext.dic 13KB
segmention
unigram.txt 37B
brand_ext.dic 39KB
jieba
ext.dic 10B
ikdic
stopword.dic 4KB
location_ext.dic 3KB
product_ext.dic 4KB
color_ext.dic 1KB
material_ext.dic 763B
ext.dic 259B
synonym_ext.dic 124B
style_ext.dic 12KB
brand_ext.dic 11KB
simrank
simrank.py 3KB
common
crf++
include
crfpp.h 10KB
lib
libcrfpp.a 4.34MB
libcrfpp.so.0 17B
libcrfpp.so 17B
libcrfpp.so.0.0.0 2.03MB
libcrfpp.la 970B
bin
crf_test 14KB
crf_learn 14KB
requirements.txt 1KB
.gitignore 35B
README.md 330B
共 87 条
- 1
资源评论
MarcoPage
- 粉丝: 3026
- 资源: 3306
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功