没有合适的资源?快使用搜索试试~ 我知道了~
jieba-php:“结巴”中文分词:做最好PHP。PHP中文分词,中文断词组件。“ Jieba”(中文为“ to stutte...
共49个文件
php:18个
json:14个
txt:10个
需积分: 50 4 下载量 120 浏览量
2021-02-03
04:01:00
上传
评论 2
收藏 20.16MB ZIP 举报
温馨提示
“结巴”中文分词:做最好PHP中文分词,中文断词组件,当前翻译版本为jieba-0.33版本,未来再慢慢往上升级,效能也需要再改善,请有兴趣的开发者一起加入开发!若想使用Python版本请前往 现在已经可以支持繁体中文!只要将字典切换为big模式即可! “ Jieba”(中文为“ to stutter”)中文文本分割:内置为最好PHP中文单词分割模块。 向下滚动以获取英文文档。 线上展示 网站网址: : 网站原始码: : 特征 支持三种分词模式: 1)最小精确模式,试图将句子最精确地切开,适合文本分析; 2)全模式,把句子中所有的可以成词的单词都扫描出来,但是不能解决歧义。(需要大量的字典) 搜寻引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合使用搜寻引擎分词。 支持繁体断词 支持自定义词典 用法 自动安装:使用composer安装后,透过autoload引用 代码示例 composer require fukuball/jieba-php:dev-master 代码示例 require_once "/path/to/your/vendor/autoload
资源推荐
资源详情
资源评论
收起资源包目录
jieba-php-master.zip (49个子文件)
jieba-php-master
.gitignore 27B
README.md 35KB
test
JiebaTest.php 7KB
bootstrap.php 830B
phpunit.xml 1KB
composer.lock 79KB
LICENSE 1KB
composer.json 933B
src
class
JiebaCache.php 15KB
Posseg.php 20KB
JiebaAnalyse.php 4KB
Finalseg.php 7KB
Jieba.php 21KB
model
prob_trans.json 239B
pos
prob_trans.json 252KB
char_state.json 1.67MB
prob_start.json 8KB
prob_emit.json 3.8MB
prob_start.json 91B
prob_emit.json 1.26MB
vendor
zhconverter
Zhconverter.php 1KB
ZhConversion.php 720KB
multi-array
MultiArray.php 9KB
Factory
MultiArrayFactory.php 343B
dict
pos_tag_readable.txt 679B
dict.txt.json 8.51MB
dict.test.txt 44B
dict.small.txt.json 2.42MB
dict.small.txt 1.48MB
dict.big.txt.json 14.03MB
dict.txt 5.05MB
dict.big.txt 8.45MB
lyric.txt 721B
dict.txt.cache.json 11.58MB
dict.big.txt.cache.json 19.39MB
user_dict.txt 77B
stop_words.txt 222B
idf.txt 5.91MB
idf.big.txt 3.9MB
dict.small.txt.cache.json 3.16MB
cmd
demo_user_dict.php 1KB
demo_extract_tags.php 1KB
demo_tokenize.php 814B
cn_to_zh.php 747B
demo.php 3KB
gen_dict_json.php 1KB
demo_posseg.php 1KB
.travis.yml 1KB
circle.yml 643B
共 49 条
- 1
资源评论
FedAI联邦学习
- 粉丝: 20
- 资源: 4568
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功