没有合适的资源?快使用搜索试试~ 我知道了~
textsplitter:将长文本拆分为推文大小的块 Python 版本
共16个文件
txt:7个
py:3个
working:2个
需积分: 25 1 下载量 164 浏览量
2021-06-24
18:44:12
上传
评论 1
收藏 5.51MB ZIP 举报
温馨提示
文本分割器 将长文本拆分为推文大小的块 Python 版本 算法 将长文本拆分为 140 个或更少的长块。 以下规则适用: 预运行: 用空格替换单换行符,除非它后面跟着一个大写字符 当两个或多个连续换行符时拆分 只要标点前面至少有五个非标点字符,就可以在 140 个字符之前拆分最后一个标点符号。 (例如,当我们有“...John Smith 迟到了。PG Wodehouse 生气了。”我们更喜欢在“迟到”之后休息。) 如果失败,在 140 个字符满之前拆分最后一个空格,优先使用换行符而不是其他空格 如果即使失败,也可以拆分为 140 个字符。
资源推荐
资源详情
资源评论
收起资源包目录
textsplitter-master.zip (16个子文件)
textsplitter-master
booktweeter.py 4KB
splitter.py 1KB
fw.txt 1.25MB
numbers.txt 9KB
fp.txt 25B
init.py 738B
working.txt 2.76MB
LICENSE 11KB
0600031.txt 2.81MB
book.working 2.76MB
fworking.book 1.29MB
requirements.txt 233B
.gitignore 690B
0600031.working 2.84MB
README.md 721B
line.txt 30B
共 16 条
- 1
资源评论
向朝卿
- 粉丝: 42
- 资源: 4443
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于STM32F103C8T6的智能家居控制系统源码+文档说明(高分毕业设计)
- Windows环境下OpenSSH服务的安装与启动配置指南
- MT4缠论指标免费使用无限制,无需续费及绑定电脑
- 基于STM32F103C8T6的车辆落水报警系统源码+文档说明+原理图(毕业设计)
- 编程不良人ElasticSearch-7.14笔记
- 学之思开源考试系统是一款java+vue的前后端分离的考试系统 主要优点是开发、部署简单快捷、界面设计友好、代码结构清晰 支持web端和微信小程序,能覆盖到pc机和手机等设备 支持多种部署方式
- PHP旅游智能CRM系统源码数据库 MySQL源码类型 WebForm
- 大数据1+x(蓝桥课堂实操231216)解析
- 基于STM32F103C8T6的双轮平衡小车项目源码(代码注释全面适合小白)
- 金杰.m4a..mp3
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功