texthero:从零到英雄的文本预处理,表示和可视化-源码

所需积分/C币:22 2021-02-03 15:12:00 22.9MB ZIP
18
收藏 收藏
举报

从零到英雄的文本预处理,表示和可视化。 •••• •• 从零到英雄 Texthero是一个Python工具箱,可快速轻松地处理基于文本的数据集。 Texthero非常简单易学,可以在熊猫上使用。 Texthero具有与Pandas相同的表现力和力量,并有大量文献记载。 Texthero是现代的,是为2020年代的程序员设计的,几乎没有语言方面的知识。 您可以将Texthero视为帮助您理解和使用基于文本的数据集的工具。 给定表格数据集,很容易掌握主要概念。 相反,在给定文本数据集的情况下,很难快速了解下划线数据。 使用Texthero,预处理文本数据,将其映射到向量中以及可视化所获得的向量空间仅需几行。 Texthero包含以下工具: 预处理文本数据:它提供了即用型解决方案,但对于自定义解决方案也很灵活。 自然语言处理:关键短语和关键字提取,以及命名实体识别。 文本表示形式:TF-IDF,词频和自定义词嵌入(wip) 向量空间分析:聚类(K均值,Meanshift,DBSCAN和Hierarchical),主题建模(wip)和解释。 文本可视化:向量空间可视化,将本地

...展开详情
立即下载 低至0.43元/次 身份认证VIP会员低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
上传资源赚钱or赚积分
最新推荐
texthero:从零到英雄的文本预处理,表示和可视化-源码 22积分/C币 立即下载
1/0