词库
使用算法的基于聚类的多文档选择性文本摘要。
该存储库是论文的源代码 。
主要为韩语设计,但不仅限于此。
单击查看如何正确安装 。
查看 ,它是使用的更简单的汇总器。
安装
pip install lexrankr
分词器
不包括分词器。 您必须自己实施一个。
例子:
from typing import List
class MyTokenizer :
def __call__ ( self , text : str ) -> List [ str ]:
tokens : List [ str ] = text . split ()
return tokens
NKoNLPy 하는 사용 하는이있습니다。
from typing import List
from konlpy . tag import Okt
cla