4.2 字符集转化
如果处理的是中文字符,可能还会遇到字符编码转换的问题,可以使用 iconv 处理:
1 iconv(x, from = "", to = "", sub = NA, mark = TRUE, toRaw = FALSE)
5 XML 同 tm 包的配合使用(to do)
6 一些文本挖掘方面的应用
在得到 TermDocument 矩阵以后,基本上所有的数据挖掘算法都可以使用,如 Cluster、
Classification、Regression 等,甚至 Apriori、SNA 等技术。