没有合适的资源?快使用搜索试试~ 我知道了~
java实现英文文档分词
4星 · 超过85%的资源 需积分: 45 112 下载量 159 浏览量
2014-03-14
22:30:36
上传
评论 1
收藏 43KB DOC 举报
温馨提示
试读
4页
实现英文分词 可供参考,从开头到结果呈现,配有详细的注解,实验报告的形式
资源推荐
资源详情
资源评论
武汉大学信息管理学院实验报告
一、 实验目的
1. 根据理论课所讲的信息检索的主要思想好关键技术来进行实验测试,以培养在信息检索
相关领域的知识运用能力。
2. 主要理解文档的分词过程,和其中关键技术
二、 实验内容与实验步骤
1、 实验内容:
读取文档并分词。要求给定一篇.txt 英文文档,计算机读入并统计该篇文章由哪些词组成,
按字母顺序输出出现过的词以及每个词的出现频率。
2、 实验步骤:
1. 预习老师所给的参考资料
2. 理解分析实验内容的关键步骤
3. 写代码并调试;
三、 实验代码与结果
实验思路:统计一篇给定的英文文章中各个单词出现的次数并按照字母顺序排列。因为
要存放两个变量,用 treeMap<key,value> 来存放数据, Key 是要统计的单词,Value 是单
词出现的次数。在分词的过程中使用的是 StringTokenizer 方法。最后再按照 Key 的升序排
列出来。
具体代码和注释:
import java.util.*;
import java.io.*;
public class fenci {
public static void main(String[] args) throws Exception {
Map<String, Integer> treeMap = new TreeMap<String, Integer>();
// 构造一个 treemap 类,key 是 string 类,value 是 integer 类,用于存放单词数据
第 1 页 共 4 页
u010204922
- 粉丝: 1
- 资源: 2
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
前往页