文本文件单词的检索与计数
文本文件单词的检索与计数 文本文件单词的检索与计数是软件工程中的一项重要任务,该任务需要设计和实现文本文件的检索和单词的计数。本设计的目的是熟悉串类型的实现方法和文本模式匹配方法,熟悉如何利用模式匹配算法实现一般的文本处理技术。 在本设计中,我们将设计出串定位算法(即模式匹配算法)及其实现,然后,再利用串定位算法设计文本文件的检索及单词的计数等操作。 1. 串模式匹配算法的设计要求: 在串的基本操作中,在主串中查找模式串的模式匹配算法——即求子串位置的函数 Index(S,T),是文本处理中最常用、最重要的操作之一。模式匹配的算法很多,在这里只要求用最简单的朴素模式匹配算法。 朴素模式匹配算法的基本思路是将给定子串与主串从第一个字符开始比较,找到首次与子串完全匹配的子串为止,并记住该位置。但为了实现统计子串出现的个数,不仅需要从主串的第一个字符位置开始比较,而且需要从主串的任一给定位置检索匹配字符串。 2. 文本文件单词的检索与计数的设计要求: 要求编程建立一个文本文件,每个单词不包含空格且不跨行,单词由字符序列构成且区分大小写;统计给定单词在文本文件中出现的总次数;检索输出某个单词出现在文本中的行号、在该行中出现的次数以及位置。 本设计要求可分为三个部分实现:其一,建立文本文件,文件名由用户用键盘输入;其二,给定单词的计数,输入一个不含空格的单词,统计输出该单词在文本中的出现次数;其三,检索给定单词,输入一个单词,检索并输出该单词所在的行号、该行中出现的次数以及在该行中的相应位置。 3. 设计功能的实现: 使用 C 语言实现设计功能的实现。定义顺序串类型 SString,包括字符数组 ch 和长度 length。然后,实现 PartPosition 函数,用于实现模式匹配算法。PartPosition 函数的基本思路是扫描主串和子串,找到首次与子串完全匹配的子串为止,并记住该位置。实现 CreatTextFile 函数,用于建立文本文件,并实现文本文件的检索和单词的计数。 通过本设计的实现,可以熟悉串类型的实现方法和文本模式匹配方法,并且可以熟悉如何利用模式匹配算法实现一般的文本处理技术。本设计的实现对于软件工程中的文本处理技术具有重要的参考价值。
剩余30页未读,继续阅读
- u0106025702014-07-10一般般吧,没有考虑时间效率
- 吃葡萄不吐皮2014-05-01可以参考一下
- 粉丝: 0
- 资源: 1
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 毕设和企业适用springboot企业协作平台类及企业健康管理平台源码+论文+视频.zip
- 毕设和企业适用springboot企业协作平台类及运动管理平台源码+论文+视频.zip
- 毕设和企业适用springboot企业协作平台类及在线招聘平台源码+论文+视频.zip
- 毕设和企业适用springboot企业协作平台类及招聘管理平台源码+论文+视频.zip
- 毕设和企业适用springboot企业协作平台类及社会服务平台源码+论文+视频.zip
- 毕设和企业适用springboot企业协作平台类及全景数据分析平台源码+论文+视频.zip
- 毕设和企业适用springboot企业协作平台类及社交媒体平台源码+论文+视频.zip
- 毕设和企业适用springboot企业协作平台类及智能农场管理系统源码+论文+视频.zip
- 毕设和企业适用springboot企业协作平台类及智能配送系统源码+论文+视频.zip
- 毕设和企业适用springboot企业协作平台类及智能交通管理平台源码+论文+视频.zip
- 毕设和企业适用springboot企业云存储平台类及AI数据标注平台源码+论文+视频.zip
- 毕设和企业适用springboot企业云存储平台类及健康数据分析系统源码+论文+视频.zip
- 毕设和企业适用springboot企业云存储平台类及电影票务系统源码+论文+视频.zip
- 毕设和企业适用springboot企业协作平台类及视频内容分发平台源码+论文+视频.zip
- 毕设和企业适用springboot企业云存储平台类及跨平台销售系统源码+论文+视频.zip
- 毕设和企业适用springboot企业云存储平台类及社交电商平台源码+论文+视频.zip