功能需求文档
一、系统名称 : 在 线 评 论 分 析 系 统
二、主要功能 :
( 1) 能 够 抓 取 移 动 a p p 市 场 页 面 , 并 从 页 面 中 提 取 出 评 论 区 信 息
评论者、评论对象 ( a p p 应 用 ) 、 时 间 、 评 论 文 本 等
( 2) 对 评 论 文 本 进 行 特 征 和 意 见 词 抽 取
( 3) 根 据 特 征 和 意 见 词 对 评 论 文 本 进 行 准 确 的 情 感 倾 向 分 析
( 4) 利 用 网 站 进 行 结 果 展 示 和 后 台 管 理
三、系统功能模块
在线评论 分析 系统
页 面 抓 取 模 块 特 征 和 意 见 词 抽 取 模 块 情 感 倾 向 分 析 模 块 数 据 存 储 模 用 户 交 互 模
块
块
特 页 征 特 页 面 和 征 网 数 网 面 内 意 分 权 站 分 数 据 站 抓 容 见 词 重 后 类 据 存 前 取
提 词 模 计 台 模 库 储 端 模 取 抽 块 算 块 模模 模 块 模 取 块 模 块 块 块 模 块 块
将系统划分为以下几个模块 : 页 面 抓 取 模 块 、 特 征 和 意 见 词 抽 取 模 块 、 情
感分析模块、数据存储模块和用户交互模块。各个模块的具体功能如下 :
( 1) 页 面 抓 取 模 块
本模块包含两个子模块 : 页 面 抓 取 模 块 、 页 面 内 容 提 取 模 块 。
? 页 面 抓 取 模 块 的 功 能 是 利 用 网 络 爬 虫 技 术 对 互 联 网 上 的 网 页 进 行 抓 取 ,
保存链接地址、页面 h t m l 、应 用 市 场 、 应 用 名 称 等 信 息 。
评论0