没有合适的资源?快使用搜索试试~ 我知道了~
毕设日记.docx(该资源为个人记录)
需积分: 9 0 下载量 82 浏览量
2021-07-10
16:24:36
上传
评论
收藏 128KB DOCX 举报
温馨提示
试读
30页
记录本科期间编写毕业论文Word文档格式审查系统中所查询的资料和解决过的部分问题
资源详情
资源评论
资源推荐
这是毕设日志
2021 年 1 月 28 日星期四
今天上午去得胜下午回来练琴,晚上六点过开始写代码,终于实现 按钮点击选择文件如果文件为
文件将其改为 文件
2021 年 2 月 2 日
今天上午去取快递十点过才到家,然后写完了 打家劫舍的题,十二点下楼吃饭,一点开
始练一个小时琴,两点开了十多分钟会议,然后玩到两点四十开始写代码,终于把解压 使用
实现()接下来实现了将 直接重命名为 和将 改名为 。
(明天开始弄查找 文件了)下午五点过下楼看数据库,截止到八点多看了 页,然后在手机上看
了三篇惊人院小说。晚上上楼写完数组区间和的问题,主要是没想到可以在函数上面再建立一个新的数
组,其他算法都是对的。看了第 题,加油每天看至少 页,早点吧数据库这本书看完好过年,过年
应该还有不到十天了,加油哦,每天都得坚持住。
2021 年 2 月 5 日 星期五
号上午上街,下午打扫卫生, 号上午练习英语然后做饭,去帮忙弄了一会路,下午玩手机,然后练
了电子琴,晚上把数据库看到了 页,没有看书。
今天早上七点过起床练习一个小时左右口语,吃饭一会跑了大概半小时 点 分开始学习
2021 年 2 月 8 日 星期一
这几天又没怎么学习,看小说,然后追剧,昨天修路,今天早上终于七点过起床学习了。 前几天实现了
转为 和将 改成 文件并解压缩以后得到 文件,只要实现对 文件的提取就可
以,但后来参看论文《学术论文格式检查和内容校对的研究袁敏》,发现接下来他读取 使用的是
而该软件只要是针对 ! 的,虽然也可以嵌入到 中,但需要辅助工具 "# 等,较
为繁琐,同时查找资料发现 具有直接的支持获取 文档格式的 库,不需要把 转
换为 文档便可以直接获取文档格式信息,但 只支持 文档,不支持 文档,所以只需
要就把 转换为 就可(已实现),但涉及到利用 $ 插件获取文档格式的参考资料
较少。
使用 # 直接下载 $ 组件:
链接:%&''"()*+)'#',,-.---.*)
读取 /# 文档
链接:
%&''*()%)'+'#'%'--0
++1%#*+)#!**%/)$%2$$
334#%#2!3#2!$,)%5$
+%+#1%#*+)#!**%/)$%2$$334#%#2!3#2!$
,)%
这个链接也是讲述读取 文档,设计读取表格和图片
链接:
%&''*()%)'**'#'%',0
++1%#*+)#!)$%2$*($
6(78#9:#$)#5$
+%+#1%#*+)#!)$%2$*($6(78#9:#$
)#
年 月 日 星期二
程序已经可以实现页面属性和段落属性的提取,但是对于正则表达式,而且还有 和 "!
的区别,对于使用正则表达式,要对应摘要什么的特殊内容的提取,特殊文本的提取包括目录标题图片
表名,参考文献的提取,具有明显的格式特征,但这种格式只是针对论文,需不需要加一个判断是否有
特殊文本中包含的内容,由于参考文献格式和论文格式存在段落数量等的差距,是否可以只根据正文其
中某一段默然正文的每一段格式都是这样,提取文档的时候就提取论文的各级标题和正文的格式来和待
检查文档进行比较。还可以检查是否跨标题,如一级标题以后就直接是三级标题。考虑工作量的话,现
在主要就是对于将 程序封装成 以及数据库这个有问题。
综上有以下几个问题
) 和 "! 的区别导致工作量减少
) 使用正则表达式对于特殊内容的提取是否可以推广
) 段落是否为默认相同
) 在 的基础上考虑是否正文可以简化为分为各类标题和正文内容
,) 在哪可以下载论文格式
今天答辩,发现 包也不行了,必须要自己写出来的才行,哎,还有就是说这个不仅要知其然还要
知其所以然
年 月 , 日 星期一
这几天又没有好好学习,几乎都在玩,今天已经初四了。
#;6 可以查看内置函数及其代码
解析 <9: 常见的有三种方法:一是 ))=模块,它是 >7?9 的实
现,若需要处理 ?9 则该模块很适合;二是 )%)=模块,它是 @< 的实现,
这个模块牺牲了便捷性来换取速度和内存占用,@< 是一个基于事件的 ,这就意味着
它 可 以 “ 在 空 中 ” 处 理 庞 大 数 量 的 的 文 档 , 不 用 完 全 加 载 进 内 存 ; 三 是
)#)AB# 模块(简称 AB),它提供了轻量级的 式的 ,相对
于 ?9 来说 AB快了很多,而且有很多令人愉悦的 可以使用,相对于 @< 来说 AB 的
AB)##% 也提供了 “在空中” 的处理方式,没有必要加载整个文档到内存, AB 的性能
的平均值和 @< 差不多,但是 的效率更高一点而且使用起来很方便。
获取文档标签及属性值:
%&''*()%)'2(%+(**'#'%'0
++1%#*+)#!)$%2$*($
6(78#9:#$)#5$
+%+#1%#*+)#!)$%2$*($
6(78#9:#$)#
年 月 日 星期二
链接:&''///)!%)'#'-)
)#)AB#)#%CD函数解析整个 <9: 文档并将其转换成一个文档对象。
然后,你就能使用 4CD、#4CD和 4CD等方法来搜索特定的 <9: 元素了。
这些函数的参数就是某个指定的标签名,例如 '或 。
大部分 调用 语句
链接:%&''///)"*,)'#'-,)
年 月 日 星期五
/# 中的各个标签:
%&''*()%)',-'#'%'--,0
++1%#*+)#!)$%2$*($
6(78#9:#$)#5$
+%+#1%#*+)#!)$%2$*($
6(78#9:#$)#
E/&FEG$$表示一个段落$$F
E/&!FEG$$表示一个值$$F
E/&#FEG$$表示一个样式串,指明它包括的文本的显示样式,表示一个特定的文本格式$$
F
E/&FEG$$表示真正的文本内容$$F
E/&##FEG$$是E/&#F标签内的标签,对 H+ 文本属性进行修饰$$F
E/&#FEG$$是E/&F标签内的标签,对 #(# 文本属性进行修饰$$F
E/#%FEG$$字体$$F
E/&#FEG$$页眉$$F
E/&.#FEG$$页脚$$F
E/&#/(FEG$$图片$$F
E/&FEG$$绘图对象大小$$F
E/&IAFEG$$嵌入图形的效果$$F
E/&FEG$$内嵌绘图对象,%CB6:,HD距离文本上下左右的距离$$F
E/&#.FEG$$不检查拼写和语法错误$$F
E/&#FEG$$表示文档属性$$F
E/&#%HFEG$$指定唯一一个标识符,用来跟踪编辑在修订时表行标识,所有段落和段落
中的内容都应该拥有相同的属性值,如果出现差异,那么表示这个段落在后面的编辑中被
修改。$$F
E/&#FEG$$表示关系,段落中以相连续的中文或英文字符字符串,作为开始和结束。目的
就是要把一个段落中的中英文字符区分开来。 $$F
E/&FEG$$/&# 元素的子元素,跟 /&@ 并列, 代表缩进情况:有几个属性
值:① 4#%:(首行缩进)② .(左缩进)③当 . 和 4#%: 同时出现时代表下面
的元素有两种属性首行和下面其他行都是有属性的④ (((悬挂)$$F
E/&FEG$$字体的类型,/% 的子元素,属性值 %% 表面上的意思是“东
亚”,指代“中日韩 7 JK类型。$$F
E/&*7%FEG$$复合字体的加粗$$F
E/&*2#2@#FEG$$书签开始$$F
E/&*2#2AFEG$$书签结束$$F
E/&%H#(6#2FEG$$页面进行分页的标记,是 /&# 的一个属性,表示此
段字符串是一页中的最后一个字符串。$$F
E/&%#B(FEG$$智能标记$$F
E/&#FEG$$自定义 <9: 属性$$F
E/&*/&!1KKFEG$$表示该格式串种的文本为粗体$$F
E/&"/&!1L#(L'FEG$$表示对齐方式$$F
E/&%/&!1LL'FEG$$表示字号大小$$F
E/&%7%/&!1LL'FEG$$$$F
E/&&%1L#%#!LFEG$$保持空格,如果没有这内容的话,文本的前后空格
将会被 ># 忽略$$F
E/&%(/&1LL/&H+1L+L'FEG$$设置行距,要进行运算,要用
数字除以 ,如此处为 '1), 倍行距$$F
E/&"/&!1L#L'FEG$$这句话表示段落对齐方式 $$F
EG$$设置了页的宽,高,和页的各边距。各项的值均是英寸乘 得出 $$F
E/&*F
E/&%#F
E/&(@/&/1LL/&1L,L'F
E/&(9# /&1LL /&#(1LL /&*1LL
/&.1LL/L-L/&.#1L-L/&(+#1LL'F
E'/&%#F
E'/&*F
剩余29页未读,继续阅读
阿钰呀~
- 粉丝: 21
- 资源: 9
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0