# 基于高校服务器信息的网络空间资源分类
## **1** 引言
随着网络的进一步普及化的复杂化,网络空间中的资源呈现爆发性的增长。一般认为,网络空间资源是对于网络空间中存在的万物的总称,既包括网络空间中存在的路由器等硬件,也包括网站、ftp 等服务器端的软件,内容庞杂。为了便于进一步统计和管理网络空间资源,对网络空间资源进行合适的分类变得极为重要。当前,学术界尚未能够对于网络空间资源的分类方法达成共识,也尚未有一种得到公认的分类标准,因而,这一方向存在较大的研究价值。
网络空间资源的分类需要遵循一定规律,即对于网络空间万物需兼具正交性、可用性、完备性等特点,能够将网络空间资源能够以有限种类别进行全覆盖式的分类。
考虑到网络空间数据量巨大,本次研究聚焦于高校的服务器信息,希望能够通过对高校的服务器信息提出一种或几种符合要求的、合理的分类方法,以能够一窥网络空间资源分类的全局。考虑到高校服务器信息的完备性和资源获取的可操作性,本次研究重点从清华大学、北京大学、中国人民大学、复旦大学、上海交通大学等国内知名的五所高校入手,通过获取上述高校的服务器信息,提出基于端口状态、基于网络资源位置、基于网络设备的端口空闲程度、基于网络设备的服务名称等四种分类方式。
而为了实现能够在前端呈现至少每日更新一次的结果,减轻服务器在更新信息方面的压力、保证服务器信息的时效性,本次研究重点为清华大学和北京大学两所高校,并以检索所得的两所高校的超过20万条服务器信息为样本进行分析。
## **2** 网络空间资源获取
### **2.1** 获取情况概述
本次研究采用 nmap 获取清华大学和北京大学的服务器的全部实时信息。Nmap 作为一种高效的网络连接端扫描工具,能够充分扫描服务器开放的网络服务端,并确定运行在各自连接端的服务。由于 Nmap 提供了极为方便快捷的服务器信息获取方式,能够使本研究团队在有限的时间内获取足够多的可供分析的信息,因而在本次研究中关于网络空间资源获取方面所采用的主要方法即为 nmap。
本次研究从清华大学、北京大学、中国人民大学、复旦大学、上海交通大学等五所高校获取其服务器信息。其中,以清华大学和北京大学两所高校共搜集的 20 余万条信息和检所获取的 6 万余条信息作为样本进行分析。其中两校在端口数量方面的情况如下图所示。
![](https://www.writebug.com/myres/static/uploads/2021/11/24/a6c476f93ba29abe30d7542c261451f4.writebug)
图 1 清华大学、北京大学端口数量情况
为了提供更好的检索服务,本研究团队除了通过搭建前端展示两所高校检所得到的全部服务器信息外,还通过每日更新保持信息的时效性。考虑到更新数据的规模和速度,因而重点以清华大学、北京大学两所高校的服务器信息作为样本进行整理、展示和分析。
### **2.2** 网络资源的选择标准
本次研究所选择的网络资源主要是服务器信息,这一选择的主要原因是服务器信息在网络空间资源中的代表性,同时也是基于对现实因素的考虑。
为了保持网络资源的更新频率,因而对于网络资源的数据量和获取速度提出了很高的要求,而主机、路由器等其他资源信息的获取难度较大,一方面主要是爬取更详细的服务信息存在较大的不确定性,容易导致不同时期爬取所得的信息存在较大的差别,另一方面则是爬取主机、路由器等速度较慢,在本次研究中每次爬取需要耗时9s以上,甚至在100s内都无法返回结果,因而难以满足本次实验对于样本数量规模的要求。
即便如此,仅清华大学和北京大学的服务器信息获取仍然面临数量过大的问题。需要获取的IP地址区段为59.66.0-255.0-255和166.111.0-255.0-255,使用nmap的情况下,每个平均耗时仍然在5s左右,在串行情况下每次更新的总耗时超过110小时,信息量庞大、获取耗时大。
### **2.3** 未能找到的网络资源原因分析
即便基于现实因素和实际需要的考虑,我们选取相对更容易稳定获取的两所高校的服务器信息作为研究对象,但在搜集这部分网络资源的过程中,仍然存在部分资源无法找到的情况。主要原因包括以下三点:
没有主机。寻找到的资源可能是一个空IP,因而无法返回符合要求的服务器信息;
访问权限问题。有些服务器没有完全开放,因而存在对于访问权限的限制,这一点在高校中仍然是比较普遍的,因而访问权限问题同样部分阻碍了获取全部网络资源信息;
防火墙问题。由于目前高校一般都拥有自身的校园网,很多服务器仅面向校园网开放,对于外网设置有防火墙,本研究团队难以获取这些服务器的网络资源。
仍然有其他如网络状况等原因,在此不再列举。尽管有部分网络资源由于种种原因未能获取,但仍然不影响本次研究的推进。
### **2.4** 实验问题
在本次研究过程中,也存在一些难以避免的问题,在研究结束时仍然没有获得理想的解决方案。这些问题的出现,一些是由于网络状况所致,一些则是由于服务器等各种原因所致。主要遇到的问题包括:
nmap稳定性不足。在数据量较大的时候,nmap会存在跑网站不稳定的情况,为了提高数据搜集的效率,在研究所使用的爬取脚本中将时间上限设为120s。而在这种情况下,nmap在获取一些服务器资源的过程中,仍然存在超时的情况,且有些时候超时原因并不明确;
执行条件和服务器状态不稳定。由于执行条件的不稳定,导致返回结果存在很大的差距。如在实验中,同样的指令分别爬取IP和100个IP一起爬取所获得的结果经常完全不同,而即便是100个IP一起爬取,每次爬取所获得的结果有时也是不完全一样的、甚至存在比较大的差别。
这些实验问题的出现导致网络资源的获取并不像预想中顺利;且一些问题出现原因不明也影响了获取的服务器信息的不稳定。
## **3** 网络空间资源的分类
在获取网络空间资源的基础上,本研究团队进行了符合要求的分类。
分类标准需要符合正交性、可用性、完备性等特点,尤其是正交性特点,即所有分类需要涵盖全部信息;基于这一点,我们考虑的几种分类形式均为排他性或采用完全对立的指标。
### **3.1** 分类标准
根据检索得到的数据量,本研究团队采用了如下四种符合要求的分类标准:
基于端口状态。将获取的三万余端口的状态根据返回信息分为open、closed、filtered三类,覆盖全部端口的状态情况;
基于网络资源位置。我们根据服务器的位置,将网络资源的位置分为清华大学、北京大学、中国人民大学、复旦大学、上海交通大学等五类,并将展示的网络资源样本分为清华大学和北京大学两类。这种分类方式看似是预设性的,但是这种分类的原则却并不是局限的,在其他网络资源中基于位置进行分类同样是一种基本的分类标准;
基于网络设备的端口空闲程度。为了评价网络设备的端口空闲程度,我们所衡量的指标为服务器所开放的端口数量,在对我们获取的资源进行分析之后,我们将边界值定为5个,即当开放的端口数大于或等�
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
本次研究采用 nmap 获取清华大学和北京大学的服务器的全部实时信息。Nmap 作为一种高效的网络连接端扫描工具,能够充分扫描服务器开放的网络服务端,并确定运行在各自连接端的服务。由于 Nmap 提供了极为方便快捷的服务器信息获取方式,能够使本研究团队在有限的时间内获取足够多的可供分析的信息,因而在本次研究中关于网络空间资源获取方面所采用的主要方法即为 nmap。详细设计见md文件。
资源推荐
资源详情
资源评论
收起资源包目录
基于高校服务器信息的网络空间资源分类 附完整代码数据可作为毕设课设 (145个子文件)
resource.bmp 2.31MB
bootstrap.css 134KB
bootstrap.min.css 111KB
bootstrap-theme.css 21KB
bootstrap-theme.min.css 19KB
style.css 3KB
style.css 3KB
mystyle.css 1KB
pre_style.css 669B
portlist.csv 125KB
hostlist.csv 29KB
resource classification.csv 1KB
resource classification-2.csv 1KB
多功能IP搜索.doc 2.27MB
计算机网络管理课程论文模版.doc 130KB
2014011292_804845_199706181_project_report(1).docx 19.8MB
前端展示及操作.docx 1.12MB
期末报告(1).docx 447KB
圆饼图.docx 18KB
数据测量.docx 15KB
大作业说明以及要求.docx 13KB
引言.docx 5KB
glyphicons-halflings-regular.eot 20KB
r1.html 2KB
index.html 2KB
s1.html 1KB
r2.html 1KB
s2.html 1KB
notfound.html 927B
news.iml 1KB
Project.iml 699B
login.jpg 257KB
background.jpg 241KB
black.jpg 192KB
back.jpg 151KB
result.jpg 75KB
网络空间资源.jpg 64KB
white.jpg 48KB
bootstrap.js 64KB
bootstrap.min.js 34KB
npm.js 484B
LICENSE 1KB
bootstrap.css.map 358KB
bootstrap-theme.css.map 41KB
数据.md 18KB
README.md 14KB
带字幕视频.mp4 3.77MB
带字幕视频.mp4 3.77MB
多功能IP搜索.pdf 1.51MB
多功能IP搜索.pdf 1.51MB
计算机网络管理课程作业.pdf 1.35MB
计算机网络管理期末论文参考.pdf 537KB
数据.pdf 177KB
图1.png 1.73MB
图2.png 1.73MB
resources.png 151KB
resources.png 151KB
http类端口数量(含https).png 15KB
http类端口数量(不含https).png 15KB
sshversion.png 14KB
images.png 14KB
https类端口数量.png 13KB
ftp类端口数量(不含ftp).png 12KB
ftp类端口数量.png 11KB
logo.png 9KB
statepiechart.png 7KB
service(colorful).png 7KB
各ip端口数量.png 5KB
servicenumber.png 4KB
PPT.pptx 4.63MB
one_more_hour.pptx 4.63MB
settings.py 3KB
data_process.py 2KB
draw.py 2KB
data_process.py 2KB
views.py 1KB
manage.py 1021B
urls.py 1007B
wsgi.py 386B
urls.py 206B
apps.py 102B
admin.py 63B
tests.py 60B
models.py 57B
__init__.py 0B
__init__.py 0B
__init__.py 0B
settings.cpython-36.pyc 2KB
views.cpython-36.pyc 2KB
urls.cpython-36.pyc 1KB
wsgi.cpython-36.pyc 578B
urls.cpython-36.pyc 305B
__init__.cpython-36.pyc 190B
__init__.cpython-36.pyc 180B
draw.R 2KB
draw2.R 706B
picture.R 520B
.Rhistory 17KB
db.sqlite3 128KB
glyphicons-halflings-regular.svg 61KB
共 145 条
- 1
- 2
资源评论
甜辣uu
- 粉丝: 8416
- 资源: 1103
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- mmexport1714832730470.jpg
- 第8次课作业.md
- 过客软件园_1.1.apk
- boboav_night.apk
- 235486247769308自带键盘安卓海贼.apk
- 672536945416276wap.stuzn.com_1000_1137350andme_signed.apk
- 737836185360652wap.stuzn.com_1000_1642030hzw_n73d.apk
- JavaWeb阶段综合项目的接口文档
- 003 登录rsa+token 登录rsa+token(需改善 私钥不应该硬编码在类中、密码应该存储为哈希值)
- 992475461755466幼稚园春游功能版.apk
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功