没有合适的资源?快使用搜索试试~ 我知道了~
Java项目开源源码,共111个
资源推荐
资源详情
资源评论
Java
源
码
分
享
111
个
Java
源
码
,
总
有
⼀
款
适
合
您
源
码
下
载
链
接
:
https://pan.baidu.com/s/1fycjYHA7y6r-IH8H7v5XKA?pwd=ag8l
提
取
码
:
ag8l
下
⾯
是
⽂
件
的
名
字
,
我
放
了
⼀
些
图
⽚
,
⽂
章
⾥
不
是
所
有
的
图
主
要
是
放
不下
...
,
⼤
家
下
载
后可
以
看
到
。
import os
import shutil
import time
from time import sleep
import requests
from bs4 import BeautifulSoup
from docx import Document
from docx.shared import Inches
from framework.base.BaseFrame import BaseFrame
from sprider.business.DownLoad import DownLoad
from sprider.business.SeleniumTools import SeleniumTools
from sprider.business.SpriderTools import SpriderTools
from selenium import webdriver
from selenium.webdriver.common.by import By
from sprider.model.SpriderEntity import SpriderEntity
from sprider.access.SpriderAccess import SpriderAccess
复
制
class HuaJunCode:
base_url = "https://down.chinaz.com" #
采
集
的
⽹
址
save_path = "D:\\Freedom\\Sprider\\ChinaZ\\"
sprider_count = 126 #
采
集
数
量
sprider_start_count=112#
从
第
⼏
个
序
号
开
始
直
接改数
量
即可
会
做
除
法
操
作
正
正
在
采
集
第
32
⻚
的
第
16
个
资
源
debug
word_content_list = []
folder_name = ""
page_end_number=0
max_pager=16 #
每
⻚
的
数
量
haved_sprider_count =0 #
已
经
采
集
的
数
量
page_count = 1 #
每
个
栏
⽬
开
始
业
务
content="text/html; charset=gb2312"
def __init__(self):
pass
def sprider(self,title_name="NET"):
"""
采
集
PHP https://down.chinaz.com/class/572_5_1.htm
NET https://down.chinaz.com/class/572_4_1.htm
ASP https://down.chinaz.com/class/572_3_1.htm
Pytyhon https://down.chinaz.com/class/604_572_1.htm
:return:
"""
if title_name == "PHP":
self.folder_name = "PHP
源
码
"
self.second_column_name = "572_5"
elif title_name == "Go":
self.folder_name = "Go
源
码
"
self.second_column_name = "606_572"
elif title_name == "NET":
self.folder_name = "NET
源
码
"
self.second_column_name = "572_4"
elif title_name == "ASP":
self.folder_name = "ASP
源
码
"
self.second_column_name = "572_3"
elif title_name == "Python":
self.folder_name = "Python
源
码
"
self.second_column_name = "604_572"
elif title_name == "JavaScript":
self.folder_name = "JavaScript
源
码
"
self.second_column_name = "602_572"
elif title_name == "Java":
self.folder_name = "Java
源
码
"
self.second_column_name = "572_517"
#
first_column_name = title_name #
⼀
级
⽬
录
second_folder_name = str(self.sprider_count) + "
个
" + self.folder_name #
⼆
级
⽬
录
self.sprider_type =second_folder_name
merchant=int(self.sprider_start_count) //int(self.max_pager)+1 #
起
始
⻚
码
⽤
于
效
率
采
集
self.file_path = self.save_path + os.sep + "Code" + os.sep + first_column_name + os.sep + second_folder_name
self.save_path = self.save_path+ os.sep + "Code" + os.sep+first_column_name+os.sep + second_folder_name+ os.sep + s
BaseFrame().debug("
开
始
采
集
ChinaZCode"+self.folder_name+"...")
sprider_url = (self.base_url + "/class/{0}_1.htm".format(self.second_column_name))
down_path="D:\\Freedom\\Sprider\\ChinaZ\\Code\\"+first_column_name+"\\"+second_folder_name+"\\Temp\\"
if os.path.exists(down_path) is True:
shutil.rmtree(down_path)
if os.path.exists(down_path) is False:
os.makedirs(down_path)
剩余13页未读,继续阅读
资源评论
番茄小能手
- 粉丝: 3438
- 资源: 234
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功