from selenium.webdriver import Chrome
from selenium.webdriver.common.by import By
from bs4 import BeautifulSoup
import os
import requests
import pymysql
from pymysql.converters import escape_string
conn = pymysql.connect(
user="root",
password="plmoknijbuhv123.",
host="localhost",
database="kaoshi",
port=3306,
)
cursor = conn.cursor()
driver=Chrome()
url="https://www.dangdang.com/"
driver.get(url)
input=driver.find_element(By.XPATH,'//*[@id="key_S"]')
input.send_keys("Python")
danji=driver.find_element(By.XPATH,'//*[@id="form_search_new"]/input[10]')
danji.click()
flat=True
fd=open("html.csv",mode="a",encoding="utf-8")
sname = 1
xuhao="%05d"%1
while flat:
newurl=driver.current_url
myheaders={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36"}
response=requests.get(url=newurl,headers=myheaders)
response.encoding="GB2312"
html=response.text
soup=BeautifulSoup(html,'lxml')
ul=soup.find("ul",class_="bigimg")
lis=ul.find_all("li")
if not os.path.exists("download"):
os.mkdir("download")
i=1
for li in lis:
name=li.find("a")["title"]
try:
zuoze=li.find("p",class_="search_book_author").find("a")["title"]
except:
pass
money=li.find("p",class_="price").find("span",class_="search_now_price").text
riqi=li.find("p",class_="search_book_author").find_all("span")[1].text
chuban=li.find("p",class_="search_book_author").find_all("span")[2].text
jianjie=li.find("p",class_="detail").text
if i==1:
src=li.find("a").find("img")["src"]
else:
src=li.find("a").find("img")["data-original"]
movie_src="http:"+src
print(sname,name,zuoze)
resp=requests.get(movie_src,myheaders)
shu = "%05d" % sname
with open("download/"+str(shu)+".jpg","wb") as fp:
fp.write(resp.content)
fd.write(str(sname)+","+name+","+zuoze+","+chuban+","+riqi+","+money+","+jianjie+"\n")
sql="insert into kaoshi values (\'{}\',\'{}\',\'{}\',\'{}\',\'{}\',\'{}\');".format(escape_string(name),escape_string(zuoze),escape_string(chuban),escape_string(riqi),escape_string(money),escape_string(jianjie))
print(sql)
cursor.execute(sql)
conn.commit()
i=i+1
sname=sname+1
try:
next=driver.find_element(By.CLASS_NAME,"next").find_element(By.TAG_NAME,"a")
next.click()
except:
flat=False
fd.close()
cursor.close()
conn.close()

淮猪
- 粉丝: 131
- 资源: 7
最新资源
- Ubuntu 22.04.5 LTS 安装企业微信,(2025-02-17安装可行)
- 深入解读R语言实现的传染病传播模型源码:自由增长模型、SI、SIS与SIR模型原理及北京新冠数据预测应用,基于R语言的新冠传染病传播模型解读及实践:自由增长模型、SI模型、SIS模型、SIR模型之探讨
- 基于Matlab的LQR算法在车辆轨迹跟踪中的应用研究,基于Matlab的LQR算法在车辆轨迹跟踪中的应用研究,基于Matlab使用LQR实现车辆轨迹跟踪… ,基于Matlab; LQR; 车辆轨迹跟
- 糖尿病患者住院信息.zip
- Spring容器创建对象的三种方式:
- 电力系统有功无功协同优化模型:结合常规调度与新能源优化,借助Matlab+Yalmip+Cplex软件高效求解混合整数二阶锥规划问题,电力系统有功无功协同优化:MATLAB结合Yalmip与Cplex
- 西门子S7-200 Smart PLC与台达伺服电机协同控制:触摸屏驱动包装机夹袋至缝包机运动控制方案,西门子S7-200 Smart PLC与台达伺服电机协同控制:触摸屏驱动包装机夹袋至缝包机运动控
- 高效的六电池均衡管理系统,采用精准Buckboost电路,实现快速均衡与高精度充电,6电池精准均衡,高速BuckBoost电路设计,实现卓越性能与效率,6个电池均衡,buckboost电路,精度高,均
- Python-应用案例实现-人机猜拳游戏
- QQ交流频道(解压后查看).zip
- 感应电机异步电机模型预测磁链控制(MPFC)系统:优化定子磁链与成本函数的最小化输出策略,感应电机异步电机模型预测磁链控制(MPFC)系统:优化电压矢量以精准控制定子磁链,感应电机 异步电机模型预测磁
- 6.python-numpy2024-09-29.wmv
- 基于深度学习的复杂多变量预测:利用卷积神经网络与双向门控循环单元结合KDE实现精确区间概率预测-Matlab 2020及以上版本算法详解,基于CNN-BiGRU-KDE的区间预测模型:多变量单输出预
- C#使用NModbus4库创建Modbus TCP Slave(服务器)以及客户端简单通讯示例
- 锁相环(PLL)设计与进阶应用技术:理论与实践的完美结合,锁相环(PLL)设计与进阶探索:原理、方法及实际应用的深入剖析,锁相环PLL pll设计与进阶 ,核心关键词:锁相环(PLL); PLL设计与
- GPU加速AES算法的密码学应用:多工作流与T表性能测试实践,利用GPU加速AES算法的密码学实践:从源码到编译执行全流程解析,X00139-密码学利用gpu加速aes算法 源码文件: 测试gpu:
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈


