<p align="center"><a href="https://github.com/DeepDarkFactory" target="_blank"><img width="100"src="http://7xqvgr.com1.z0.glb.clouddn.com/logo.jpg"></a></p>
<p align="center">
<a href="https://github.com/DeepDarkFactory"><img src="https://img.shields.io/badge/Made%20in-DDF-ff69b4.svg" alt="DDF" /></a>
<a href="http://kotlinlang.org/"><img src="https://img.shields.io/badge/Kotlin-1.1.2-brightgreen.svg" alt="Kotln" /></a>
<a href="https://gradle.org/"><img src="https://img.shields.io/badge/gradle-3.5-brightgreen.svg" alt="Gradle" /></a>
<a href="https://github.com/Nbsaw/kotlin_spider/blob/master/LICENSE"><img src="https://img.shields.io/npm/l/vue.svg" alt="License"></a>
</p>
## 简介
目标是拿Kotlin写各种有趣的爬虫。然后用Javascript做各种效果。
## 目前想做的爬虫
- [X] 网易歌词爬虫
- [ ] 微博爬虫
- [ ] QQ爬虫
- [ ] 知乎日报
## 各个爬虫的详细功能
这里目前只说已经做完的爬虫。
### 网易歌词爬虫
这是一个爬取歌词然后进行分析的小程序。根据歌手的名字找到歌手的id,在通过歌手的id查找歌手top50的歌曲,然后获取歌词并过滤掉一些不需要的信息。找出最常使用的那些词组存到数据库里做缓存。找出词组使用了[结巴分词](https://mvnrepository.com/artifact/com.huaban/jieba-analysis/1.0.2)当查询歌手的时候,先判断数据库有没有这个歌手的记录,如果有直接从数据库中查找歌词列表,如果没有,在线爬取。前端使用了[d3-cloud](https://github.com/jasondavies/d3-cloud)生成词云。主要想生成的词云样子如下:
<p><img src="http://7xqvgr.com1.z0.glb.clouddn.com/%E8%96%9B%E4%B9%8B%E8%B0%A6%E8%AF%8D%E4%BA%91" width="600px" alt="是的就是薛之谦 :D" /></p>
## 为什么使用Kotlin做为后端语言
主要有以下方面
1. 我在学习这门语言
2. 我喜欢这门语言
3. 这门语言是一门不错的语言,有些地方可以写的很短
4. 因为我是java开发者,完全兼容java,所以我用着还行
## License
[The MIT License (MIT)](https://github.com/Nbsaw/kotlin_spider/blob/master/LICENSE)
## 日志
现在是2017年10月21日13:59:42,完全忘记了这个东西....
没有合适的资源?快使用搜索试试~ 我知道了~
Kotlin 开发的一个小爬虫项目,写各种有趣的爬虫,然后用Javascript做各种效果
共79个文件
xml:46个
kt:10个
txt:5个
需积分: 5 0 下载量 84 浏览量
2024-04-27
23:31:00
上传
评论
收藏 61KB ZIP 举报
温馨提示
【简介】 目标是拿Kotlin写各种有趣的爬虫。然后用Javascript做各种效果。 【目前想做的爬虫】 网易歌词爬虫 微博爬虫 QQ爬虫 知乎日报 各个爬虫的详细功能 这里目前只说已经做完的爬虫。 【网易歌词爬虫】 这是一个爬取歌词然后进行分析的小程序。根据歌手的名字找到歌手的id,在通过歌手的id查找歌手top50的歌曲,然后获取歌词并过滤掉一些不需要的信息。找出最常使用的那些词组存到数据库里做缓存。找出词组使用了结巴分词当查询歌手的时候,先判断数据库有没有这个歌手的记录,如果有直接从数据库中查找歌词列表,如果没有,在线爬取。前端使用了d3-cloud生成词云。主要想生成的词云样子如下: 是的就是薛之谦 :D 为什么使用Kotlin做为后端语言 主要有以下方面 我在学习这门语言 我喜欢这门语言
资源推荐
资源详情
资源评论
收起资源包目录
kotlin_spider-master.zip (79个子文件)
kotlin_spider-master
.gradle
buildOutputCleanup
cache.properties 49B
cache.properties.lock 2B
built.bin 0B
3.5
file-changes
last-build.bin 1B
taskHistory
taskHistory.lock 17B
src
test
resources
logging.properties 82B
books.xml 679B
kotlin
XpathStudy.kt 1KB
JIeba.kt 243B
Music163Test.kt 181B
main
resources
banner.txt 434B
application.yaml 620B
kotlin
kotlin_spider
Application.kt 324B
music163
web
Music163Control.kt 634B
Music163Spider.kt 3KB
domain
Music163Entity.kt 285B
Music163Repository.kt 269B
libs
KRequest.kt 2KB
config
CorsConfig.kt 903B
LICENSE 1KB
out
production
kotlin_spider
banner.txt 426B
application.yaml 592B
test
kotlin_spider
logging.properties 82B
books.xml 679B
build.gradle 1KB
.idea
modules
kotlin_spider_test.iml 10KB
kotlin_spider.iml 726B
kotlin_spider_main.iml 10KB
libraries
Gradle__com_fasterxml_jackson_core_jackson_annotations_2_8_0.xml 619B
Gradle__com_huaban_jieba_analysis_1_0_2.xml 546B
Gradle__org_springframework_spring_aop_4_3_8_RELEASE.xml 593B
Gradle__ch_qos_logback_logback_classic_1_1_11.xml 567B
Gradle__org_jetbrains_kotlin_kotlin_stdlib_1_1_1.xml 571B
Gradle__org_apache_commons_commons_lang3_3_3_1.xml 565B
Gradle__org_springframework_spring_web_4_3_8_RELEASE.xml 593B
Gradle__org_springframework_boot_spring_boot_starter_logging_1_5_3_RELEASE.xml 693B
Gradle__org_springframework_boot_spring_boot_1_5_3_RELEASE.xml 612B
Gradle__org_hibernate_hibernate_validator_5_3_5_Final.xml 609B
Gradle__org_slf4j_log4j_over_slf4j_1_7_25.xml 558B
Gradle__org_jetbrains_annotations_13_0.xml 535B
Gradle__org_yaml_snakeyaml_1_17.xml 510B
Gradle__org_slf4j_jul_to_slf4j_1_7_25.xml 537B
Gradle__org_apache_tomcat_embed_tomcat_embed_el_8_5_14.xml 595B
Gradle__org_springframework_spring_beans_4_3_8_RELEASE.xml 603B
Gradle__org_springframework_boot_spring_boot_starter_1_5_3_RELEASE.xml 652B
Gradle__ch_qos_logback_logback_core_1_1_11.xml 552B
Gradle__com_fasterxml_classmate_1_3_3.xml 530B
Gradle__org_springframework_spring_expression_4_3_8_RELEASE.xml 627B
Gradle__org_apache_tomcat_embed_tomcat_embed_core_8_5_14.xml 605B
Gradle__com_fasterxml_jackson_core_jackson_databind_2_8_8.xml 604B
Gradle__org_slf4j_jcl_over_slf4j_1_7_25.xml 548B
Gradle__org_jetbrains_kotlin_kotlin_stdlib_jre7_1_1_1.xml 595B
Gradle__org_springframework_boot_spring_boot_starter_tomcat_1_5_3_RELEASE.xml 688B
Gradle__org_slf4j_slf4j_api_1_7_25.xml 523B
Gradle__org_springframework_boot_spring_boot_starter_web_1_5_3_RELEASE.xml 672B
Gradle__org_springframework_spring_core_4_3_8_RELEASE.xml 598B
Gradle__org_apache_tomcat_embed_tomcat_embed_websocket_8_5_14.xml 630B
Gradle__org_springframework_spring_context_4_3_8_RELEASE.xml 613B
Gradle__org_springframework_spring_webmvc_4_3_8_RELEASE.xml 608B
Gradle__javax_validation_validation_api_1_1_0_Final.xml 594B
Gradle__org_jetbrains_kotlin_kotlin_stdlib_jre8_1_1_1.xml 596B
Gradle__com_fasterxml_jackson_core_jackson_core_2_8_8.xml 584B
Gradle__org_jboss_logging_jboss_logging_3_3_1_Final.xml 592B
Gradle__org_springframework_boot_spring_boot_autoconfigure_1_5_3_RELEASE.xml 682B
vcs.xml 167B
workspace.xml 106KB
misc.xml 258B
compiler.xml 412B
modules.xml 632B
gradle.xml 748B
kotlinc.xml 232B
settings.gradle 36B
build
resources
test
books.xml 679B
main
banner.txt 434B
application.yaml 620B
kotlin-build
caches
version.txt 5B
.gitignore 296B
README.md 2KB
read.txt 14B
共 79 条
- 1
资源评论
枫蜜柚子茶
- 粉丝: 6143
- 资源: 4168
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功