##阿里大规模图像搜索大赛
###赛题简介
阿里巴巴集团经过多年实践,积累了海量及多样的图像数据;在移动互联网的时代,如何通过图片(尤其是实拍图片)搜索并访问到背后的服务,是非常有挑战和意义的事情。 本次“阿里大规模图像搜索大赛”的目标就是提供一个平台和环境,使参赛选手基于此,找到准确且快速的图片搜索方法,公开客观的衡量方法的效果,并推动这些方法在智能购物、知识获取、推荐关联等各个领域的线上应用。
赛题:给定query集,从海量图像中检索最相同或相似的Top20图像。
- [官方链接](http://tianchi.aliyun.com/competition/introduction.htm?spm=5176.100066.333.14.UWexgq&raceId=231510)
###比赛总结
当初师兄看到这个比赛,心血来潮,说要参赛,用CNN玩一玩,然后我就报名了。我没做过图像搜索相关的项目,所以一直等着师兄来教我...等着等着,初赛都快截止了,师兄跑去澳洲开会了(额...师兄坑我
既然报了名,就搞一搞吧。
搜了几篇博客看了看,大概了解了一下图像搜索的流程:
- 首先,需要找到一种方法对图像进行描述,这样的方法其实有很多了,传统的像[感知哈希算法](http://www.ruanyifeng.com/blog/2011/07/principle_of_similar_image_search.html)、[颜色分布法、内容特征法](http://www.ruanyifeng.com/blog/2013/03/similar_image_search_part_ii.html),这几种算法比较简单,我没有去尝试,因为我看了这个比赛的数据,场景相对比较复杂,感觉这些方法不会很work,加上我没有什么时间去探索(也不想花太多时间去探索)。我转而使用OpenCV里面的特征描述和匹配算法,主要是SIFT,有兴趣的读者可以看看这里:[Feature Detection and Description](http://opencv-python-tutroals.readthedocs.org/en/latest/py_tutorials/py_feature2d/py_table_of_contents_feature2d/py_table_of_contents_feature2d.html)。得到了图像的SIFT特征之后,自然就可以衡量两幅图像之间的相似度了。
- 接下来,需要对检索全集提取SIFT特征,然后“离线”保存下来。那么新来一张query图,我只需要计算这张新图的特征,与检索数据库里面的所有图片一一比较,找出最相似的Top20张图片。这种方法可行,但是很明显,计算量太大了,实际业务中肯定也不是这么干的。用过Google搜图的同学就清楚,它的响应时间非常短,这背后想必有一套建立快速索引的方法,将相似的特征映射到相邻的存储空间,像局部敏感哈希算法此类的。(羞愧,我为了偷懒,直接跟检索全集一一去比较了,最后也只提交了200多张的检索结果,得分没垫底...
- 看一下SIFT特征的匹配效果,以及比较好的检索结果:
![](https://github.com/wepe/AliTianChi/blob/master/%E9%98%BF%E9%87%8C%E5%A4%A7%E8%A7%84%E6%A8%A1%E5%9B%BE%E5%83%8F%E6%90%9C%E7%B4%A2%E5%A4%A7%E8%B5%9B/siftmatch.png)
![](https://github.com/wepe/AliTianChi/blob/master/%E9%98%BF%E9%87%8C%E5%A4%A7%E8%A7%84%E6%A8%A1%E5%9B%BE%E5%83%8F%E6%90%9C%E7%B4%A2%E5%A4%A7%E8%B5%9B/search_result.png)
没有合适的资源?快使用搜索试试~ 我知道了~
阿里天池算法_新浪微博互动预测-挑战baseline,天池新浪微博预测
共78个文件
sql:29个
png:19个
py:17个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
5星 · 超过95%的资源 40 下载量 135 浏览量
2021-06-05
23:41:07
上传
评论 4
收藏 1.32MB RAR 举报
温馨提示
阿里大规模图像搜索大赛 阿里移动推荐算法 新浪微博互动预测大赛 代码
资源推荐
资源详情
资源评论
收起资源包目录
1034873.rar (78个子文件)
阿里天池AliTianChi-master
阿里大规模图像搜索大赛
imgsearch.py 5KB
search_result.png 815KB
bfmatch.py 5KB
README.md 3KB
siftmatch.png 194KB
新浪微博互动预测大赛
Season1
trick
predict_with_fixed_value.py 4KB
runTime.py 302B
genUidStat.py 1KB
evaluation.py 906B
predict_by_search.py 5KB
README.md 326B
plot
figure_4.png 21KB
figure_8.png 24KB
plot.py 1KB
figure_14.png 21KB
figure_16.png 20KB
figure_12.png 20KB
figure_11.png 22KB
figure_2.png 26KB
figure_17.png 20KB
figure_5.png 24KB
figure_13.png 22KB
figure_1.png 27KB
figure_6.png 23KB
figure_18.png 20KB
figure_9.png 25KB
figure_7.png 22KB
figure_3.png 24KB
figure_15.png 24KB
阿里移动推荐算法
Season1
preprocess
gen_uid_iid.py 2KB
gen_iid_geohash_category.py 712B
split_by_date.py 1KB
gen_iid_feature.py 1KB
split_by_user.py 1KB
gen_uid_feature.py 1019B
data_preprocess.py 2KB
data
readme 115B
model
README.md 156B
rule
gen_submission_by_rule.py 989B
gen_submission_by_rule1.py 1KB
statistics
README.md 132B
record 4KB
hourbuy 22KB
README.md 3KB
Season2
preprocess
gen_18_gou_mai.sql 613B
gen_18_jia_gou_wu_che.sql 656B
gen_16_gou_mai.sql 613B
check_file.sql 427B
gen_16_jia_gou_wu_che.sql 656B
地理位置 513B
rule
rule4.sql 612B
rule1.sql 1002B
rule6.sql 579B
rule2.sql 360B
rule 2KB
rule3.sql 2KB
rule5.sql 612B
rule7.sql 363B
rule8.sql 2KB
ensemble
averaging.sql 1KB
validation.sql 4KB
statistic
everbuy_jgwc2.sql 371B
everbuy_jgwc1.sql 805B
hour_jiagwc_buy.sql 1KB
zgl 237B
2daybuy 889B
user_jgwc.sql 260B
hourbuy.sql 554B
FeatureExtraction
fe18.sql 24KB
fuse18.sql 3KB
fuse16.sql 4KB
fe17.sql 45KB
fuse17 8KB
stack_17.sql 4KB
fe16.sql 2KB
stack_16.sql 6KB
stack_18.sql 4KB
label.sql 268B
新建文件夹
共 78 条
- 1
qq_41934573
- 粉丝: 159
- 资源: 459
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
- 3
- 4
- 5
- 6
前往页