没有合适的资源?快使用搜索试试~ 我知道了~
POI名称生成赛题-Cicero_Ning-说明论文1
需积分: 0 1 下载量 149 浏览量
2022-08-04
15:01:39
上传
评论
收藏 714KB PDF 举报
温馨提示
试读
4页
摘要本次《POI 名称生成》赛题要求是“给定图像和挂牌检测结果和 OCR 识别结果设计算法,生成图像中包含的完整分析数据集得知,比赛数据集来自高德地图的真实应用
资源详情
资源评论
资源推荐
POI 名称生成
Cicero_Ning
宁星星
认知智能实验室&算法工程师
Percent
中国-武汉
shenzaimin0@gmail.com
镇诗奇
认知智能实验室&算法工程师
Percent
中国-武汉
13476111882@163.com
团队简介
队伍成员来自百分点认知智能实验室。
队长:宁星星
毕业于华中科技大学,热爱探索、乐于分享且擅长解决
实际问题。
技术方向:语义解析、机器问答以及文本校对算法等。
多次在 CCKS、NLPCC 等会议评测算法大赛中获奖。
队员:镇诗奇
中国地质大学(武汉)计算机硕士
技术方向:智能问答、语义解析和关系抽取等,曾获得
CCKS2021 图谱问答第三名和国家电网运行信息智能检索
Text2SQL 比赛三等奖。
摘要
本次《POI 名称生成》赛题要求是“给定图像和挂牌检
测结果和 OCR 识别结果设计算法,生成图像中包含的完整
POI 名称”。
分析数据集得知,比赛数据集来自高德地图的真实应用
场景数据,训练集包含 2.1W 条 POI 信息,每条都包涵原始
图片、OCR 识别文本以及挂牌和文本行的轮廓数据。怎样利
用从这些不同形式的数据信息中获取真正有用的信息,成为
了完成比赛任务的关键。
本次比 赛 我 们采用结 合图像位 置 信 息和文本 信 息 的
text2text 生成算法。文本生成模型采用端到端的 Text2Text
预训练模型 T5 框架,在解码过程中,采用 sampling 解码策
略。在后处理时,基于原始 block 的 OCR 识别结果进行匹
配校正,得到最终 poi name 。
最终我们在 A 榜得分 0.7224,B 榜得分 0.7158,获得
第五名的成绩
关键词
POI,文本生成,OCR,sampling
1 赛题分析
本赛题属于文本生成领域,即将非语言形式信息作为输
入,生成可读的文字表述。文本生成任务大致可分为三类:
文本到文本的生成、数据到文本的生成、图像到文本的生成。
文本生成技术发展至今,已经有诸多相关的解决方案和学术
研究,例如,基于规则、基于规划(Planning-based)以及
数据驱动(data-driven)的方法等。
图 1:训练集与测试集在 block num 上的分布
ali-12
- 粉丝: 28
- 资源: 328
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0