`ipybd` 是一款由 `Python` 开发的中文生物多样性数据清洗、统计与分析框架。当前的 `ipybd` 版本实现了一个**通用**的生物多样性数据整合框架,它可以实现对不同来源、不同格式、不同品质、不同规范的数据集进行统一的**批量化**清洗转换与整合,进而大幅降低数据处理的门槛和成本,提高数据分析前的数据处理品质和效率。安装和使用说明请见[文档](https://ipybd.readthedocs.io)。
### 一、主要功能
目前 `ipybd` 已经具备了以下一些能力:
**数据装载**:目前支持从Excel/CSV/TEXT/JSON/Pandas.DataFrame 以及各类关系型数据库(比如Mysql)导入数据。
**物种学名**:能够对拉丁学名进行各种拆分和合并,并可以在线批量获取 [POWO](http://www.plantsoftheworldonline.org/),[IPNI](https://www.ipni.org/),[中国生物物种名录](http://www.sp2000.org.cn/),[Tropicos](https://www.tropicos.org) 上相应物种的最新分类阶元、分类处理、物种图片、发表文献、相关异名等信息。
**日期与时间**:可以对各类手工转录的日期和时间,进行严格的校验、清洗和转换,并可根据需要输出不同样式。
**经纬度**:可以对各类手工转录的经纬度,进行严格的清洗、校验和转换。
**中文行政区划**:可以对各种自然语言表达的中文县级及其以上的行政区划进行高品质的匹配、校正和转换。
**选值**:能够自定义各种字段的选值和转换关系,并根据转换关系,自动完成现有值的规范化。
**数值和数值区间**:可以对各类数值或数值区间,进行自动化的清洗、校正和转换。
**拆分与合并**:`ipybd` 可以对数据列进行各种合并和拆分,可以将单列、多列或整个表格的数据列映射为各类 Python `dict` `list` 对象或者 JSON `Object` 和 `Array`,从而为各种数据分析和互联网平台的数据交换工作提供灵活的格式转换支持。
**标签打印**:能够生成有条形码或者无条形码的标签文档以供打印。
**数据模型**:`ipybd` 定义了一套简洁的语义,可以帮助用户快速的定制出个性化的数据转换模型。这些模型能够根据相应任务的需要,将以上各种数据处理能力(或者用自定义的功能)自由拼接和组合,以实现数据集的自动化清洗和转换。
**数据输出**:经过处理的数据,支持输出为Excel/CSV文件或者直接更新到数据库。
没有合适的资源?快使用搜索试试~ 我知道了~
基于python的强大的生物多样性处理工具
共43个文件
py:15个
css:7个
mustache:7个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 176 浏览量
2023-12-18
09:05:43
上传
评论 1
收藏 144KB RAR 举报
温馨提示
中文生物多样性数据清洗、统计与分析框架,一个通用的生物多样性数据整合框架,它可以实现对不同来源、不同格式、不同品质、不同规范的数据集进行统一的批量化清洗转换与整合,进而大幅降低数据处理的门槛和成本,提高数据分析前的数据处理品质和效率。 数据装载:目前支持从Excel/CSV/TEXT/JSON/Pandas.DataFrame 以及各类关系型数据库(比如Mysql)导入数据。 物种学名:能够对拉丁学名进行各种拆分和合并,并可以在线批量获取 POWO,IPNI,中国生物物种名录,Tropicos 上相应物种的最新分类阶元、分类处理、物种图片、发表文献、相关异名等信息。 日期与时间:可以对各类手工转录的日期和时间,进行严格的校验、清洗和转换,并可根据需要输出不同样式。 经纬度:可以对各类手工转录的经纬度,进行严格的清洗、校验和转换。 中文行政区划:可以对各种自然语言表达的中文县级及其以上的行政区划进行高品质的匹配、校正和转换。 选值:能够自定义各种字段的选值和转换关系,并根据转换关系,自动完成现有值的规范化。 其他功能和详细使用方法见README
资源推荐
资源详情
资源评论
收起资源包目录
shengwu-master.rar (43个子文件)
setup.py 1KB
docs
LABEL.md 4KB
INSTALLATION.md 396B
FORMATDATASET.md 43KB
BIONAME.md 3KB
MODEL.md 26KB
index.md 4KB
requirements.txt 316B
test.py 8KB
README.md 3KB
mkdocs.yml 194B
ipybd
__init__.py 666B
table
model.py 6KB
terms.py 21KB
lib
std_fields_alias.json 35KB
occurence_test_data.json 3KB
personal_table_map.json 1KB
noi_occurrence_schema.py 11KB
chinese_admin_div.json 181KB
std_options_alias.json 29KB
core.py 64KB
function
cleaner.py 42KB
bioname.py 52KB
api_terms.py 2KB
label
bjm_cryptoflora.css 952B
plant.css 956B
cryptoflora_code.css 952B
bjm_cryptoflora.mustache 2KB
cryptoflora_code.mustache 2KB
bjm_plant.mustache 3KB
flora_code.mustache 3KB
bjm_painting.css 943B
plant_en.mustache 2KB
plant_en.css 701B
bjm_plant.css 931B
flora_code.css 929B
herb_label.py 456B
label_maker.py 9KB
plant.mustache 3KB
bjm_painting.mustache 1KB
occurrence
gbif.py 0B
noi.py 9KB
cvh.py 7KB
共 43 条
- 1
资源评论
十小大
- 粉丝: 9228
- 资源: 2552
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功