没有合适的资源？快使用搜索试试~ 我知道了~

文库首页行业研究数据集rg_dataset:研究小组-数据集

rg_dataset:研究小组-数据集

共54个文件

py：11个

xml：6个

ipynb：6个

JupyterNotebook

需积分: 9 0 下载量 20 浏览量 2021-04-21 01:41:16 上传评论收藏 13.19MB ZIP 举报

温馨提示

rg_dataset 研究小组-数据集

资源详情

资源评论

收起资源包目录

rg_dataset-main.zip （54个子文件）

rg_dataset-main

.gitattributes 57B

notebooks

NSynth Data Exploration & Queries.ipynb 341KB

active_learning

pool_based_AL.py 5KB

test_active_learning.py 2KB

UnannotatedTestData

Data Exploration.ipynb 1015KB

looperman_unannotatedData.txt 71KB

.idea

misc.xml 192B

csv-plugin.xml 2KB

encodings.xml 135B

rg_dataset.iml 284B

inspectionProfiles

profiles_settings.xml 174B

modules.xml 272B

.gitignore 47B

vcs.xml 180B

doccano_data

project_2_dataset.jsonl 132B

project_1_dataset.jsonl 131B

Mar_1_Dataset.jsonl 132B

README.md 244B

split_data.py 1KB

LICENSE 1KB

reddit_data_preprocessing

data_preprocessing.py 5KB

processed_data.csv 366KB

README.md 38B

named_entity_recognition_model

ner_model.py 4KB

model1

vocab

vectors 128B

lookups.bin 14B

key2row 1B

strings.json 44KB

meta.json 459B

ner

cfg 354B

moves 221B

model 3.82MB

tokenizer 94KB

notebook

cleaned_reddit_spacy_ner.ipynb 23KB

cleaned_reddit_spacy_ner.py 5KB

uncleaned_reddit_spacy_ner.ipynb 26KB

spacy_model.py 4KB

ner_model.h5 1.18MB

spacy_model_class.py 9KB

data_tokenization.py 3KB

data_augmentation

outputs_back_trans_en-de-en.csv 3KB

01_textaug_trial.ipynb 6KB

commands_text.txt 1KB

02_commands_aug_nb.ipynb 4KB

outputs_nlpaug_command.csv 10KB

.gitignore 2KB

bash_scripts

download_nsynth_test.sh 653B

scraping

reddit.json 340KB

reddit_scraping.py 3KB

reddit.jsonl 340KB

TDPRI_unannotated testdata.txt 831KB

tdpri

tdpri.txt 11.87MB

tdpri.json 12.73MB

tdpri.py 7KB

共 54 条

评论收藏

内容反馈

最新资源

若到江南赶上春，千万和春住
python版学生管理系统：一键掌控，智能信息处理系统
菜日常菜日常菜日常菜日常
2000-2021年各地级市年末总人口数据.xls
基于多种编程语言的Jugg后台管理系统设计源码
java进销存管理系统（jsp+mssql）.rar
tensorflow-2.9.3-cp310-cp310-win-amd64.whl
tensorflow-2.9.2-cp310-cp310-win-amd64.whl
2000-2021年各地级市普通高等学校在校学生数数据.xls
tensorflow-gpu-2.9.2-cp310-cp310-win-amd64.whl

菊次郎的回南天

粉丝: 41
资源: 4565

上传资源快速赚钱

前往需求广场，查看用户热搜

rg_dataset:研究小组-数据集

评论0

最新资源

相关推荐

20_News_Groups_Dataset(20个新闻组数据集)

warwick_qu_dataset腺体数据集

rg_evaluation:研究小组-评估

rg_production:研究小组-生产

IMU-Gesture-Recognition:加州大学伯克利分校小组研究的一部分。 我们正在开发算法并构建机器学习分类器，以使用来自不同运动传感器的数据检测手势

divar-create-adv-dataset-analysis:Divar是ebay之类的服务。 在这里，我正在研究愿意“添加广告”的用户数据集

Folded-Hamiltonian-Monte-Carlo:实施折叠折叠的哈密顿量蒙特卡罗方法，用于数据插补和从加利福尼亚护理大学学院的研究小组从癌症患者收集的数据中补充数据，这些患者在化疗期间自我报告了自己的症状经历

GCI_Dataset_2006－2007－－2017－2018.xlsx

Synthetic_Chinese_String_Dataset 中文识别数据集44

Synthetic_Chinese_String_Dataset 中文识别数据集

SfogliaFilm:GDG 研究小组的教学项目。 用于获取即将上映的电影或热门电视节目的最新更新的 Android 应用程序（数据由 TMDb 提供）。 本产品使用 TMDb API，但未经 TMDb 认可或认证

AI_ML-MovieLens-Data-Analysis:GroupLens研究项目是明尼苏达大学计算机科学与工程系的一个研究小组。 数据被广泛用于协作过滤和其他过滤解决方案

Domain-Adaptation:这是一些纽约大学数据科学研究人员和IBM NLP研究小组之间的2021年Spring合作项目

ffhqr-dataset:FFHQR——第一个用于计算机视觉研究的大规模修饰数据集

亚马逊：为墨尔本大学PHD研究小组完成的数据提取项目。 根据客户要求从3个平台提取数据的地方-亚马逊，Instagram和Flickr

Python库 | meteoblue_dataset_sdk-0.0.14-py3-none-any.whl

Python库 | rgmining_synthetic_dataset-0.9.1-py2-none-any.whl

Synthetic_Chinese_String_Dataset 中文识别数据集 26

Python库 | mlmd_dataset_management-0.5.0-py3-none-any.whl

PyPI 官网下载 | mlmd_dataset_management-0.5.0-py3-none-any.whl

LiquefactionInventory:这是我收集的塔夫茨地质灾害研究小组的全球地理空间液化模型（GGLM）数据的清单

rg_sound_generation:研究小组-声音产生

gpt-2-output-dataset:GPT-2输出的数据集，用于研究检测，偏差等

rg_speech_to_text:研究小组致辞全文

titanic_dataset.csv（泰坦尼克数据集）

Synthetic_Chinese_String_Dataset 中文识别数据集 50

Python库 | image_dataset_viz-0.2.2-py2.py3-none-any.whl

IMU-Gesture-Recognition:加州大学伯克利分校小组研究的一部分。我们正在开发算法并构建机器学习分类器，以使用来自不同运动传感器的数据检测手势

divar-create-adv-dataset-analysis:Divar是ebay之类的服务。在这里，我正在研究愿意“添加广告”的用户数据集

SfogliaFilm:GDG 研究小组的教学项目。用于获取即将上映的电影或热门电视节目的最新更新的 Android 应用程序（数据由 TMDb 提供）。本产品使用 TMDb API，但未经 TMDb 认可或认证

AI_ML-MovieLens-Data-Analysis:GroupLens研究项目是明尼苏达大学计算机科学与工程系的一个研究小组。数据被广泛用于协作过滤和其他过滤解决方案

亚马逊：为墨尔本大学PHD研究小组完成的数据提取项目。根据客户要求从3个平台提取数据的地方-亚马逊，Instagram和Flickr