没有合适的资源?快使用搜索试试~
我知道了~
文库首页
行业研究
数据集
rg_dataset:研究小组-数据集
rg_dataset:研究小组-数据集
共54个文件
py:11个
xml:6个
ipynb:6个
JupyterNotebook
需积分: 9
0 下载量
20 浏览量
2021-04-21
01:41:16
上传
评论
收藏
13.19MB
ZIP
举报
温馨提示
立即下载
rg_dataset 研究小组-数据集
资源详情
资源评论
收起资源包目录
rg_dataset-main.zip
(54个子文件)
rg_dataset-main
.gitattributes
57B
notebooks
NSynth Data Exploration & Queries.ipynb
341KB
active_learning
pool_based_AL.py
5KB
test_active_learning.py
2KB
UnannotatedTestData
Data Exploration.ipynb
1015KB
looperman_unannotatedData.txt
71KB
.idea
misc.xml
192B
csv-plugin.xml
2KB
encodings.xml
135B
rg_dataset.iml
284B
inspectionProfiles
profiles_settings.xml
174B
modules.xml
272B
.gitignore
47B
vcs.xml
180B
doccano_data
project_2_dataset.jsonl
132B
project_1_dataset.jsonl
131B
Mar_1_Dataset.jsonl
132B
README.md
244B
split_data.py
1KB
LICENSE
1KB
reddit_data_preprocessing
data_preprocessing.py
5KB
processed_data.csv
366KB
README.md
38B
named_entity_recognition_model
ner_model.py
4KB
model1
vocab
vectors
128B
lookups.bin
14B
key2row
1B
strings.json
44KB
meta.json
459B
ner
cfg
354B
moves
221B
model
3.82MB
tokenizer
94KB
notebook
cleaned_reddit_spacy_ner.ipynb
23KB
cleaned_reddit_spacy_ner.py
5KB
uncleaned_reddit_spacy_ner.ipynb
26KB
spacy_model.py
4KB
ner_model.h5
1.18MB
spacy_model_class.py
9KB
data_tokenization.py
3KB
data_augmentation
outputs_back_trans_en-de-en.csv
3KB
01_textaug_trial.ipynb
6KB
commands_text.txt
1KB
02_commands_aug_nb.ipynb
4KB
outputs_nlpaug_command.csv
10KB
.gitignore
2KB
bash_scripts
download_nsynth_test.sh
653B
scraping
reddit
reddit.json
340KB
reddit_scraping.py
3KB
reddit.jsonl
340KB
TDPRI_unannotated testdata.txt
831KB
tdpri
tdpri.txt
11.87MB
tdpri.json
12.73MB
tdpri.py
7KB
共 54 条
1
评论
收藏
内容反馈
立即下载
评论0
去评论
最新资源
若到江南赶上春,千万和春住
python版学生管理系统:一键掌控,智能信息处理系统
菜日常菜日常菜日常菜日常
2000-2021年各地级市年末总人口数据.xls
基于多种编程语言的Jugg后台管理系统设计源码
java进销存管理系统(jsp+mssql).rar
tensorflow-2.9.3-cp310-cp310-win-amd64.whl
tensorflow-2.9.2-cp310-cp310-win-amd64.whl
2000-2021年各地级市普通高等学校在校学生数数据.xls
tensorflow-gpu-2.9.2-cp310-cp310-win-amd64.whl
菊次郎的回南天
粉丝: 41
资源:
4565
私信
上传资源 快速赚钱
前往需求广场,查看用户热搜
相关推荐
20_News_Groups_Dataset(20个新闻组数据集)
20_News_Groups_Dataset(20个新闻组数据集)
3星 · 编辑精心推荐
warwick_qu_dataset腺体数据集
MICCAI2015年腺体分割比赛数据集,其中包括165幅标定过的良性或恶性结肠癌的病理图像。癌症阶段为T3或T4。
rg_evaluation:研究小组-评估
rg_evaluation 研究小组-评估 PyMySQL的崩溃 您要在PyMySQL中使用的两个主要对象是1)数据库连接对象(脚本中的db )和2) cursor对象。 典型的工作流程如下所示: # set up the database connection db = pymysql.connect(...database info...) # pull out the cursor f
rg_production:研究小组-生产
rg_production 研究小组-生产 用法 为了运行该应用程序,请运行以下命令: git clone https://github.com/TheSoundOfAIOSR/rg_production cd App python Gui.py 该应用程序是使用Python 3.7开发的,为了运行它,请确保已安装所有依赖项。 注意:要使用ctcsound确保在系统上安装了 。 安装 CSo
IMU-Gesture-Recognition:加州大学伯克利分校小组研究的一部分。 我们正在开发算法并构建机器学习分类器,以使用来自不同运动传感器的数据检测手势
IMU-手势识别 加州大学伯克利分校小组研究的一部分。 我们正在开发算法并构建机器学习分类器,以使用来自不同运动传感器的数据来检测手势。
divar-create-adv-dataset-analysis:Divar是ebay之类的服务。 在这里,我正在研究愿意“添加广告”的用户数据集
分析有关“创建新Addvertisment”的“ Divar”数据集 Divar是ebay之类的服务。 在这里,我正在研究愿意“创建新广告”的用户数据集。 数据集包括一系列日志,这些日志在“创建新添加”面板上显示用户的每个操作。 例如他在哪一页(page_number)? 以及哪些表单域引发了错误,或者动作是什么(动作)? 我在尝试着 清理数据集 识别日志顺序属于一个用途 创建用户操作事实 创建
Folded-Hamiltonian-Monte-Carlo:实施折叠折叠的哈密顿量蒙特卡罗方法,用于数据插补和从加利福尼亚护理大学学院的研究小组从癌症患者收集的数据中补充数据,这些患者在化疗期间自我报告了自己的症状经历
折叠式哈密尔顿-蒙特卡洛 实施折叠折叠的哈密顿蒙特卡洛方法,以进行数据插补和对从癌症患者收集的数据进行补充,这些癌症患者是由加利福尼亚大学护理学院的一个研究小组在化疗期间自我报告症状经历的。 要访问该论文,请访问: : 。 要访问完整的数据集,请联系= chris [miaskowski] ucsf [edu] 有关代码和实现细节的任何疑问或疑问,请随时通过以下网址给我发送电子邮件:no
GCI_Dataset_2006-2007--2017-2018.xlsx
GCI_Dataset_2006-2007--2017-2018.xlsx
Synthetic_Chinese_String_Dataset 中文识别数据集44
Synthetic_Chinese_String_Dataset 中文识别数据集 1 for https://gitee.com/chenyang918/Lets_OCR
Synthetic_Chinese_String_Dataset 中文识别数据集
Synthetic_Chinese_String_Dataset 中文识别数据集 1 for https://gitee.com/chenyang918/Lets_OCR
SfogliaFilm:GDG 研究小组的教学项目。 用于获取即将上映的电影或热门电视节目的最新更新的 Android 应用程序(数据由 TMDb 提供)。 本产品使用 TMDb API,但未经 TMDb 认可或认证
斯福利亚电影公司 GDG 研究小组的教学项目。 用于获取即将上映的电影或热门电视节目的最新更新的 Android 应用程序(数据由 TMDb 提供)。
AI_ML-MovieLens-Data-Analysis:GroupLens研究项目是明尼苏达大学计算机科学与工程系的一个研究小组。 数据被广泛用于协作过滤和其他过滤解决方案
Project - Movie Lens Data Analysis GroupLens研究项目是明尼苏达大学计算机科学与工程系的一个研究小组。 该数据被广泛用于协作过滤和其他过滤解决方案。 但是,我们将使用此数据作为演示使用Python“播放”数据的方法。 Objective: 实施作为课程一部分学习的技术。 Datasets Information: rating.csv:包含有关用户对
Domain-Adaptation:这是一些纽约大学数据科学研究人员和IBM NLP研究小组之间的2021年Spring合作项目
领域适应 这是2021年Spring,一些纽约大学数据科学系的学生与IBM NLP研究小组之间的合作项目。 使用同域标记的数据来提高问题解答中预先训练的语言模型的性能 Aditya Singhal,David Shimshoni,Alex Sheng,Avi Sil,Sara Rosenthal 动机 成功完成一项任务的微调可能需要成千上万个金标准数据输入,这可能需要花费数年的时间来收集,或者可能
ffhqr-dataset:FFHQR——第一个用于计算机视觉研究的大规模修饰数据集
Flickr-Faces-HQ-Retouching (FFHQR) 数据集 Flickr-Faces-HQ-Retouching (FFHQR) 是一个高质量的人脸修饰图像数据集。 该数据集作为以下论文的一部分发布: AutoRetouch:自动专业面部修饰Alireza Shafaei ( ), James J. Little (UBC), Mark Schmidt (UBC) 2021
亚马逊:为墨尔本大学PHD研究小组完成的数据提取项目。 根据客户要求从3个平台提取数据的地方-亚马逊,Instagram和Flickr
亚马逊:为墨尔本大学PHD研究小组完成的数据提取项目。 根据客户要求从3个平台提取数据的地方-亚马逊,Instagram和Flickr
Python库 | meteoblue_dataset_sdk-0.0.14-py3-none-any.whl
python库。 资源全名:meteoblue_dataset_sdk-0.0.14-py3-none-any.whl
Python库 | rgmining_synthetic_dataset-0.9.1-py2-none-any.whl
python库。资源全名:rgmining_synthetic_dataset-0.9.1-py2-none-any.whl
Synthetic_Chinese_String_Dataset 中文识别数据集 26
Synthetic_Chinese_String_Dataset 中文识别数据集 1 for https://gitee.com/chenyang918/Lets_OCR
Python库 | mlmd_dataset_management-0.5.0-py3-none-any.whl
python库,解压后可用。 资源全名:mlmd_dataset_management-0.5.0-py3-none-any.whl
PyPI 官网下载 | mlmd_dataset_management-0.5.0-py3-none-any.whl
资源来自pypi官网。 资源全名:mlmd_dataset_management-0.5.0-py3-none-any.whl
LiquefactionInventory:这是我收集的塔夫茨地质灾害研究小组的全球地理空间液化模型(GGLM)数据的清单
LiquefactionInventory:这是我收集的塔夫茨地质灾害研究小组的全球地理空间液化模型(GGLM)数据的清单
chips_thermal_face_dataset:芯片热敏面数据集是一个大规模的热敏面数据集(来自3个不同大洲的1200幅男性和女性图像,年龄在18-23岁之间)。 该数据集将可供全世界的研究人员使用最新的深度学习方法创建准确的热面部分类和热面部识别系统
芯片散热面数据集 热图像; 8名参与者; 总计超过1,200张图像 芯片热敏面数据集是一个大规模的热敏面数据集(来自3个不同大洲的1200幅男性和女性图像,年龄在18-23岁之间)。 该数据集将可供全球范围的研究人员使用最新的深度学习方法创建准确的面部热分类和面部热识别系统。 资源 使用FLIR Lepton 3.5热成像相机捕获图像。 影像变化 图像以多种方式变化: [拍摄位置]照片是在房屋周
rg_sound_generation:研究小组-声音产生
研究小组-声音产生 这是我们在组内创建或分叉的所有各种脚本和工具的仓库。 标题 描述 关联 NSynth吉他统计 NSynth数据集的吉他子集的基本统计 创建吉他子集 提取NSynth数据集的吉他子集 音频注释器 标记或标记音频样本的工具 培训DDSP 训练DDSP的脚本 预处理下载 NSynth吉他子集以tfrecord格式预处理 从预处理数据集开始训练DDSP 从预处理数据集开始训练DD
gpt-2-output-dataset:GPT-2输出的数据集,用于研究检测,偏差等
gpt-2-输出数据集 该数据集包含: WebText测试集中的250K文档 对于每个GPT-2模型(在WebText训练集上进行训练),使用Top-K 40截断生成250K随机样本(温度1,无截断)和250K样本 我们期待使用此数据进行的研究! 下载 对于每个模型,我们都有250K个生成示例的训练拆分,以及5K个示例的验证和测试拆分。 所有数据都位于Google Cloud Storage的
5星 · 资源好评率100%
rg_speech_to_text:研究小组致辞全文
rg_speech_to_text 研究小组致辞全文 在适合通用代码库之前,该存储库将用于试验/测试新方法。 安装 环境准备 通过pip安装 下载并安装python(推荐3.8) 使用python -m venv env_name创建虚拟环境 启用创建的环境env_path\Scripts\activate 使用python -m pip install --upgrade pip setu
titanic_dataset.csv(泰坦尼克数据集)
The titanic dataset gives the values of four categorical attributes for each of the 2201 people on board the Titanic when it struck an iceberg and sank. The attributes are social class (first class, .
4星 · 用户满意度95%
Synthetic_Chinese_String_Dataset 中文识别数据集 50
Synthetic_Chinese_String_Dataset 中文识别数据集 1 for https://gitee.com/chenyang918/Lets_OCR
Python库 | image_dataset_viz-0.2.2-py2.py3-none-any.whl
资源分类:Python库 所属语言:Python 使用前提:需要解压 资源全名:image_dataset_viz-0.2.2-py2.py3-none-any.whl 资源来源:官方 安装方法:https://lanzao.blog.csdn.net/article/details/101784059
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0
最新资源