基于GPT完成数据标注、分类、润色等工作，原理是多线程批量处理input的数据，经过GPT处理后输出output数据资源-CSDN文库

共37个文件

csv：18个

py：8个

xml：3个

版权申诉

18 浏览量 2024-05-11 21:07:51 上传评论收藏 12.95MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

package

项目简介：本项目基于GPT完成数据标注、分类、润色等工作，原理是多线程批量处理input的数据，经过GPT处理后输出output数据。.zip （37个子文件）

folder

content

folder

data

folder

input

secfields_3237_0801.csv 2.54MB

folder

output

XDR-FAQ-20230717-polish.csv 272KB

history-1500-out.csv 3.75MB

the-out.csv 54KB

qianliu_test_data_102-out.csv 553KB

event_analyze_test_out.csv 5KB

secfields_3237_0801_output.csv 6KB

classify_test_out.csv 857B

XXDR-Alert-polish.csv 2.28MB

folder

old

params_result.csv 92.05MB

history-1500.csv 1.58MB

the.csv 572KB

XDR-FAQ-20230717.csv 140KB

qianliu_test_data_102.csv 57KB

params_origin.csv 57.04MB

the.xlsx 104KB

XDR-Alert.csv 1.12MB

folder

test

security_encyclopedia_polish_test2.jsonl 9.87MB

classify_test.csv 80KB

event_analyze_test.csv 278KB

security_encyclopedia_polish_test1.jsonl 2.9MB

config.ini 0B

folder

api

gpt.py 2KB

key.py 786B

folder

utils

file.py 556B

config.py 422B

folder

.idea

.name 9B

misc.xml 186B

folder

inspectionProfiles

profiles_settings.xml 174B

gpt-tools.iml 284B

modules.xml 272B

.gitignore 176B

run.py 3KB

folder

server

classify_server.py 7KB

polish_server.py 6KB

pronoun_server.py 4KB

README.md 918B

# GPT Tools 项目简介：本项目基于GPT完成数据标注、分类、润色等工作，原理是多线程批量处理input的数据，经过GPT处理后输出output数据。 ## 如何使用 1. 明确输入输出文件在config.ini中编辑input和output ```ini [data] input=/data/test/classify_test.csv output=/data/output/classify_test_out.csv ``` 2. 修改任务server 不同的任务有不同的处理逻辑，本项目当前支持润色和分类两大类任务，业务逻辑和prompt详见/server文件夹执行前请选择正确的run.py中的server ```python # 修改server源 import server.classify_server as server_pool if __name__ == "__main__": # 不同的任务切换不同的server即可 server = server_pool.classifyServer() ``` 3. 执行run.py ```bash python run.py ``` 4. 检查结果结果按照config.ini的output输出，运行完毕后请检查output是否正确生成

内容反馈

版权申诉

生瓜蛋子

粉丝: 3823
资源: 5216

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip