为大模型微调过程中数据的产生,提供自动化脚本。 先对pdf或txt文本进行切分,使用langchain方法,在对切分后的文本使用大模型提取问答对。最终生成符合微调数据集格式的json文件。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~