# JustForVoiceToText
基于LocalAI、简易的语音转文字工具,平时可以拿来转转办公语音用。项目使用了模型、客户端分离模式,无需Python本地再加载模型。
**👍Whisper一直神一般的存在!**
## 使用说明
⚠️本项目基于Python3.10.11,其他版本请自行测试。
### 模型部署阶段
1.[Docker部署本地模型服务](https://localai.io/docs/getting-started/run-other-models/)
`docker run -ti -p 8080:8080 localai/localai:v2.11.0-ffmpeg-core whisper-base`
**模型建议whisper-small起步,请根据机器配置具体分配**
2.[测试本地模型接口](https://localai.io/features/audio-to-text/)
`curl http://localhost:8080/v1/audio/transcriptions -H "Content-Type: multipart/form-data" -F file="@$PWD/gb1.ogg" -F model="whisper-1"`
**前两步摘自官方文档,点击小标题可跳转**
### 代码调试阶段
3.运行`pip install -r requirements.txt`安装依赖
4.参照`config/config.json.template`模版的说明,修改源代码目录下`config/config.json`文件,将`client_url`和`model_name`修改为上述实际的接口地址和模型名称
5.运行`pyinstaller main.spec`可打包为Windows下的EXE可执行程序,`main_mac.spec`对应MacOS下可执行程序
### 已知问题
MacOS下界面显示异常,后续修复。
基于LocalAI、简易的语音转文字工具(python)
版权申诉
183 浏览量
2024-03-29
09:27:50
上传
评论
收藏 9KB ZIP 举报
十小大
- 粉丝: 9158
- 资源: 2553
最新资源
- 2022NOC软件创意编程赛项真题python小学高年级-决赛(有解析)
- mathml转换latex需要的xsl文件
- 2022NOC软件创意编程赛项真题图形化小学高年级-决赛赛(有解析)
- gbase驱动下载gbase-connector-java-8.3.81.53驱动下载
- 2022NOC软件创意编程赛项真题图形化小学低年级-决赛赛(有解析)
- InsightFace从青铜到王者,超大规模人脸识别的优雅解法
- python后端开发spider框架详解
- 基于 STM32 与 ESP8266 的智能家居系统源码.zip
- 毕业设计:基于SSM的mysql-个性化点餐配送系统(源码 + 数据库 + 说明文档)
- 基于matlab的鱼苗计数识别(GUI界面).zip代码57
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈