什么是AudioNotes?
AudioNotes 是一款功能强大的AI音频转文字工具,不仅能够将音视频内容快速转化为文字,还能生成结构化笔记,极大地提升了信息处理效率。它基于FunASR和Qwen2技术,支持高精度语音识别和内容整理,特别适合在会议记录、课程总结、采访记录等情境下使用。AudioNotes的灵活部署方式让用户可以选择最适合的方案使用该工具,满足多样化的需求。
详细介绍:
AudioNotes 是一款集成了最新AI技术的音频转文字工具,基于FunASR和Qwen2系统构建,专门用于将音视频内容高效转化为结构化文本笔记。它的核心功能依托于先进的自动语音识别(ASR)技术,能精确提取音视频中的文字内容,并通过大模型的智能整理,将复杂的音视频信息加工成清晰、易读的Markdown笔记,便于用户快速阅读和后续参考。同时,AudioNotes支持交互式对话功能,用户可以通过对话获取音视频的更多细节,进一步挖掘信息价值。部署方面,AudioNotes提供Docker和本地两种方式,便于灵活设置并确保信息安全。
AudioNotes如何使用?
① 安装 Ollama
下载对应系统的 Ollama 安装包进行安装
https://ollama.com/download
② 拉取模型
以 阿里的千问2 7b 为例:https://ollama.com/library/qwen2
ollama pull qwen2:7b
③ 部署服务
有两种部署方式,一种是使用 Docker 部署,另一种是本地部署
Docker部署(推荐)🐳
curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml
docker-compose up
docker 启动后,访问 http://localhost:15433/
登录账号为 admin,密码为 admin (可以在 docker-compose.yml 文件里面修改)
本地部署 📦
需要有可访问的 postgresql 数据库
conda create -n AudioNotes python=3.10 -y
conda activate AudioNotes
git clone https://github.com/harry0703/AudioNotes.git
cd AudioNotes
pip install -r requirements.txt
将 .env.example 重命名为 .env,修改相关配置信息
chainlit run main.py
服务启动后,访问 http://localhost:8000/
登录账号为 admin,密码为 admin (可以在 .env 文件里面修改)