开源免费的AI音频转文字工具：AudioNotes

开源项目1年前 (2024)更新孤城孤刀

什么是AudioNotes？

AudioNotes 是一款功能强大的AI音频转文字工具，不仅能够将音视频内容快速转化为文字，还能生成结构化笔记，极大地提升了信息处理效率。它基于FunASR和Qwen2技术，支持高精度语音识别和内容整理，特别适合在会议记录、课程总结、采访记录等情境下使用。AudioNotes的灵活部署方式让用户可以选择最适合的方案使用该工具，满足多样化的需求。

详细介绍：

AudioNotes 是一款集成了最新AI技术的音频转文字工具，基于FunASR和Qwen2系统构建，专门用于将音视频内容高效转化为结构化文本笔记。它的核心功能依托于先进的自动语音识别（ASR）技术，能精确提取音视频中的文字内容，并通过大模型的智能整理，将复杂的音视频信息加工成清晰、易读的Markdown笔记，便于用户快速阅读和后续参考。同时，AudioNotes支持交互式对话功能，用户可以通过对话获取音视频的更多细节，进一步挖掘信息价值。部署方面，AudioNotes提供Docker和本地两种方式，便于灵活设置并确保信息安全。

AudioNotes如何使用？

① 安装 Ollama

下载对应系统的 Ollama 安装包进行安装

https://ollama.com/download

② 拉取模型

以阿里的千问2 7b 为例：https://ollama.com/library/qwen2

ollama pull qwen2:7b

③ 部署服务

有两种部署方式，一种是使用 Docker 部署，另一种是本地部署

Docker部署（推荐）🐳

curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml
docker-compose up

docker 启动后，访问 http://localhost:15433/

登录账号为 admin，密码为 admin （可以在 docker-compose.yml 文件里面修改）

本地部署 📦

需要有可访问的 postgresql 数据库

conda create -n AudioNotes python=3.10 -y
conda activate AudioNotes
git clone https://github.com/harry0703/AudioNotes.git
cd AudioNotes
pip install -r requirements.txt

将 .env.example 重命名为 .env，修改相关配置信息

chainlit run main.py

服务启动后，访问 http://localhost:8000/

登录账号为 admin，密码为 admin （可以在 .env 文件里面修改）

# 开源项目