Autiobooks
扫码查看

将.epub电子书转换为.m4b有声读物

Autiobooks

综合介绍

Autiobooks 是一个开源软件工具,它的核心功能是将.epub格式的电子书文件自动转换为.m4b格式的有声读物。该工具借助一个名为Kokoro的开源文本转语音(TTS)模型。Kokoro模型参数量达到8200万,能够在个人电脑硬件上运行,并生成听感自然的语音。Autiobooks通过图形用户界面(GUI)操作,用户可以选择电子书文件,指定输出目录,并选择书中的特定章节进行转换。软件会将每个章节处理成独立的.wav音频文件,最后将它们合并为一个完整的.m4b有声书文件。这种文件格式兼容多数有声书播放器,并能保留章节结构。目前,该工具仅支持处理英文内容的电子书。

功能列表

  • 电子书转有声书: 自动将.epub格式的电子书文件转换为.m4b格式的有声读物。
  • 高质量语音合成: 使用名为Kokoro的开源文本转语音模型,可以生成自然流畅的英文朗读语音。
  • 图形用户界面: 提供一个直观的图形界面,用户可以方便地选择文件、设置输出位置和勾选需要转换的章节。
  • 章节选择: 用户可以在界面中看到电子书的所有章节列表,并自由选择想要转换成语音的具体章节。
  • 章节化音频: 生成的.m4b文件保留了原始电子书的章节结构,方便在播放器中按章节跳转。
  • 跨平台运行: 需要Python环境,可以在Linux和MacOS系统上运行。
  • 开源免费: 项目基于MIT许可证开源,用户可以免费使用和修改。

使用帮助

Autiobooks提供了一个带图形界面的程序,让用户可以轻松地将英文电子书转换成有声书。以下是详细的安装和使用流程。

安装流程

在安装Autiobooks之前,你需要先在电脑上准备好一些必要的软件和环境。

1. 安装依赖软件

Autiobooks的运行依赖ffmpegtkinter这两个工具。ffmpeg用于处理音频文件,tkinter用于显示图形界面。

  • 在Linux系统上 (以Debian/Ubuntu为例):打开终端,然后输入并执行以下命令来安装ffmpegpython3-tkinter
    sudo apt install ffmpeg python3-tkinter
    
  • 在MacOS系统上:如果你使用Mac电脑,推荐使用Homebrew包管理器来安装依赖。打开“终端”应用,输入并执行以下命令。
    brew install ffmpeg python-tk
    
  • 推荐安装 (espeak-ng):为了更好地处理电子书中的非常见词汇或专有名词,建议额外安装espeak-ng
    # Linux (Debian/Ubuntu)
    sudo apt install espeak-ng
    # MacOS
    brew install espeak-ng
    

2. 安装Autiobooks主程序

注意: 根据官方文档说明,通过pip包管理器直接安装的方式当前可能存在问题。因此,最稳妥的方法是直接从GitHub下载源代码来运行。

  • 第一步:安装Git如果你的电脑还没有安装Git,请先安装它。
    # Linux (Debian/Ubuntu)
    sudo apt install git
    # MacOS
    brew install git
    
  • 第二步:克隆Autiobooks代码库打开终端,使用git clone命令将项目的源代码下载到你的电脑上。你可以选择一个你常用的文件夹来存放项目。
    git clone https://github.com/plusuncold/autiobooks.git
    
  • 第三步:进入项目目录并安装Python依赖下载完成后,进入项目文件夹,然后使用pip安装该项目所需的Python库。
    cd autiobooks
    pip install -r requirements.txt
    

    (注意:如果项目中没有requirements.txt文件,则需要查看pyproject.toml文件,并可能需要使用poetry install或手动安装其中列出的依赖项。)

如何使用

安装完成后,就可以开始转换你的电子书了。

1. 启动程序

确保你的终端当前路径位于autiobooks项目文件夹内,然后执行以下命令来启动程序的图形界面:```bashpython3 -m autiobooks

2. 操作图形界面

程序启动后,你会看到一个简洁的窗口。整个转换过程分为几个简单的步骤:

  • 选择电子书文件 (Epub File):点击界面右上角的“...”按钮。这时会弹出一个文件选择窗口,让你找到并选择你想要转换的.epub格式的电子书文件。
  • 选择输出目录 (Output Directory):点击界面第二个“...”按钮。同样,这会弹出一个文件夹选择窗口,让你指定一个用来存放最终生成的.m4b有声书文件的位置。
  • 加载并选择章节 (Chapters):当你选好电子书文件后,程序会自动读取并解析该文件,然后将书中的所有章节标题加载到下方的“Chapters”列表框中。默认情况下,所有章节都会被勾选。你可以根据自己的需要,取消勾选那些你不想转换的章节。
  • 开始转换 (Go):确认所有设置无误后,点击界面右下角的“Go”按钮。程序会开始执行转换任务。此时,你可以在启动程序的终端窗口中看到详细的进度日志,它会显示当前正在处理哪个章节。
  • 等待转换完成:转换过程需要一些时间,具体时长取决于你的电脑性能和电子书的长度。程序会先将每个章节转换成一个临时的.wav音频文件,存放在你选择的输出目录中。当所有章节都处理完毕后,它会自动使用ffmpeg工具将这些.wav文件合并成一个单独的.m4b有声书文件。这个.m4b文件就是最终的成品。转换完成后,临时生成的.wav文件会被保留下来。

3. 播放有声书

转换完成后,前往你设定的输出目录,找到那个.m4b文件。你可以将它传输到手机或任何支持有声书格式的设备上进行播放。例如,Apple Books、VLC媒体播放器或许多第三方的有声书应用都能很好地支持这种格式。由于文件保留了章节信息,你在播放时可以方便地在不同章节之间跳转。

应用场景

  1. 个人听书将自己购买或收藏的英文.epub电子书转换为有声读物,方便在通勤、运动或做家务时收听,实现多任务学习或娱乐。
  2. 语言学习英语学习者可以转换英文原版书籍,通过听书的方式锻炼听力、熟悉单词发音和语调,同时结合原文进行跟读模仿。
  3. 辅助阅读对于有视力障碍或阅读困难的用户,这个工具可以将文字内容转换成语音,让他们能够无障碍地“阅读”书籍。
  4. 内容创作者素材准备播客主或视频创作者如果需要引用书籍的某些英文片段,可以使用该工具快速生成音频版本,作为自己作品的素材。

QA

  1. 这个工具支持中文电子书吗?目前不支持。虽然其底层的Kokoro语音模型支持中文,但Autiobooks这个项目本身当前只实现了对英文内容的转换。
  2. 为什么转换失败或程序报错?请检查是否已正确安装所有依赖项,特别是ffmpegtkinter。另外,根据官方提示,请确保你的Python版本不是3.13,因为该版本目前不兼容。最后,尝试直接从GitHub克隆源代码运行,而不是使用pip install命令安装。
  3. 生成的.m4b文件是什么?为什么不用MP3?.m4b是一种专门用于有声书的音频容器格式,它基于MPEG-4标准。与.mp3相比,它的主要优点是支持章节标记、封面图片和书签功能。这意味着当你在兼容的播放器中打开它时,可以看到完整的章节列表,并能方便地跳转到任意章节,这对于长篇书籍来说非常实用。
  4. 转换一本书需要多长时间?转换时间取决于多种因素,包括书籍的字数、电脑CPU的性能以及硬盘的读写速度。一本普通长度的小说可能需要几十分钟到数小时不等。你可以在运行程序的终端窗口看到实时的处理进度。
微信微博Email复制链接