📚 ebook2audiobook (E2A)

電子書籍から章とメタデータ付きのオーディオブックへのCPU/GPUコンバーター

高度なTTSエンジンなどを使用。

音声クローンと1158言語に対応！

[!IMPORTANT] このツールは、DRMフリーで合法的に取得された電子書籍でのみ使用することを目的としています。

作者は、このソフトウェアのいかなる誤用、またはそれに起因する法的結果について責任を負いません。

このツールは責任を持って、適用されるすべての法律に従って使用してください。

ebook2audiobookの開発者を支援していただきありがとうございます！

ローカルで実行

</a><a href="https://hub.docker.com/r/athomasson2/ebook2audiobook">

</a>

リモートで実行

グラフィカルインターフェース（GUI）

<details> <summary>WebのGUI画像を見るにはクリック</summary> </details>

デモ

新しいデフォルト音声のデモ

https://github.com/user-attachments/assets/750035dc-e355-46f1-9286-05c1d9e88cea

<details> <summary>その他のデモ</summary>

ASMR音声

https://github.com/user-attachments/assets/68eee9a1-6f71-4903-aacd-47397e47e422

雨の日の音声

https://github.com/user-attachments/assets/d25034d9-c77f-43a9-8f14-0d167172b080

スカーレットの音声

https://github.com/user-attachments/assets/b12009ee-ec0d-45ce-a1ef-b3a52b9f8693

デイヴィッド・アッテンボローの音声

https://github.com/user-attachments/assets/81c4baad-117e-4db5-ac86-efc2b7fea921

例

</details>

README.md

ebook2audiobook
機能
グラフィカルインターフェース
デモ
対応言語
最小要件
使い方
ファインチューニング済みTTSモデル
- ファインチューニング済みTTSモデルのコレクション
- XTTSv2の学習
対応する電子書籍形式
出力形式
古いバージョンに戻す
よくある問題
特別な感謝
目次

機能

🔧 対応TTSエンジン: XTTSv2, Bark, Fairseq, VITS, Tacotron2, Tortoise, GlowTTS, YourTTS
📚 複数のファイル形式を変換: .epub, .mobi, .azw3, .fb2, .lrf, .rb, .snb, .tcr, .pdf, .txt, .rtf, .doc, .docx, .html, .odt, .azw, .tiff, .tif, .png, .jpg, .jpeg, .bmp, .zip
💻 短いテキストを直接音声に変換するテキストエリア
🔍 画像としてのテキストページを含むファイル向けのOCRスキャン
🔊 高品質なテキスト読み上げ、ほぼリアルタイムからほぼ本物の音声まで
🗣️ 独自の音声ファイルを使用した任意の音声クローン
🌐 1158言語に対応 (supported languages list)
💻 低リソースに優しい — **2 GB RAM / 1 GB VRAM（最小）**で動作
🎵 オーディオブックの出力形式: mono or stereo aac, flac, mp3, m4b, m4a, mp4, mov, ogg, wav, webm
🧠 SMLタグ対応 — 中断、一時停止、音声切り替えなどのきめ細かな制御 (see below)
🧩 独自の学習済みモデルを使用した任意のカスタムモデル (XTTSv2, VITS, FAIRSEQ, PIPER, others on request)
🎛️ E2Aチームによって学習されたファインチューニング済みプリセットモデル

（追加のファインチューニング済みモデルが必要な場合、または公式プリセットリストにご自身のものを共有したい場合はご連絡ください）

ハードウェア要件

RAM 2GB以上、8GB推奨。
VRAM 1GB以上、4GB推奨。
Windowsで実行する場合は仮想化を有効化（Dockerのみ）。
CPU、XPU（intel、AMD、ARM）*。
CUDA、ROCm、JETSON
MPS（Apple Silicon CPU）

* 最新のTTSエンジンはCPUで非常に遅いため、YourTTS、Tacotron2などの低品質のTTSを使用してください。

対応言語

Arabic (ar)	Chinese (zh)	English (en)	Spanish (es)
French (fr)	German (de)	Italian (it)	Portuguese (pt)
Polish (pl)	Turkish (tr)	Russian (ru)	Dutch (nl)
Czech (cs)	Japanese (ja)	Hindi (hi)	Bengali (bn)
Hungarian (hu)	Korean (ko)	Vietnamese (vi)	Swedish (sv)
Persian (fa)	Yoruba (yo)	Swahili (sw)	Indonesian (id)
Slovak (sk)	Croatian (hr)	Tamil (ta)	Danish (da)

+1130の言語と方言はこちら

対応する電子書籍形式

.epub, .pdf, .mobi, .txt, .html, .rtf, .chm, .lit, .pdb, .fb2, .odt, .cbr, .cbz, .prc, .lrf, .pml, .snb, .cbc, .rb, .tcr
最良の結果: 自動章検出には.epubまたは.mobi

出力および処理形式

.m4b, .m4a, .mp4, .webm, .mov, .mp3, .flac, .wav, .ogg, .aac
処理形式はlib/conf.pyで変更できます

利用可能なSMLタグ

[break] — 無音（ランダム範囲 0.3–0.6 sec.）
[pause] — 無音（ランダム範囲 1.0–1.6 sec.）
[pause:N] — 固定の一時停止（N sec.）
[voice:/path/to/voice/file]...[/voice] — デフォルトまたはGUI/CLIで選択した音声から音声を切り替え

電子書籍にSMLを自動的に追加することに特化した別のリポジトリをご覧ください -> E2A-SML

[!IMPORTANT] **インストールやバグの問題を投稿する前に、未解決および解決済みの課題タブを注意深く検索してください

あなたの問題がまだ存在しないことを確認するためです。**

[!NOTE] **EPUB形式には、章、段落、序文などが何であるかを定義する標準的な構造がありません。

そのため、まず音声に変換したくないテキストを手動で削除する必要があります。**

手順

リポジトリをクローン

bash

git clone https://github.com/DrewThomasson/ebook2audiobook.git
cd ebook2audiobook

ebook2audiobookをインストール／実行:
- Linux/MacOS
 bash
```
./ebook2audiobook.command
```
 macOSユーザーへの注意: 不足しているプログラムをインストールするためにhomebrewがインストールされます。
- Macランチャー
 Mac Ebook2Audiobook Launcher.commandをダブルクリック
- Windows
 bash
```
ebook2audiobook.cmd
```
 または ebook2audiobook.cmdをダブルクリック
 
 Windowsユーザーへの注意: 管理者権限なしで不足しているプログラムをインストールするためにscoopがインストールされます。
Webアプリを開く: ターミナルに表示されるURLをクリックして、Webアプリにアクセスし電子書籍を変換します。 http://localhost:7860/
公開リンクの場合: ./ebook2audiobook.command --share (Linux/MacOS) ebook2audiobook.cmd --share (Windows) python app.py --share (all OS)

[!IMPORTANT] **スクリプトを停止して再実行した場合、Gradio GUIインターフェースを更新する必要があります

Webページが新しい接続ソケットに再接続できるようにするためです。**

基本的な使い方

Linux/MacOS:

bash

./ebook2audiobook.command --headless --ebook <path_to_ebook_file> --voice <path_to_voice_file> --language <language_code>

Windows

bash

ebook2audiobook.cmd --headless --ebook <path_to_ebook_file> --voice <path_to_voice_file> --language <language_code>

[--ebook]: 電子書籍ファイルへのパス
[--voice]: 音声クローンファイルのパス（任意）
[--language]: ISO-639-3形式の言語コード（例: イタリア語はita、英語はeng、ドイツ語はdeu...）。

デフォルト言語はengで、--languageは./lib/lang.pyで設定されたデフォルト言語の場合は任意です。

2文字のISO-639-1コードも対応しています。

カスタムモデルZipアップロードの例

（必須のモデルファイルを含む.zipファイルである必要があります。XTTSv2の例: config.json、model.pth、vocab.json、ref.wav）

Linux/MacOS

bash

./ebook2audiobook.command --headless --ebook <ebook_file_path> --language <language> --custom_model <custom_model_path>

Windows

bash

ebook2audiobook.cmd --headless --ebook <ebook_file_path> --language <language> --custom_model <custom_model_path>

注意: カスタムモデルのref.wavは常に変換用に選択された音声です

<custom_model_path>: model_name.zipファイルへのパス、これは（ttsエンジンに応じて）すべての必須ファイルを含む必要があります
```
（./lib/models.pyを参照）。
```

使用するすべてのパラメータのリストを含む詳細なガイドはこちら

Linux/MacOS
bash
```
./ebook2audiobook.command --help
```
Windows
bash
```
ebook2audiobook.cmd --help
```
またはすべてのOS向け python app.py --help

bash

usage: app.py [-h] [--session SESSION] [--share] [--headless] [--ebook EBOOK] [--ebooks_dir EBOOKS_DIR]
              [--language LANGUAGE] [--voice VOICE] [--voice_map VOICE_MAP] [--device {CPU,CUDA,MPS,ROCM,XPU,JETSON}]
              [--tts_engine {XTTS,BARK,VITS,FAIRSEQ,TACOTRON,YOURTTS,xtts,bark,vits,fairseq,tacotron,yourtts}]
              [--custom_model CUSTOM_MODEL] [--fine_tuned FINE_TUNED] [--output_format OUTPUT_FORMAT]
              [--output_channel OUTPUT_CHANNEL] [--temperature TEMPERATURE] [--length_penalty LENGTH_PENALTY]
              [--num_beams NUM_BEAMS] [--repetition_penalty REPETITION_PENALTY] [--top_k TOP_K] [--top_p TOP_P]
              [--speed SPEED] [--enable_text_splitting] [--text_temp TEXT_TEMP] [--waveform_temp WAVEFORM_TEMP]
              [--output_dir OUTPUT_DIR] [--version]

Convert eBooks to Audiobooks using a Text-to-Speech model. You can either launch the Gradio interface or run the script in headless mode for direct conversion.

options:
  -h, --help            show this help message and exit
  --session SESSION     Session to resume the conversion in case of interruption, crash,
                            or reuse of custom models and custom cloning voices.

**** The following option is for gradio/gui mode only:
  --share               (Optional) Enable a public shareable Gradio link.

**** The following options are for --headless mode only:
  --headless            Run the script in headless mode
  --ebook EBOOK         Path to the ebook file for conversion. Cannot be used when --ebooks_dir is present.
  --ebooks_dir EBOOKS_DIR
                        Relative or absolute path of the directory containing the files to convert.
                            Cannot be used when --ebook is present.
  --text TEXT           Raw text for conversion. Cannot be used when --ebook or --ebooks_dir is present.
  --language LANGUAGE   Language of the e-book. Default language is set
                            in ./lib/lang.py sed as default if not present. All compatible language codes are in ./lib/lang.py

optional parameters:
  --translate ISO3      (Optional) Translate ebook to a target language (ISO 639-3 code, e.g. eng, fra, deu) before TTS synthesis.
                            Uses argostranslate. The target language becomes the effective TTS language for the run.
                            A copy of the source ebook is made with the _<iso3> suffix so translated and non-translated
                            outputs stay isolated (independent process folder, audio chunks, and final file).
  --voice VOICE         (Optional) Path to the voice cloning file for TTS engine.
                            Uses the default voice if not present.
  --voice_map VOICE_MAP
                        (Optional, --ebooks_dir only) Path to a JSON file mapping ebook path -> voice path.
                            Each entry overrides --voice for that specific ebook. Missing/null entries fall back to --voice.
                            Keys may be absolute paths or basenames. Example:
                            {"book1.epub": "/voices/eng/adult/female/alice.wav", "/abs/path/book2.epub": null}
  --device {CPU,CUDA,MPS,ROCM,XPU,JETSON}
                        (Optional) Processor unit type for the conversion.
                            Default is set in ./lib/conf.py if not present. Fall back to CPU if CUDA or MPS is not available.
  --tts_engine {XTTS,BARK,VITS,FAIRSEQ,TACOTRON,YOURTTS,xtts,bark,vits,fairseq,tacotron,yourtts}
                        (Optional) Preferred TTS engine (available are: ['XTTS', 'BARK', 'VITS', 'FAIRSEQ', 'TACOTRON', 'YOURTTS', 'xtts', 'bark', 'vits', 'fairseq', 'tacotron', 'yourtts'].
                            Default depends on the selected language. The tts engine should be compatible with the chosen language
  --custom_model CUSTOM_MODEL
                        (Optional) Path to the custom model zip file cntaining mandatory model files.
                            Please refer to ./lib/models.py
  --fine_tuned FINE_TUNED
                        (Optional) Fine tuned model path. Default is builtin model.
  --output_format OUTPUT_FORMAT
                        (Optional) Output audio format. Default is m4b set in ./lib/conf.py
  --output_channel OUTPUT_CHANNEL
                        (Optional) Output audio channel. Default is mono set in ./lib/conf.py
  --temperature TEMPERATURE
                        (xtts only, optional) Temperature for the model.
                            Default to config.json model. Higher temperatures lead to more creative outputs.
  --length_penalty LENGTH_PENALTY
                        (xtts only, optional) A length penalty applied to the autoregressive decoder.
                            Default to config.json model. Not applied to custom models.
  --num_beams NUM_BEAMS
                        (xtts only, optional) Controls how many alternative sequences the model explores. Must be equal or greater than length penalty.
                            Default to config.json model.
  --repetition_penalty REPETITION_PENALTY
                        (xtts only, optional) A penalty that prevents the autoregressive decoder from repeating itself.
                            Default to config.json model.
  --top_k TOP_K         (xtts only, optional) Top-k sampling.
                            Lower values mean more likely outputs and increased audio generation speed.
                            Default to config.json model.
  --top_p TOP_P         (xtts only, optional) Top-p sampling.
                            Lower values mean more likely outputs and increased audio generation speed. Default to config.json model.
  --speed SPEED         (xtts only, optional) Speed factor for the speech generation.
                            Default to config.json model.
  --enable_text_splitting
                        (xtts only, optional) Enable TTS text splitting. This option is known to not be very efficient.
                            Default to config.json model.
  --text_temp TEXT_TEMP
                        (bark only, optional) Text Temperature for the model.
                            Default to config.json model.
  --waveform_temp WAVEFORM_TEMP
                        (bark only, optional) Waveform Temperature for the model.
                            Default to config.json model.
  --output_dir OUTPUT_DIR
                        (Optional) Path to the output directory. Default is set in ./lib/conf.py
  --version             Show the version of the script and exit

Example usage:
Windows:
    Gradio/GUI:
    ebook2audiobook.cmd
    Headless mode:
    ebook2audiobook.cmd --headless --ebook '/path/to/file' --language eng
Linux/Mac:
    Gradio/GUI:
    ./ebook2audiobook.command
    Headless mode:
    ./ebook2audiobook.command --headless --ebook '/path/to/file' --language eng

SML tags available:
	[break] — silence (random range **0.3–0.6 sec.**)
	[pause] — silence (random range **1.0–1.6 sec.**)
	[pause:N] — fixed pause (**N sec.**)
	[voice:/path/to/voice/file]...[/voice] — switch voice from default or selected voice from GUI/CLI

注意: gradio/guiモードでは、実行中の変換をキャンセルするには、電子書籍アップロードコンポーネントの[X]をクリックするだけです。ヒント: もう少し長い間を入れたい場合は、3秒の場合'[pause:3]'を追加するなど。

Docker

リポジトリをクローン:

bash

   git clone https://github.com/DrewThomasson/ebook2audiobook.git
   cd ebook2audiobook

コンテナをビルド

bash

    Windows:
        Docker:
            ebook2audiobook.cmd --script_mode build_docker
        Docker Compose:
            ebook2audiobook.cmd --script_mode build_docker --docker_mode compose
        Podman Compose:
            ebook2audiobook.cmd --script_mode build_docker --docker_mode podman
    Linux/Mac
        Docker:
            ./ebook2audiobook.command --script_mode build_docker
        Docker Compose
            ./ebook2audiobook.command --script_mode build_docker --docker_mode compose
        Podman Compose:
            ./ebook2audiobook.command --script_mode build_docker --docker_mode podman

コンテナを実行:

bash

Docker run image:
    Gradio/GUI:
        CPU:
          docker run -v "./ebooks:/app/ebooks" -v "./audiobooks:/app/audiobooks" -v "./models:/app/models" -v "./voices:/app/voices" -v "./tmp:/app/tmp" --rm -it -p 7860:7860 athomasson2/ebook2audiobook:cpu
        CUDA:
          docker run -v "./ebooks:/app/ebooks" -v "./audiobooks:/app/audiobooks" -v "./models:/app/models" -v "./voices:/app/voices" -v "./tmp:/app/tmp" --gpus all --rm -it -p 7860:7860 athomasson2/ebook2audiobook:cu[118/122/124/126 etc..]
        ROCM:
          docker run -v "./ebooks:/app/ebooks" -v "./audiobooks:/app/audiobooks" -v "./models:/app/models" -v "./voices:/app/voices" -v "./tmp:/app/tmp" --device=/dev/kfd --device=/dev/dri --rm -it -p 7860:7860 athomasson2/ebook2audiobook:rocm[6.0/6.1/6.4 etc..]
        XPU:
          docker run -v "./ebooks:/app/ebooks" -v "./audiobooks:/app/audiobooks" -v "./models:/app/models" -v "./voices:/app/voices" -v "./tmp:/app/tmp" --device=/dev/dri --rm -it -p 7860:7860 athomasson2/ebook2audiobook:xpu
        JETSON:
          docker run -v "./ebooks:/app/ebooks" -v "./audiobooks:/app/audiobooks" -v "./models:/app/models" -v "./voices:/app/voices" -v "./tmp:/app/tmp" --runtime nvidia  --rm -it -p 7860:7860 athomasson2/ebook2audiobook:jetson[51/60/61 etc...]
    Headless mode:
        CPU:
          docker run -v "./ebooks:/app/ebooks" -v "./audiobooks:/app/audiobooks" -v "./models:/app/models" -v "./voices:/app/voices" -v "./tmp:/app/tmp" -v "/my/real/ebooks/folder/absolute/path:/app/another_ebook_folder" --rm -it -p 7860:7860 ebook2audiobook:cpu --headless --ebook "/app/another_ebook_folder/myfile.pdf" [--voice /app/my/voicepath/voice.mp3 etc..]
        CUDA:
          docker run -v "./ebooks:/app/ebooks" -v "./audiobooks:/app/audiobooks" -v "./models:/app/models" -v "./voices:/app/voices" -v "./tmp:/app/tmp" -v "/my/real/ebooks/folder/absolute/path:/app/another_ebook_folder" --gpus all --rm -it -p 7860:7860 ebook2audiobook:cu[118/122/124/126 etc..] --headless --ebook "/app/another_ebook_folder/myfile.pdf" [--voice /app/my/voicepath/voice.mp3 etc..]
        ROCM:
          docker run -v "./ebooks:/app/ebooks" -v "./audiobooks:/app/audiobooks" -v "./models:/app/models" -v "./voices:/app/voices" -v "./tmp:/app/tmp" -v "/my/real/ebooks/folder/absolute/path:/app/another_ebook_folder" --device=/dev/kfd --device=/dev/dri --rm -it -p 7860:7860 ebook2audiobook:rocm[6.0/6.1/6.4 etc.] --headless --ebook "/app/another_ebook_folder/myfile.pdf" [--voice /app/my/voicepath/voice.mp3 etc..]
        XPU:
          docker run -v "./ebooks:/app/ebooks" -v "./audiobooks:/app/audiobooks" -v "./models:/app/models" -v "./voices:/app/voices" -v "./tmp:/app/tmp" -v "/my/real/ebooks/folder/absolute/path:/app/another_ebook_folder" --device=/dev/dri --rm -it -p 7860:7860 ebook2audiobook:xpu --headless --ebook "/app/another_ebook_folder/myfile.pdf" [--voice /app/my/voicepath/voice.mp3 etc..]
        JETSON:
          docker run -v "./ebooks:/app/ebooks" -v "./audiobooks:/app/audiobooks" -v "./models:/app/models" -v "./voices:/app/voices" -v "./tmp:/app/tmp" -v "/my/real/ebooks/folder/absolute/path:/app/another_ebook_folder" --runtime nvidia --rm -it -p 7860:7860 ebook2audiobook:jetson[51/60/61 etc.] --headless --ebook "/app/another_ebook_folder/myfile.pdf" [--voice /app/my/voicepath/voice.mp3 etc..]
Docker Compose (i.e. cuda 12.8:
        Run Gradio GUI:
               DEVICE_TAG=cu128 docker compose --profile gpu up --no-log-prefix
        Run Headless mode:
               DEVICE_TAG=cu128 docker compose --profile gpu run --rm ebook2audiobook --headless --ebook "/app/ebooks/myfile.pdf" --voice /app/voices/eng/adult/female/some_voice.wav etc..
Podman Compose (i.e. cuda 12.8:
        Run Gradio GUI:
               DEVICE_TAG=cu128 podman-compose -f podman-compose.yml --profile gpu up
        Run Headless mode:
               DEVICE_TAG=cu128 podman-compose -f podman-compose.yml --profile gpu run --rm ebook2audiobook-gpu --headless --ebook "/app/ebooks/myfile.pdf" --voice /app/voices/eng/adult/female/some_voice.wav etc..

注意: MPSはDockerで公開されていないため、CPUを使用する必要があります

よくあるDockerの問題

NVIDIA GPUが検出されない？？ -> GPUの問題に関するWikiページ

ファインチューニング済み（fine-tuned）TTSモデル

独自のXTTSv2モデルをファインチューニング

学習データのノイズ除去

ファインチューニング済みTTSモデルのコレクション

カスタムXTTSv2モデルには、音声の参照オーディオクリップが必須です:

独自のEbook2Audiobookカスタマイズ

libs/conf.pyを自由に変更して、必要な設定を追加または削除できます。これを計画している場合は、単にオリジナルのconf.pyのコピーを作成しておけば、ebook2audiobookを更新するたびに変更したconf.pyをバックアップし、オリジナルを元に戻すことができます。models.pyについても同じ手順を計画する必要があります。独自のカスタムモデルを公式のファインチューニング済みebook2audiobookモデルにしたい場合は、ご連絡いただければプリセットリストに追加します。

古いバージョンに戻す

リリースは -> こちらで見つけられます

bash

git checkout tags/VERSION_NUM # Locally/Compose -> Example: git checkout tags/v25.7.7

よくある問題:

NVIDIA/ROCm/XPU/MPS GPUが検出されない？？ -> GPU ISSUES Wiki Page
CPUは遅い（サーバーのSMP CPUの方が良い）一方、GPUはほぼリアルタイムの変換が可能です。 Discussion about this （ただし、zero-shotの音声クローンはなく、Siri品質の音声ですが、cpuでははるかに高速です）。
「依存関係の問題があります」 - 単にdockerを使ってください、完全に自己完結型でheadlessモードがあります、詳細についてはdocker runコマンドの末尾に--helpパラメータを追加してください。
「音声が途切れる問題があります！」 - これについてISSUEを作成してください、私たちはすべての言語を話せるわけではなく、文の分割ロジックを微調整するためにユーザーのアドバイスが必要です。😊

* ロードマップ *

追加オプション

TTSエンジン

Readmeの翻訳

🐍 OS互換性

モデルの学習などのための追加のオーバーキル（対応するすべてのCoqui-ttsモデルとpiper-ttsを1つの簡単なコマンドで）

これに関する情報は@DrewThomasson、彼は現在この開発に取り組んでいます、作業中のリポジトリはこちら
ljspeech形式の学習レシピですべてのcoqui-ttsモデル向けに使いやすい学習用guiを作成する coqui ttsからこちら

貢献者向けPythonコード正規化情報

関数とクラスの間を除いて、コード間に空行なし。
dict()とjsonを除くすべてのキーに単一引用符を使用。dict['key']は常に単一引用符で呼び出す
4スペースのインデント、タブはまったく使わない
すべての関数とその引数および戻り値の宣言に対する厳密な型付け
引数とその型付けの間にスペースなし、関数、「->」、戻り値の間にスペースなし

例:

python

import json
from typing import Optional

def get_user(user_id:int, users:list[dict])->Optional[dict]:
    for user in users:
        if user['id'] == user_id:
            return user
    return None

def summarize(user:dict)->str:
    return f"User {user['name']} is {'active' if user['is_active'] else 'inactive'}."

def to_json(user:dict)->str:
    return json.dumps({"id": user['id'], "name": user['name'], "email": user['email']})

users:list = [
    dict(id=1, name="alice", email="[email protected]", role="admin", is_active=True),
    dict(id=2, name="bob", email="[email protected]", role="editor", is_active=False),
    dict(id=3, name="carol", email="[email protected]", role="viewer", is_active=True),
]
config = {
    "max_users": 100,
    "default_role": "viewer",
    "allow_signup": True,
}
roles = ['admin', 'editor', 'viewer']
found = get_user(1, users)
if found:
    print(summarize(found))
    print(found['email'])
    print(to_json(found))
if config['default_role'] in roles:
    print(config['default_role'])

ベータテスト用のハードウェア寄付を募集

開発のテストのために、以下のようなあらゆる種類のハードウェアを受け付けています:

Nvidia supporting cuda >= 11.8
XPU intel cards
ROCm AMD cards supporting ROCm >=5.7

@DrewThomasson どんな形でも手伝いたい方は！ 😃

📚 ebook2audiobook (E2A)

📚 ebook2audiobook (E2A)

ebook2audiobookの開発者を支援していただきありがとうございます！

ローカルで実行

リモートで実行

グラフィカルインターフェース（GUI）

デモ

README.md

目次

機能

ハードウェア要件

対応言語

対応する電子書籍形式

出力および処理形式

利用可能なSMLタグ

手順

基本的な使い方

カスタムモデルZipアップロードの例

使用するすべてのパラメータのリストを含む詳細なガイドはこちら

Docker

よくあるDockerの問題

ファインチューニング済み（fine-tuned）TTSモデル

独自のXTTSv2モデルをファインチューニング

学習データのノイズ除去

ファインチューニング済みTTSモデルのコレクション

独自のEbook2Audiobookカスタマイズ

古いバージョンに戻す

よくある問題:

***** ロードマップ *****

追加オプション

TTSエンジン

Readmeの翻訳

🐍 OS互換性

モデルの学習などのための追加のオーバーキル（対応するすべてのCoqui-ttsモデルとpiper-ttsを1つの簡単なコマンドで）

貢献者向けPythonコード正規化情報

ベータテスト用のハードウェア寄付を募集

特別な感謝

* ロードマップ *