docs/jp/faq.md
これは一般的な設定の問題です。これが発生する理由はいくつかあります:
config.toml という名前の設定ファイルを必要とします。誤って config.toml.txt と名付けていないことを確認してください。config フォルダー内に配置する必要があります。作業ディレクトリの正しい構造は次のようになります:
/── config/
│ └── config.toml
└── krillinai.exe(あなたの実行可能ファイル)
config.toml ファイルの異なるセクションにキーを入力する必要があります。llm セクション、transcribe セクション、tts セクションを探し、対応するAPIキーやその他の必要な情報を入力してください。このエラーは、通常、ネットワークまたはダウンローダーのバージョンに関連するビデオダウンローダーの問題を示しています。
ネットワーク: プロキシを使用している場合は、config.toml ファイル内のプロキシ設定で正しく構成されていることを確認してください。
yt-dlpの更新: ソフトウェアにバンドルされている yt-dlp のバージョンが古い可能性があります。ソフトウェアの bin ディレクトリでターミナルを開き、次のコマンドを実行して手動で更新できます:
./yt-dlp.exe -U
(異なる場合は、yt-dlp.exe をあなたのオペレーティングシステムに適したファイル名に置き換えてください)。
これはほとんど常に、特に中国語の文字をサポートするフォントがシステムに欠けていることが原因です。これを修正するには、必要なフォントをインストールする必要があります。
sudo mkdir -p /usr/share/fonts/msyh。.ttc フォントファイルをこの新しいディレクトリにコピーします。cd /usr/share/fonts/msyh
sudo mkfontscale
sudo mkfontdir
sudo fc-cache -fv
これはmacOSのセキュリティ機能であるGatekeeperによって引き起こされ、未確認の開発者からのアプリを制限します。これを修正するには、手動で隔離属性を削除する必要があります。
xattr -cr コマンドを入力し、スペースを空けてからFinderウィンドウから KrillinAI.app ファイルをターミナルにドラッグします。コマンドは次のようになります:
xattr -cr /Applications/KrillinAI.app
ffmpegエラー、audioToSrtエラー、または exit status 1 のようなエラーが表示されます。これらのエラーは通常、依存関係やシステムリソースの問題を示しています。
ffmpegエラー: これは ffmpeg がインストールされていないか、システムのPATHからアクセスできないことを示しています。公式の完全なバージョンの ffmpeg がインストールされていることを確認し、その場所がシステムの環境変数に追加されていることを確認してください。audioToSrtエラー または exit status 1: このエラーは文字起こしフェーズ(音声からテキストへの変換)中に発生します。一般的な原因は次のとおりです:
fasterwhisper)が読み込まれなかったか、ダウンロード中に破損しました。いいえ、エラーメッセージが表示されない限り、プログラムは動作しています。進行状況バーは、主要なタスク(文字起こしやビデオエンコーディングなど)が完全に完了した後にのみ更新されます。これらのタスクは非常に時間がかかることがあり、進行状況バーが長時間停止しているように見えることがあります。お待ちいただき、タスクが完了するのをお待ちください。
fasterwhisper に対応していません。どうすればよいですか?fasterwhisper モデルがNVIDIA 5000シリーズGPUで正しく動作しないことが観察されています(2025年中頃の時点で)。文字起こしのためのいくつかの代替手段があります:
config.toml ファイルで transcribe.provider.name を openai または aliyun に設定します。その後、対応するAPIキーと設定の詳細を入力します。これにより、ローカルモデルの代わりにクラウドプロバイダーのWhisperモデルが使用されます。whisper.cpp など、他のローカル文字起こしモデルを試すことができます。利用可能な声とそれに対応するコードは、使用している音声サービスプロバイダーによって定義されています。公式ドキュメントを参照してください。
はい、KrillinAIをOpenAI互換のAPIエンドポイントを提供する任意のローカルLLMを使用するように構成できます。
config.tomlを編集する: 大規模言語モデル(翻訳者)のセクションで:name(または type)を "openai" に設定します。api_key を任意のランダムな文字列(例:"ollama")に設定します。これはローカル呼び出しには必要ありません。base_url をローカルモデルのAPIエンドポイントに設定します。Ollamaの場合、通常は http://localhost:11434/v1 です。model を提供しているモデルの名前(例:"llama3")に設定します。いいえ。現在、KrillinAIはハードコーディングされた字幕を生成します。つまり、字幕はビデオフレームに直接焼き付けられています。アプリケーションは字幕スタイルをカスタマイズするオプションを提供していません。プリセットスタイルを使用します。
高度なカスタマイズのための推奨される回避策は次のとおりです:
.srt 字幕ファイルを生成します。.srt ファイルをプロフェッショナルなビデオ編集ソフトウェア(例:Premiere Pro、Final Cut Pro、DaVinci Resolve)にインポートして、カスタムスタイルを適用してからレンダリングします。.srt ファイルがあります。KrillinAIはそれを使用してダビングだけを行えますか?いいえ、この機能は現在サポートされていません。アプリケーションは文字起こしから最終ビデオ生成までのフルパイプラインを実行します。