docs/rus/README.md
<a href="https://trendshift.io/repositories/13360" target="_blank"></a>
English|简体中文|日本語|한국어|Tiếng Việt|Français|Deutsch|Español|Português|Русский|اللغة العربية
</div>KrillinAI — это универсальное решение для локализации и улучшения аудио и видео, разработанное Krillin AI. Этот минималистичный, но мощный инструмент объединяет перевод видео, дубляж и клонирование голоса, поддерживая как горизонтальный, так и вертикальный форматы, чтобы обеспечить идеальное представление на всех основных платформах (Bilibili, Xiaohongshu, Douyin, WeChat Video, Kuaishou, YouTube, TikTok и др.). С помощью рабочего процесса от начала до конца вы можете преобразовать исходные материалы в красиво готовый кроссплатформенный контент всего за несколько кликов.
🎯 Запуск в один клик: Не требуется сложная настройка окружения, автоматическая установка зависимостей, готов к использованию сразу, с новой настольной версией для более удобного доступа!
📥 Получение видео: Поддерживает загрузку через yt-dlp или загрузку локальных файлов
📜 Точная распознаваемость: Высокоточное распознавание речи на основе Whisper
🧠 Интеллектуальная сегментация: Сегментация и выравнивание субтитров с использованием LLM
🔄 Замена терминологии: Замена профессиональной лексики в один клик
🌍 Профессиональный перевод: Перевод LLM с учетом контекста для сохранения естественной семантики
🎙️ Клонирование голоса: Предлагает выбранные голосовые тона от CosyVoice или индивидуальное клонирование голоса
🎬 Компоновка видео: Автоматическая обработка горизонтальных и вертикальных видео и компоновка субтитров
💻 Кроссплатформенность: Поддерживает Windows, Linux, macOS, предоставляя как настольные, так и серверные версии
На изображении ниже показан эффект файла субтитров, сгенерированного после импорта 46-минутного локального видео и его выполнения в один клик, без каких-либо ручных настроек. Нет пропусков или наложений, сегментация естественная, а качество перевода очень высокое.
<table> <tr> <td width="33%">https://github.com/user-attachments/assets/bba1ac0a-fe6b-4947-b58d-ba99306d0339
</td> <td width="33%">https://github.com/user-attachments/assets/0b32fad3-c3ad-4b6a-abf0-0865f0dd2385
</td> <td width="33%">https://github.com/user-attachments/assets/c2c7b528-0ef8-4ba9-b8ac-f9f92f6d4e71
</td> </tr> </table>Все локальные модели в таблице ниже поддерживают автоматическую установку исполняемых файлов + файлов моделей; вам просто нужно выбрать, и Klic подготовит все для вас.
| Источник службы | Поддерживаемые платформы | Опции модели | Локально/Облачно | Примечания |
|---|---|---|---|---|
| OpenAI Whisper | Все платформы | - | Облачно | Быстрая скорость и хороший эффект |
| FasterWhisper | Windows/Linux | tiny/medium/large-v2 (рекомендуется medium+) | Локально | Быстрая скорость, без затрат на облачные услуги |
| WhisperKit | macOS (только M-серии) | large-v2 | Локально | Нативная оптимизация для чипов Apple |
| WhisperCpp | Все платформы | large-v2 | Локально | Поддерживает все платформы |
| Alibaba Cloud ASR | Все платформы | - | Облачно | Избегает сетевых проблем в материковом Китае |
✅ Совместимо со всеми облачными/локальными службами больших языковых моделей, соответствующими спецификациям API OpenAI, включая, но не ограничиваясь:
Поддерживаемые языки ввода: китайский, английский, японский, немецкий, турецкий, корейский, русский, малайский (постоянно увеличивается)
Поддерживаемые языки перевода: английский, китайский, русский, испанский, французский и 101 другой язык
Вы можете задать вопросы на Deepwiki KrillinAI. Он индексирует файлы в репозитории, так что вы можете быстро найти ответы.
Сначала загрузите исполняемый файл, соответствующий вашей системе, из раздела Release, затем следуйте приведенному ниже руководству, чтобы выбрать между настольной версией или версией без интерфейса. Поместите загруженное программное обеспечение в пустую папку, так как его запуск создаст некоторые директории, и хранение в пустой папке упростит управление.
【Если это настольная версия, т.е. файл релиза с "desktop", смотрите здесь】 Настольная версия была недавно выпущена, чтобы решить проблемы новых пользователей с правильным редактированием конфигурационных файлов, и в ней есть некоторые ошибки, которые постоянно обновляются.
【Если это версия без интерфейса, т.е. файл релиза без "desktop", смотрите здесь】 Версия без интерфейса — это начальная версия, которая имеет более сложную конфигурацию, но стабильна по функциональности и подходит для серверного развертывания, так как предоставляет интерфейс в веб-формате.
config внутри папки, затем создайте файл config.toml в папке config. Скопируйте содержимое файла config-example.toml из директории config исходного кода в config.toml и заполните свою конфигурационную информацию в соответствии с комментариями.http://127.0.0.1:8888, чтобы начать его использование (замените 8888 на порт, указанный в конфигурационном файле)【Если это настольная версия, т.е. файл релиза с "desktop", смотрите здесь】 Из-за проблем с подписью настольная версия в настоящее время не может быть запущена двойным щелчком или установлена через dmg; вам нужно вручную доверять приложению. Метод следующий:
sudo xattr -cr ./KrillinAI_1.0.0_desktop_macOS_arm64
sudo chmod +x ./KrillinAI_1.0.0_desktop_macOS_arm64
./KrillinAI_1.0.0_desktop_macOS_arm64
【Если это версия без интерфейса, т.е. файл релиза без "desktop", смотрите здесь】 Это программное обеспечение не подписано, поэтому при запуске на macOS, после завершения настройки файла в "Основных шагах", вам также нужно вручную доверять приложению. Метод следующий:
Откройте терминал в директории, где находится исполняемый файл (предполагая, что имя файла KrillinAI_1.0.0_macOS_arm64)
Выполните следующие команды по порядку:
sudo xattr -rd com.apple.quarantine ./KrillinAI_1.0.0_macOS_arm64
sudo chmod +x ./KrillinAI_1.0.0_macOS_arm64
./KrillinAI_1.0.0_macOS_arm64
Это запустит службу
Этот проект поддерживает развертывание с помощью Docker; пожалуйста, обратитесь к Инструкциям по развертыванию Docker
На основе предоставленного конфигурационного файла вот обновленный раздел "Помощь по конфигурации (обязательно к прочтению)" для вашего файла README:
Конфигурационный файл разделен на несколько секций: [app], [server], [llm], [transcribe] и [tts]. Задача состоит из распознавания речи (transcribe) + перевода большой модели (llm) + необязательных голосовых услуг (tts). Понимание этого поможет вам лучше разобраться в конфигурационном файле.
Самая простая и быстрая конфигурация:
Только для перевода субтитров:
[transcribe] установите provider.name на openai.[llm], чтобы начать выполнять переводы субтитров. app.proxy, model и openai.base_url можно заполнить по мере необходимости.Сбалансированные затраты, скорость и качество (используя локальное распознавание речи):
[transcribe] установите provider.name на fasterwhisper.transcribe.fasterwhisper.model на large-v2.[llm].Конфигурация TTS (текст в речь) (необязательно):
provider.name в секции [tts] (например, aliyun или openai).aliyun, вам нужно будет заполнить секцию [tts.aliyun].aliyun в качестве провайдера TTS.Конфигурация Alibaba Cloud:
AccessKey, Bucket и AppKey для услуг Alibaba Cloud, пожалуйста, обратитесь к Инструкциям по конфигурации Alibaba Cloud. Повторяющиеся поля для AccessKey и т.д. предназначены для поддержания четкой структуры конфигурации.Пожалуйста, посетите Часто задаваемые вопросы