Project AIRI 说明书

对应版本：AIRI-0.10.1-windows-x64-setup

::: warning 阅读前说明

目前关于 AIRI 的部分技术性功能和操作在该说明书中不会具体讲解。
主要编辑者仅对说明书的中文版本负责，其他语言版本目前采用 AI 翻译，而后人工简单修正的方式处理，可能与实际显示的内容不符，请以实际为准。
请注意，该说明书中包含的图片为非沐玖芸萱工作室成员添加，由于技术原因，所有图片暂不会得到及时更新，还请见谅！
说明书的大部分内容为说明书的主编团队成员自己包括其他参与者经过探索研究出来的，可能与事实不符或者存在偏差，具体请以自己实际体验到的为准。
该说明书可能不会及时更新。
因能力和时间问题，该说明书暂仅包含 Windows 平台通过安装包安装的 AIRI 的部分详细教程。
软件部分位置使用的是英文而且并没有提供翻译，该说明书会尝试翻译涉及到的部分内容，最终译文请以实际为准。
AIRI 的版本更新可能会改变部分内容，该说明书仅介绍编写时间前最新的一个版本的特性，对于前后其他版本的程序，如果遇到不同的地方，请自行解决。
如果您有想要添加的说明或者对该说明书有什么疑问，请在 Project AIRI 官方 Discord 频道上 @jhicefair 并留言。
如果您还有别的什么问题，请在 Project AIRI 官方 Discord 频道上留言。
祝您玩的开心！AwA :::

第一章·安装

找到 Project AIRI GitHub 主页：moeru-ai/airi

建议按下面的步骤操作：

找到位于页面右侧的「Releases」选项。
点击「+ 68 releases」。
挑一个版本，找到下面的「Assets」选项并点开。
选择适合自己电脑的版本点击下载。
找到你下载下来的安装包，双击左键安装。

::: tip 下载页面提示

「+ 68 releases」中间的数字代表已发布的其他版本数量，你看到的数字可能不是 68。
由于可选内容较多，你可能还需要点击列表最下方的「Show all 19 assets」；这里的数字同样可能不是 19。
以下均以 Windows 安装包版本为例。
安装过程因时间原因暂跳过，相信你自己可以解决。 :::

第二章·初步配置

第一项·先前准备

在一切正式开始前，你需要首先至少准备一个 LLM 服务提供商的 API。

::: info 名词解释

LLM 是「大型语言模型」（Large Language Model）的缩写。

通俗点讲，一个 AI。

API 全称是应用程序编程接口。

它本质上是一套预先定义好的规则，让不同的软件应用之间可以相互通信、交换数据和功能。

你可以不用去理解他到底是什么，只要会获取就行。 :::

::: tip 获取 API LLM 提供商有很多，而且它们的获取方式各不相同。由于篇幅和时间原因，这里不提供教程或者举例，具体如何获取你可以去网络上搜索或者询问 AI。 :::

::: warning API 安全获取好 API 后请注意保存好，而且不要告诉其他人！ :::

第二项·Airi 启动！

::: info 本节示例下面的步骤以 Deepseek 为例进行演示。 :::

::: tip 关于每次启动的一个可能的bug以及处理办法每次启动时，您都有可能遇到这样的bug：主界面边框闪烁，点击展开弹出的菜单会很快收回……

如果遇到这个bug，请不要担心，按照如下流程可以解决：（不过你需要足够的手速）

首先，等闪烁的边框熄灭的瞬间点击展开；

快速找到第二行第一个选项“刷新”然后点击即可解决问题。

该bug在最近的几个版本中均未修复，我们会持续向开发者团队反馈这个问题，相信很快它就能得到解决！ :::

::: tip 界面翻译说明「setup with your provider」的意思是「设置您的提供商」。 :::

建议按下面的步骤完成初始配置：

打开 Airi（正常情况下安装后会默认自动打开）。
在弹出的主界面选择你的语言。
点击「配置您自己的AI服务来源」或者点击「登录」（由于时间原因，关于选择登录的流程暂不做讲解，还请见谅！）。
选中你准备的服务来源，然后点击「下一步」。
填入你的 API Key，然后点击「下一步」。
再点击一次「下一步」。
选择你打算使用的模型，然后点击「保存并继续」。

恭喜你，不出意外的话你已经完成了 Airi 的初步配置！

第三章·Airi 界面介绍

主窗口

该窗口是展示虚拟角色形象的窗口，共有三个选项：

「websocket 状态」——位于右上角，点击可打开连接设置，在这里你可以配置你的 WebSocket 服务器地址（在当前版本该选项已被移除）。
「展开」——位于右下角，点击可展开更多选项（见下文）。
「打开听力控制」——位于右下角，点击后可以与 Airi 说话，需要提前配置 STT 服务。
「移动」——位于右下角，鼠标左键长按并拖动即可改变主窗口在桌面上的位置。

::: info 听力控制补充打开听力控制好像还需要先打开聊天窗口。由于该功能在编辑者这里暂未成功运行，相关教程暂略。 :::

::: info 名词解释

websocket

WebSocket 是一种网络通信协议，提供了浏览器与服务器之间的全双工、持久连接。

简单理解就是传统的 HTTP 是「一问一答」模式（客户端请求，服务器响应，然后断开），

而 WebSocket 建立连接后，双方可以随时互相发送消息，无需重复发起请求。

STT 是「语音转文本」（Speech-to-Text）的缩写，也称自动语音识别（ASR）。

它的目标是让计算机听懂人类的语音，并将其转换成对应的文字。 :::

点击「展开」选项展开后有九个子选项：

「登录」——可以登录您自己的Airi账号。
「打开设置」——打开 Airi 的设置界面。
「切换角色」——切换角色卡。
「打开聊天」——打开聊天窗口。
「刷新」——刷新主窗口。
「切换到暗色模式」——切换 Airi 的界面背景为「亮 / 暗」。
「取消置顶」——使 Airi 主窗口不再保持置顶显示。
「总是显示」/「悬停时隐藏」——使 Airi 主窗口不影响鼠标光标对窗口下内容的点击，从而不影响你的工作。
「关闭」——一键关闭 Airi。

系统托盘其他选项

首先，你需要找到 Airi 在任务栏的小图标。

::: tip Windows 任务栏提示在 Windows 平台，可能需要在任务栏点击「显示隐藏的图标」展开后才能找到 Airi 图标。 :::

右键 Airi 的小图标，你可以看到十个选项：

「显示」——召唤主窗口，一般用不上。
「调整大小」——调整主窗口的窗口大小，同时也会使主窗口居中。包含四个子选项：
- 「推荐（450x600）」——设置为推荐大小 450x600。
- 「全高」——使主窗口的高占满桌面的高。
- 「半高」——使主窗口的高为桌面的高的一半。
- 「全屏」——使主窗口填满整个桌面。
「对齐到」——使主窗口对齐到桌面的特定位置。包含五个子选项：
- 「居中」——对齐到桌面正中间。
- 「左上」——对齐到桌面左上角。
- 「右上」——对齐到桌面右上角。
- 「左下」——对齐到桌面左下角。
- 「右下」——对齐到桌面右下角。
「设置」——打开设置界面。
「关于」——相关说明略。
「打开快速操作」——相关说明暂略。
「打开小部件」——相关说明暂略。
「打开字幕」——打开字幕。只有启用 TTS 服务才能在 Airi 说话时显示出文字，默认鼠标光标悬停时隐藏。
「字幕浮窗」——包含两个子选项：
- 「跟随窗口」——默认选中该模式，此时字幕窗口位置会跟随主窗口一起移动；取消选中则字幕位置独立。
- 「重置位置」——使字幕位置重置。
「退出」——一键关闭 Airi。

::: info 名词解释

TTS 是「文本转语音」（Text-to-Speech）的缩写，旨在让计算机将文字自动转换为自然流畅的语音输出。 :::

设置界面

::: info 本节范围该部分仅介绍界面里有什么，具体功能介绍见第四章。 :::

你可以通过以下两种方式打开设置界面：

在主窗口点击「展开」，然后选择「打开设置」。
右键系统托盘中的 Airi 小图标，选择「设置」。

设置界面包括以下九大内容：

「AIRI 角色卡」——选择和配置角色的人设。
「机体模块」——配置 Airi 的各种功能，包括意识、发声、听觉、视觉、短期记忆、长期记忆、Discord、X / Twitter、我的世界、异星工厂、MCP 服务器、同步音律。
「场景（Scenes）」——配置Airi的场景（背景）。
「角色模型」——选择和设置角色的模型。
「记忆体」——功能暂未发布。
「服务来源」——配置 LLM、TTS、STT、Artistry 服务的来源。
「Data」——译为「数据」，管理 Airi 的各种数据。
「连接」——配置你的 WebSocket 服务器地址。
「系统」——里面包括四个子选项：
- 「通用」——设置程序主题、语言等内容。
- 「配色方案」——设置主题颜色。
- 「窗口快捷方式」——当前为空，且没有返回键。
- 「开发者」——包含很多高级功能，详见第四章。

::: warning 不要打开「窗口快捷方式」该选项当前没有任何内容，也没有返回键。一旦点进去，就需要「关掉并重新打开设置窗口」才能退出。 :::

聊天窗口

你可以在主窗口点击「展开」，然后选择「打开聊天」来打开聊天窗口。

在这里，你可以和 Airi 聊天。

第四章·设置

你可以通过以下两种方式打开设置界面：

在主窗口点击「展开」，然后选择「打开设置」。
右键系统托盘中的 Airi 小图标，选择「设置」。

AIRI 角色卡

在这里，你可以上传、创建或者直接修改默认的角色卡。

::: info 关于上传从弹出的窗口来看，上传入口疑似支持任意文件类型。但编辑者没有实际使用过，而且角色卡也没有导出功能，因此相关介绍略。 :::

关于创建新角色卡，建议按下面的顺序配置：

填写身份部分，包括名字、昵称、描述、创建者笔记。
根据需要填写行为部分，包括角色性格、场景（或者理解为周围环境、背景、情境）和问候语。
根据需要调整模块部分，为角色配置特定的机体模块。
根据需要配置Artistry部分，为角色配置生成图片的功能。
最后检查设置部分，包括系统提示词、历史提示指令和版本。
确认内容无误后，点击「创建」完成角色卡创建。
创建完成后，点击角色卡右下角的圈，或者点击角色卡后再点击激活，正式启用这个角色卡。

其中身份部分最重要的是名字和描述：

名字即角色正式的名称，如果设定了昵称，那么昵称会被优先使用。
描述即关于人设具体的细节，你可以自由发挥，也可以参考默认角色卡。

::: info 编辑者补充

如果你选择参考默认角色卡编写自己角色的设定，其中后半部分关于 ACT 标签的内容可以不添加。
创建者笔记编辑者暂未使用过，介绍暂略。
行为部分、模块部分、Artistry部分和设置部分编辑者也还没有完整测试，这里只说明它们的大致作用，暂不做具体讲解。 :::

::: warning 需要手动激活创建角色卡后默认不会启用，必须手动激活才可以使用。 :::

机体模块

在这里可以配置 Airi 的各种功能，具体如下：

意识

建议按下面的步骤完成配置：

先选中一个服务来源，或者添加一个新的服务来源并选中。
再选择一个模型并选中。

::: tip 服务来源过多时（该内容已得到优化！）如果可选的服务来源太多，可能点不到位于后面的服务来源。这时候可以把鼠标光标移动到一个选项卡上，按鼠标中键后左右拖动。 :::

发声

::: tip 发声页补充说明

不同服务来源在该页面的配置流程可能略有不同，该处以阿里百炼为例，其他以实际界面为准。
其中部分服务关于 Pitch（即音调）的功能可能无效。
如果可选的服务来源太多，可能点不到位于后面的服务来源。这时候可以把鼠标光标移动到一个选项卡上，按鼠标中键后左右拖动。 :::

建议按下面的步骤完成配置：

先选中一个服务来源，或者添加一个新的服务来源并选中。
然后选择一个模型并选中。
接着选择一个声线并选中。
如果你不想让 Airi 发声，也可以直接选择「无」。
完成基础配置后，你还可以在页面最下方输入文字，通过点击「测试声音」生成一段测试音频。

听觉

::: tip 服务来源过多时如果可选的服务来源太多，可能点不到位于后面的服务来源。这时候可以把鼠标光标移动到一个选项卡上，按鼠标中键后左右拖动。 :::

建议按下面的步骤完成配置：

先选择你的收音设备（Audio Input Device，译为「音频输入设备」）。
然后选中一个服务来源，或者添加一个新的服务来源并选中。
接着选择一个模型并选中。

除此之外，你还可以：

启用 Auto-send transcribed text（即「自动发送转录文本」）功能以实现自动发送。
关闭该功能则可以对转录结果进行调整。
通过 Auto-send delay（即「自动发送延迟」）调整发送延迟。

::: info 编辑者补充上面关于「关闭自动发送可以调整转录结果」的说法是编辑者的推测，因为编辑者没有成功调用过听觉功能。 :::

如果你想测试麦克风：

在界面的中间部分点击「start monitoring」开启监听。
如果需要，可以再调整 Sensitivity，即灵敏度。

如果你想测试 STT 功能：

在界面的最下方点击「start speech-to-text」开始测试。
然后在 Transcription Result 下查看识别结果。

视觉

建议按下面的步骤完成配置：

先选中一个服务来源，或者添加一个新的服务来源并选中。
接着选择一个模型并选中。
如需要可以设置 Capture interval，即「捕获间隔」，用来调整捕获的时间间隔。

::: warning 需要先启用 vision capture 该功能需要先到「系统 → 开发者 → vision capture」处启动，具体介绍见对应部分。 :::

Artistry

译为：艺术创作。

在这里，你可以为Airi配置艺术创作的能力。

请注意：该功能与neuro的绘画逻辑不同，是借助第三方AI服务进行图片生成——这会让你得到非常精美的由AI生成的图片。

由于时间原因，该部分内容暂不做具体讲解。

短期记忆

功能暂未发布。

长期记忆

功能暂未发布。

Discord

在这里你可以配置 Discord 机器人，使 Airi 进入你的 Discord 服务器与人互动。

建议按下面的顺序准备：

先获取你的 Discord 机器人令牌。
再把它填写到对应位置。
最后按界面提示完成配置。

::: warning Discord 机器人说明该功能需要使用 Discord 机器人，目前安装包版本暂未内置，需要你去 GitHub 页面提取相关文件才可以使用。由于编辑者关于这部分内容的日程还很靠后，具体教程暂略。 :::

X / Twitter

该功能需要使用机器人才可以使用，具体教程暂略。

我的世界（Minecraft）

该功能需要使用机器人才可以使用，具体教程暂略。

异星工厂（Factorio）

该功能需要使用机器人才可以使用，具体教程暂略。

MCP 服务器

该功能编辑者没用过，具体教程暂略。

同步音律

该功能编辑者还在探索当中，具体教程暂略。

场景（Scenes）

在这里，你可以配置Airi主界面的场景——你可以简单将其理解为Airi主界面的背景。

这里包含了两个预设，你可以点击其中一个预设中间的对勾（需要将鼠标光标移动上去才会显现）来启用场景。

还可以点击「Upload to Gallery」来导入自己的图片场景。

如果你需要清除场景，请点击「Clear Default」。

角色模型

在这里你可以选择和设置角色的模型。

Airi 支持的模型包括 Live2D 模型和 VRM 3D 模型。

如果你只是想切换现有模型，建议按下面的步骤操作：

点击「select model」打开模型选择界面。
在当前版本中，默认可以看到两个 Live2D 模型和两个 VRM 3D 模型。
选中一个模型后，点击「confirm」完成切换。

如果你想导入自己的模型，可以点击「add」导入自己的 Live2D 模型或者 VRM 3D 模型。

::: info 编辑者补充关于「Switch to Godot Stage(Experimental)」选项，由于说明书的主编团队暂未研究明白这个功能且该功能疑似处于实验阶段，相关介绍暂略。 :::

::: warning 导入模型前请注意

旧版 Live2D 模型不被支持，请选择包括「*.moc3」的文件。
导入 Live2D 模型前，你需要先将「模型文件夹」压缩为「*.zip」文件才可以导入。 :::

如果你选择的是 Live2D 模型

你可以继续按下面的顺序调整：

展开「缩放与位置」，调整模型在主窗口中的大小和位置。其中 x 为横轴（左右）位置，y 为纵轴（上下）位置。
展开「parameters」（译为「参数」），继续设置鼠标追踪、Idle Animation（即「待机动画」）、帧率、Auto Blink（即「自动眨眼」）、Force Auto Blink (fallback timer)（即「强制自动闪烁（备用计时器）」）、Shadow（即「影子」）、reset to default parameters（译为「重置为默认参数」）、clear model cache（译为「清除模型缓存」）以及模型涉及的所有参数。
如果想要设置待机动画，请确保模型压缩包中包含动画文件。
如果还需要表情功能，可以再展开「Expressions」（译为「表达」）启用 Expression System（译为「表达系统」）。

::: info 编辑者补充该功能编辑者也还没有完整测试，其他相关内容介绍暂略。 :::

如果你选择的是 VRM 3D 模型

你可以先展开「场景」，然后设置 Model Position（译为「模型位置」）、视角调整（度）、相机距离（画面缩放）、模型朝向（Y 轴旋转）、模型注视方向等内容。

::: info 编辑者补充该部分内容以及下面的「更换模型」介绍因为时间原因暂略。 :::

记忆体

功能暂未发布。

服务来源

在这里，你可以配置 Chat（LLM）、Speech（TTS）、Transcription（STT）、Artistry 的服务来源。

选择一个选项，挑选一种你已经准备好的服务来源，在对应界面填写所需内容即可完成配置。

除此之外，您可以对所有服务做一个筛选，包括Pricing（价格）以及Deployment（部署位置）。

关于Pricing（价格），包括三个选项：
- All——全部
- Free——免费
- Paid——付费
关于Deployment（部署位置），包括三个选项：
- All——全部
- Local——本地（翻译仅供参考）
- Cloud——云端（翻译仅供参考）

::: warning 请注意部分服务的配置界面可能因为没有得到及时维护而无法正常使用，如果您遇到了类似问题，请在 GitHub 提交 Issue，或者也可以尝试选择「OpenAI 兼容 API」选项进行配置（如果您准备的服务来源支持的话）。 :::

::: info 编辑者补充该部分具体介绍暂略。 :::

数据（Data）

在这里，你可以管理 Airi 的各种数据。

::: warning 不可恢复操作该部分可以删除或清理相关数据，而且无法恢复，请谨慎操作。在执行删除和重置操作前，建议先再确认一遍内容。 :::

::: tip 已知问题「打开 APP 数据文件夹」目前有 Bug，可能会一次性把数据文件夹打开好几次。 :::

建议按方框分区理解：

第一个方框包含打开应用数据文件夹，点击「打开文件夹」即可打开。
第二个方框可以导入 / 导出聊天记录，或者删除所有聊天会话。
第三个方框可以删除导入的所有模型，或者重置模块偏好设置和凭据。
第四个方框可以重置桌面设置和状态。
第五个方框可以重置所有提供商设置和凭据，或者清除每个本地设置、提供商配置和模型。

连接

在这里你可以配置你的 WebSocket 服务器地址。

::: info 编辑者补充具体介绍暂略。 :::

系统

通用

在这里，你可以设置程序主题、语言等内容。

主题选项默认亮色，点击后面的按钮可以切换到暗色模式。
语言选项这里可以设置界面的语言。
控制岛图标大小选项可以更改主窗口右下角三个按键的大小。
最后，你还可以设置是否允许收集使用数据及崩溃分析，或者阅读隐私政策（点击「隐私政策」打开）。

配色方案

在这里，你可以更改主题颜色。

你可以启动 RGB 选项来使主题颜色像 RGB 灯带那样自动变化。
你也可以拖动下方的黑线或者在彩色条中点击来更改主题颜色。
在其下方是颜色效果预览。
你也可以直接选择下方的预设来改变主题颜色。

::: tip 颜色预设这里应该点击任意一个圆，而不是点击方框。 :::

窗口快捷方式

::: warning 请勿打开由于该选项内没有任何内容也没有返回键，一旦点进去就需要「关掉并重新打开设置窗口」，所以请不要点击该选项。 :::

开发者

在这里，你可以使用一些高级功能。

::: info 高级功能说明该部分内容大多为英文，而且属于一般用不到的高级功能，因此下面的介绍仅供参考。 :::

第一个方框及其相关选项：

第一个方框中你可以点击「打开」以打开像浏览器 F12 那样的开发者工具窗口。
第二个「Markdown 压力测试」功能介绍暂略。
第三个「IO Tracer」功能介绍暂略。
第四个「Lag 可视化」功能介绍暂略。
第五个「是否开启舞台切换动画」功能介绍暂略。
第六个「是否使用页面特定过场动画」功能介绍暂略。

useMagicKeys 工具

::: info 编辑者补充页面当前为空白，介绍暂略。 :::

useElectronWindowMouse

这里可以检测鼠标光标在电脑屏幕上的位置。

Displays

这里可以可视化鼠标光标在电脑屏幕上的位置。

widgets calling

译为「小组件调用」。

Context Flow

译为「上下文流程」。实时检查传入的上下文更新（服务器 + 广播）和传出的聊天钩子。使用此方法验证插件上下文（例如 VSCode 编码上下文）如何传入聊天管道并传出到服务器事件。

relative mouse

这里可以可视化鼠标光标在该窗口上的位置。

beat sync visualizer

译为「节拍同步可视化器」，即同步音律。

WebSocket Inspector

即「WebSocket 检查器」。

Plugin Host Debug

译为「插件主机调试」。

Updater

译为「更新程序」。

具体介绍暂略。

Screen Capture

译为「屏幕截图」。

如果你还没有授予系统级的屏幕捕获权限，那么首先会看到下图这样的权限提示窗口。完成授权后，才可以开始捕获任意应用程序窗口或者整个屏幕。

在最上方有四个选项：

「applications」——译为「应用程序」，可以选择捕获任意一个打开的应用程序的任意一个窗口，点击「share window」即可在页面最上方查看；将鼠标指针移动到捕获界面上点击「stop」即可停止捕获。
「displays」——可以捕获整个屏幕，点击「share screen」即可在页面最上方查看；将鼠标指针移动到捕获界面上点击「stop」即可停止捕获。
「devices」——译为「设备」，略。
「refetch」——译为「重新获取」，略。

vision capture

译为「视觉捕捉」。

如果还没有授予屏幕捕获权限，这里同样会先显示权限提示。完成授权后，才可以让该页面真正开始捕获画面并查看视觉处理结果。

写在最后——致·所有想参与说明书编写工作的朋友

该说明书作为一个主要由非官方人员编写但被提交到官方网站的文档，虽然通常由沐玖芸萱工作室成员负责内容维护，但是我们非常希望所有想编辑该文档或者已经编辑过该文档的朋友能在开头的作者位置留下您的名字，无论您做出的是内容上的改动还是格式上的改动，我们欢迎大家来一同丰富和优化该说明书，为Airi项目、为该说明书贡献一份来自任何人的自己的力量！

另外，如果作为非官方人员的您有改动该说明书的想法，您不需要有任何额外的顾虑，直接改动并提交Pull requests即可。不过再次提醒不要忘记留下您的名字哦！

感谢大家的支持与配合！

—— 凌柃

目录

第一章·安装

第二章·初步配置

第一项·先前准备

第二项·Airi 启动！

第三章·Airi 界面介绍

主窗口

系统托盘其他选项

设置界面

聊天窗口

第四章·设置

AIRI 角色卡

机体模块

意识

发声

听觉

视觉

Artistry

短期记忆

长期记忆

Discord

X / Twitter

我的世界（Minecraft）

异星工厂（Factorio）

MCP 服务器

同步音律

场景（Scenes）

角色模型

如果你选择的是 Live2D 模型

如果你选择的是 VRM 3D 模型

记忆体

服务来源

数据（Data）

连接

系统

通用

配色方案

窗口快捷方式

开发者

useMagicKeys 工具

useElectronWindowMouse

Displays

widgets calling

Context Flow

relative mouse

beat sync visualizer

WebSocket Inspector

Plugin Host Debug

Updater

Screen Capture

vision capture

写在最后——致·所有想参与说明书编写工作的朋友