main/boards/esp-box-3/README.md
ESP-BOX-3 是乐鑫官方开发的 AIoT 开发套件,搭载 ESP32-S3-WROOM-1 模组,配备 2.4 英寸 320x240 ILI9341 显示屏,双麦克风阵列,支持离线语音唤醒与设备端回声消除(AEC)功能。
配置编译目标为 ESP32S3
idf.py set-target esp32s3
打开 menuconfig 并配置
idf.py menuconfig
分别配置如下选项:
Xiaozhi Assistant → Board Type → 选择 ESP BOX 3ESP-BOX-3 支持多种不同的 UI 显示风格,通过 menuconfig 配置选择:
Xiaozhi Assistant → Select display style → 选择显示风格USE_EMOTE_MESSAGE_STYLEEmoteDisplay 表情显示系统emote::EmoteDisplay⚠️ 重要: 选择此风格需要额外配置自定义资源文件:
Xiaozhi Assistant → Flash Assets → 选择 Flash Custom AssetsXiaozhi Assistant → Custom Assets File → 填入资源文件地址:
https://dl.espressif.com/AE/wn9_nihaoxiaozhi_tts-font_puhui_common_20_4-esp-box-3.bin
USE_DEFAULT_MESSAGE_STYLE (默认)SpiLcdDisplayUSE_WECHAT_MESSAGE_STYLESpiLcdDisplayXiaozhi Assistant → Enable Device-Side AEC → 启用ESP-BOX-3 硬件支持设备端 AEC 功能,可有效消除扬声器播放声音对麦克风的干扰,提升语音识别准确率。
运行时切换: 双击 Boot 按键可在运行时开启/关闭 AEC 功能。
说明: 设备端 AEC 需要干净的扬声器输出参考路径和良好的麦克风与扬声器物理隔离才能正常工作。ESP-BOX-3 硬件已做优化设计。
ESP-BOX-3 支持多种唤醒词实现方式:
Xiaozhi Assistant → Wake Word Implementation Type → 选择唤醒词类型推荐选择:
USE_AFE_WAKE_WORD) - 支持 AEC 的唤醒词检测按 S 保存,按 Q 退出。
编译
idf.py build
烧录
将 ESP-BOX-3 连接至电脑,并运行:
idf.py flash
设备端 AEC 可以在本地实时消除扬声器播放声音对麦克风的干扰,在播放音乐或 TTS 回复时仍能准确识别语音指令。
请确保已经配置了正确的自定义资源文件地址,并且设备能够访问该 URL 下载资源。
长按 Boot 按键 3 秒以上,设备会清除所有配置并重启。