Skip to content

78/xiaozhi-esp32

Repository files navigation

小智 AI 聊天机器人

这是虾哥的第一个硬件作品。

ESP32+SenseVoice+Qwen72B打造你的AI聊天伴侣!【bilibili】

手工打造你的 AI 女友,新手入门教程【bilibili】

项目目的

本项目基于乐鑫的 ESP-IDF 进行开发。

本项目是一个开源项目,主要用于教学目的。我们希望通过这个项目,能够帮助更多人入门 AI 硬件开发,了解如何将当下飞速发展的大语言模型应用到实际的硬件设备中。无论你是对 AI 感兴趣的学生,还是想要探索新技术的开发者,都可以通过这个项目获得宝贵的学习经验。

欢迎所有人参与到项目的开发和改进中来。如果你有任何想法或建议,请随时提出 issue 或加入群聊。

学习交流 QQ 群:692728912

已实现功能

  • Wi-Fi 配网
  • 支持 BOOT 键唤醒和打断
  • 离线语音唤醒(乐鑫方案)
  • 流式语音对话(WebSocket 或 UDP 协议)
  • 支持国语、粤语、英语、日语、韩语 5 种语言识别(SenseVoice 方案)
  • 声纹识别(识别是谁在喊 AI 的名字,3D Speaker 项目
  • 使用大模型 TTS(火山引擎与 CosyVoice 方案)
  • 支持可配置的提示词和音色(自定义角色)
  • Qwen2.5 72B 或 豆包 API
  • 支持每轮对话后自我总结,生成记忆体
  • 扩展液晶显示屏,显示信号强弱
  • 支持 ML307 Cat.1 4G 模块

硬件部分

为方便协作,目前所有硬件资料都放在飞书文档中:

《小智 AI 聊天机器人百科全书》

面包板接线图如下:

面包板接线图

固件部分

免开发环境烧录

新手第一次操作建议先不要搭建开发环境,直接使用免开发环境烧录的固件。固件使用的是作者友情提供的测试服,目前开放免费使用,请勿用于商业用途。

Flash烧录固件(无IDF开发环境)

开发环境

  • Cursor 或 VSCode
  • 安装 ESP-IDF 插件,选择 SDK 版本 5.3 或以上
  • Ubuntu 比 Windows 更好,编译速度快,也免去驱动问题的困扰

AI 角色配置

如果你已经拥有一个小智 AI 聊天机器人,可以参考 后台操作视频教程

详细的使用说明以及测试服的注意事项,请参考 小智测试服的帮助说明