原创 ~ 2025-09-03 19:10 北京
联系小编,获取项目源码
小智AI大模型英语学习机,文末联系小编获取项目源码
480万元,襄鸣示范基地智慧养鸡3D可视化数字孪生
4寸大屏小智AI大模型英语学习机,基于乐鑫esp32s3主控,支持AEC打断,支持DeepSeek、Qwen、豆包国内三大主流AI大模型接入,你的日常英语陪练,桌面日历,时间闹钟,天气预报。硬件开源项目:https://oshwhub.com/snail0815/4cun-da-ping-tian-qi-zhuo-mian-nao-zhong-bai-jian
小智AI 聊天机器人项目介绍
小智AI聊天机器人是一款基于乐鑫ESP32-S3核心板,搭载多种开源AI大模型( DeepSeek、OpenAI 、通义Qwen),通过对话角色自定义、海量知识库、长期记忆、语音声纹识别等功能。它不仅是智能工具,更是一个真正“懂你”的AI助理,致力于为每一天增添温暖和便利。无论是在解决问题还是分享快乐,小智AI聊天机器人都以独特的智慧和温柔的方式,使科技更加有温度,生活更美好。
通信协议
基于 xiaozhi-esp32 协议,通过 WebSocket 实现数据交互。
对话交互
支持唤醒对话、手动对话及实时打断。长时间无对话时自动休眠
多语言识别
支持国语、粤语、英语、日语、韩语(默认使用 FunASR)。
LLM 模块
支持灵活切换 LLM 模块,可选阿里通义Qwen、DeepSeek、OpenAI 等
TTS 模块
支持 EdgeTTS(默认)、火山引擎豆包 TTS 等多种 TTS 接口,满足语音合成需求。
小智AI聊天机器人服务端源码
xiaozhi-esp32-server 是由华南理工大学刘思源教授团队研发的开源后端服务项目,基于人机共生智能理论,为 xiaozhi-esp32 开源智能硬件提供支持。它采用 Python、Java、Vue 实现,支持 MCP 接入点和声纹识别等功能,提供最简化和全模块两种部署方式,适配多种配置方案,可满足不同场景下智能终端的软硬件协同需求。
服务端每个功能模块采用独立的目录,便于开发和维护,提高系统的可扩展性和可维护性。
asr-server+asr-worker:提供语音活动监测、语音转文本、说话人识别等服务;
tts-server:提供音色管理、音色克隆、语音合成等服务,对接本地部署的语音模型;
main-server:主服务,负责协调语音识别、大模型、语音合成等各种服务,并对接后端数据库。
小智AI 后台服务端功能清单
功能模块 | 描述 |
|---|---|
核心服务架构 | 基于WebSocket和HTTP服务器,提供完整的控制台管理和认证系统 |
语音交互系统 | 支持流式ASR(语音识别)、流式TTS(语音合成)、VAD(语音活动检测),支持多语言识别和语音处理 |
智能对话系统 | 支持多种LLM(大语言模型),实现智能对话 |
视觉感知系统 | 支持多种VLLM(视觉大模型),实现多模态交互 |
意图识别系统 | 支持LLM意图识别、Function Call函数调用,提供插件化意图处理机制 |
记忆系统 | 支持本地短期记忆、mem0ai接口记忆,具备记忆总结功能 |
工具调用 | 支持客户端IOT协议、客户MCP协议、服务端MCP协议、MCP接入点协议、自定义工具函数 |
管理后台 | 提供Web管理界面,支持用户管理、系统配置和设备管理 |
测试工具 | 提供性能测试工具、视觉模型测试工具和音频交互测试工具 |
部署支持 | 支持Docker部署和本地部署,提供完整的配置文件管理 |
插件系统 | 支持功能插件扩展、自定义插件开发和插件热加载 |
小智AI 服务端组件
LLM 语言模型:任何支持 openai 接口调用的 LLM 均可接入使用。
VLLM 视觉模型:任何支持 openai 接口调用的 VLLM 均可接入使用。
TTS 语音合成模块
ASR 语音识别模块
Memory 记忆存储模块
Intent 意图识别模块
如有IoT 源码采购和项目交付需求,请扫码联系小编,微信号: beacon0418
往期推荐
