SingX · Project Review
01 / 13
SingX · 项目汇报 / Project Review

SingX

AI 编排 · AI 复盘 · AI 互动

面向卡拉 OK 直播场景的智能助手 —— 让直播从"靠感觉发挥"
升级为靠数据与 AI 决策驱动

Next.js 16 Go · Gin Python · FastAPI PostgreSQL · pgvector Redis Streams Claude · Codex
已上线 · ktv.fycyf.xyz
GitHub Actions CI/CD · 阿里云 ESA 边缘加速
SingX · Project Review
02 / 13
TEAM · 团队介绍
SingX

三层协作,从需求到上线

三人小组,互补型分工:需求定义、工程开发、质量验证三条链路紧密衔接,从概念到已上线产品全程贯通。

01 · DEFINE
需求层
姚鑫

梳理卡拉 OK 直播业务场景、AI 加分点、页面优先级与答辩口径,保证开发围绕比赛主线推进。

需求边界演示脚本评分锚点
02 · BUILD
开发层
陈雨钒

负责全栈开发 —— Next.js 三端界面、Go 网关、Python AI Agent,Claude + Codex 辅助编码,从需求到 CI/CD 上线全流程。

全栈开发CI/CDESA 部署
03 · VERIFY
测试层
黄彬彰

围绕节目单、报表、点歌、SSE、风控与演示流程做功能测试与异常回归,保证线上系统稳定运行。

功能测试异常回归线上验收
SingX · Project Review
03 / 13
PAIN POINTS · 课题说明
SingX

卡拉 OK 直播的三大困局

主播凭感觉排歌、复盘缺数据、互动无智能 —— SingX 用 AI 逐一击破,已上线 ktv.fycyf.xyz。

PAIN 01
节目编排靠直觉
主播选歌排曲依赖个人经验,无法根据主题、能量曲线、声音匹配度科学编排。排错一首歌,气氛可能直接掉线,观众流失无法挽回。
→ AI 节目单
主题驱动 + 五因子加权评分 + AI 选曲理由
PAIN 02
直播复盘靠感觉
下播后只有冷冰冰的数字报表,缺乏声域、情感、节奏等多维度量化分析,无法形成可执行的优化策略,每场直播都在重复犯同样的错。
→ AI 报表
五维声线雷达 + LLM 专业评语 + 策略卡
PAIN 03
观众互动形式单一
点歌无声音匹配建议、送出无情感表达、弹幕无实时安全防线。观众只是"看客"而非"参与者",打赏意愿低,直播间留不住人。
→ AI 互动
献歌寄语 + 声线契合 + 演唱评分 + 风控
SingX 的解法
非常直接
AI 节目单
主题驱动编排,3 秒内自动排歌
AI 报表
声线雷达图
AI 点歌
多风格寄语
AI 演唱台
实时音准追踪
AI 风控
实时拦截,微秒级热处理
SingX · Project Review
04 / 13
ARCHITECTURE · 系统架构
SingX

三层分离,真实数据流

前端三端统一路由 · Go 网关承载实时流与鉴权 · Python AI Agent 10 大 LLM 端点

FRONTEND
Next.js 16
React 19 · Zustand
主播端 /观众端 /audience管理端 /admin10 态视觉主题
GATEWAY
Go 1.26 · Gin
pgx · go-redis v9
SSE 推送弹幕转发风控拦截角色鉴权
AI AGENT
Python 3.12
FastAPI · DeepSeek V4
节目单+串场词报表评语献歌寄语声线+评分Fallback
DEPLOY
Docker
K8s · CI/CD
容器化部署自动扩缩容健康检查日志收集
DATA LAYER · 数据层
PostgreSQL 16
pgvector 向量检索 · golang-migrate · 审计日志
Redis 7
Streams · Pub/Sub · 缓存 · SingleFlight
MUSIC · 双源接入
网易云音乐
RSA-SHA256 签名 · 搜索/歌词/副歌
QQ 音乐
3DES 歌词解密 · 扫码登录
AI MODELS · 模型选型
生产 LLMDeepSeek V4 Flash
开发辅助Claude Opus · Codex
协议兼容OpenAI 兼容 API
SingX · Project Review
05 / 13
ENGINEERING · Fallback-First
SingX

反其道行之:先算后想

不同于常见的"先调 LLM、失败再降级",SingX 先用确定性算法产出高质量基线,再调 LLM 做语义增强 —— 即使 LLM 完全不可用,所有功能依然完整可用,答辩现场永远流畅。

L1
确定性算法基线
五因子评分 · MIDI 余弦匹配 · 歌词情绪标注 · 演唱音准采样 —— 纯算法即可产出完整结果
↓ LLM 可用时叠加语义增强(15s 超时保护)
L2
LLM 流式语义增强
DeepSeek V4 Flash 产出选曲理由、专业评语、定制寄语 —— SSE 逐字流式到前端
↓ Agent 不可达 / 超时 / 5xx 时
L3
纯算法模式
响应带 fallback:true 标记,前端展示"算法生成"标识,用户无感切换
降级触发场景
LLM 响应 > 15s超时切换
HTTP 5xx / 限流记录日志
Agent 容器不可达纯算法
返回格式异常解析兜底
DEMO_MODE=true零网络
降级路径同样走模拟流式输出,前端通过 fallback 字段标记来源,用户无法感知切换。
SingX · Project Review
06 / 13
HIGHLIGHTS · 项目亮点
SingX
AI 全局对话助手

自然语言操控系统,长按 AI 图标语音输入,松手自动转写并发送。支持上下文记忆,多轮对话。

主播:"今晚想唱怀旧歌" → 自动生成主题节目单
观众:"推荐一首适合表白的歌" → 声线契合度智能推荐
10 种视觉主题

CSS 变量驱动,300ms 全局过渡,配色、光效、弹幕速率随场景联动。

暖光
霓虹
深夜
派对
复古
海岸民谣墨韵国风摇滚燃夜星空独白雨夜疗愈
实时混音控制台

人声/伴奏独立音量,四种混响模式,实时升降调,混音参数 SSE 同步观众端。

四种混响
KTV / 录音棚 / 演唱会 / 浴室
升降调 ±6
AI 探测最优 pitch,一键自适应
声伴分离
独立音量滑块,实时调节比例
SSE 同步
观众端实时同步听感参数
AI 决策可视化

可展开侧栏,实时流式展示 LLM 推理过程,让 AI 决策"看得见、说得清"。

五因子加权柱状图
主题0%
能量0%
风格0%
代表作0%
音域0%
推理过程打字机效果
thinking/reasoning 实时流式呈现,置信度评分
SingX · Project Review
07 / 13
DEVOPS · 工程化与上线
SingX

从代码到已上线产品

GitHub Actions CI/CD 自动部署 · 阿里云 ESA 边缘加速 · ICP 备案 · 1Panel + Nginx 生产环境 —— push 即上线。

CI/CD 自动部署

push 到 master 触发 GitHub Actions,SSH 到生产服务器,智能增量构建。

git diff 检测 gateway / frontend / ai-agent
有变化的模块才 Docker 重建
host 网络模式,127.0.0.1 互连
健康检查验证 :8000 和 :8081
前端 pnpm build → rsync 到站点
阿里云 ESA 边缘加速

全站接入阿里云 Edge Security Acceleration,全球边缘节点缓存静态资源,API 请求就近回源。

静态资源边缘缓存,首屏 < 1s
API 请求 HTTPS 加密回源
Cookie 兜底鉴权(防止 CDN 剥离 header)
DDoS 防护 + WAF 规则
域名已备案,合规上线
生产环境架构

1Panel 管理 PostgreSQL / Redis / Nginx,Docker host 网络模式,全栈 127.0.0.1 互连。

Frontend (Nginx):443 (HTTPS)
Go Gateway:8081
AI Agent (FastAPI):8000
PostgreSQL 16:5432
Redis 7:6379
网易云 API:4000
SingX · Project Review
08 / 13
EDGE · 技术亮点与竞争优势
SingX

不只是能跑的 Demo

市面上同类方案常见局限 —— SingX 在架构深度、AI 集成、工程化三个维度做了本质区别。

架构深度
三语言分离 vs 单栈堆叠
常见方案:Express + SQLite 单栈,前端 Vue 一把梭,数据库选型不适合生产环境,单线程扛不住并发。
SingX:Go 网关扛高并发 + Python 做 AI 推理 + Next.js 三端统一路由。PostgreSQL + pgvector + Redis Streams。
AI 集成深度
真正 LLM 流式 vs 关键词正则
常见方案:AI = 简单关键词匹配 + 正则表达式,或者调一次 API 拿个文本就完事。没有流式、没有降级。
SingX:10 个独立 AI 端点,DeepSeek V4 实时流式输出,Fallback-First 三级降级,Claude + Codex 辅助开发。
工程化成熟度
已上线产品 vs localhost Demo
常见方案:npm start 跑在 localhost,没有 Docker、没有 CI/CD、没有生产部署,答辩完就没人用了。
SingX:GitHub Actions CI/CD 自动部署,阿里云 ESA 边缘加速,风控实时拦截 <2ms,域名已备案。
维度 行业常见 SingX
后端语言单语言Go + Python
数据库SQLite/MySQLPG+pgvector+Redis
AI 能力关键词/单次10端点·流式·三级
部署localhostCI/CD+Docker+ESA
安全防护风控+WAF+审计
SingX · Project Review
09 / 13
FEASIBILITY · 落地性论证
SingX

落地性论证

技术架构可行性
全栈 LTS · 已上线验证

Next.js 16 + Go 1.26 + Python 3.12 + PostgreSQL 16 + Redis 7,全栈 LTS 稳定版本。已部署到 ktv.fycyf.xyz,经真实流量验证。

Next.js 16React 19
Go 1.26Gin 网关
Python 3.12FastAPI
PostgreSQL 16pgvector
三大 AI 模块实用价值
编排 · 复盘 · 互动

节目单从"拍脑袋"变"有依据";复盘从"看数字"变"拿建议";观众从"看客"变"参与者"。每个模块都有独立 AI 端点支撑。

节目单生成 串场词 报表评语 献歌寄语 声线契合 演唱评分 点歌推荐 +3 更多
工程落地保障
零宕机 · 自动化 · 安全

Fallback-First 零宕机;CI/CD push 即上线;ESA 边缘加速 + DDoS 防护;Redis Streams 断线续推;分布式锁防重入。

Fallback-First 三级降级链
Redis Streams 断线续推
风控 <2ms 热拦截
GitHub Actions CI/CD 自动化
产品完整度
三端 + 10 主题 + 60 组件

主播端 / 观众端 / 管理端覆盖完整角色链路,10 种氛围主题,60+ 组件,SSE 实时事件流贯穿全链路。

3
终端
10
主题
60+
组件
SingX · Project Review
10 / 13
AI SUMMARY · 功能应用总结
SingX

10 大 AI 端点 + 辅助开发提效

#功能说明流式
1AI 节目单生成主题驱动 + 五因子加权评分逐条
2歌词情绪曲线12 首歌情绪张力贝塞尔曲线可视化
3AI 串场词曲间互动台词,深夜/演唱会双风格逐字
4AI 报表点评五维声线雷达 + LLM 评语 + 策略卡逐字
5AI 献歌寄语LLM 多风格定制寄语 + 全屏弹幕逐字
6声线契合度MIDI 向量化 + 余弦匹配 + 音域偏移
7AI 演唱评分音准/节奏/表现力三维实时打分
8AI 点歌推荐声线画像 + 偏好智能推荐逐条
9全局对话助手自然语言操控,语音长按输入逐字
10实时风控敏感词拦截 + 刷屏检测 + 审计日志
AI 辅助开发 · Claude + Codex
全程 AI 辅助编码

Claude Opus 负责架构设计、代码审查与复杂逻辑;Codex 负责快速原型与重复性代码生成。

60%
编码效率
80%
Bug 定位
50%
文档节省
迭代速度
SingX · Project Review
11 / 13
MENTOR · 导师沟通收获
SingX

可演示 · 可落地 · 可持续

导师核心建议:功能要能现场跑通、技术要能实际部署、架构要能持续迭代。我们全部做到 —— 已上线运行。

用户交互
优化三端操作流程

减少主播操作步骤,观众长按 AI 图标语音输入,管理端一键审核。可拖拽面板系统,主播自定义布局。

主播操作从 5 步减至 2 步
长按 AI 图标语音输入,松手即发送
可拖拽面板,主播自定义布局
AI 响应
流式首 Token 延迟优化

SSE 逐字/逐条流式输出,用户感知延迟 < 500ms。推理过程打字机效果可视化,增强 AI 信任感。

<500ms
首 Token 延迟
逐字流式
SSE 推送
异常处理
三级降级链全覆盖

LLM 超时 / Agent 容器不可达 / 网络异常 —— 全链路兜底,前端无感切换,零宕机保障。

L1 算法 L2 LLM L3 兜底
数据可视化
报表交互 + 情绪曲线

五维雷达动态形变,情绪曲线贝塞尔渲染,24h 时段分布,下周热度趋势预测,全部实时数据驱动。

五维雷达 情绪曲线 时段分布 趋势预测 实时数据驱动
SingX · Project Review
12 / 13
二维码
SingX · 让直播靠数据与 AI 决策驱动

Thank You

AI 编排 · AI 复盘 · AI 互动 —— 10 大 AI 端点、三端统一架构、CI/CD 自动部署、阿里云 ESA 边缘加速,已上线 ktv.fycyf.xyz。

已上线运行Fallback-First10 大 AI 端点CI/CD 自动部署ESA 边缘加速
10
AI 端点
3
终端覆盖
<2ms
风控拦截
24/7
已上线运行
SingX · Project Review
13 / 13