面向卡拉 OK 直播场景的智能助手 —— 让直播从"靠感觉发挥"
升级为靠数据与 AI 决策驱动。
三人小组,互补型分工:需求定义、工程开发、质量验证三条链路紧密衔接,从概念到已上线产品全程贯通。
梳理卡拉 OK 直播业务场景、AI 加分点、页面优先级与答辩口径,保证开发围绕比赛主线推进。
负责全栈开发 —— Next.js 三端界面、Go 网关、Python AI Agent,Claude + Codex 辅助编码,从需求到 CI/CD 上线全流程。
围绕节目单、报表、点歌、SSE、风控与演示流程做功能测试与异常回归,保证线上系统稳定运行。
主播凭感觉排歌、复盘缺数据、互动无智能 —— SingX 用 AI 逐一击破,已上线 ktv.fycyf.xyz。
前端三端统一路由 · Go 网关承载实时流与鉴权 · Python AI Agent 10 大 LLM 端点
不同于常见的"先调 LLM、失败再降级",SingX 先用确定性算法产出高质量基线,再调 LLM 做语义增强 —— 即使 LLM 完全不可用,所有功能依然完整可用,答辩现场永远流畅。
fallback:true 标记,前端展示"算法生成"标识,用户无感切换fallback 字段标记来源,用户无法感知切换。自然语言操控系统,长按 AI 图标语音输入,松手自动转写并发送。支持上下文记忆,多轮对话。
CSS 变量驱动,300ms 全局过渡,配色、光效、弹幕速率随场景联动。
人声/伴奏独立音量,四种混响模式,实时升降调,混音参数 SSE 同步观众端。
可展开侧栏,实时流式展示 LLM 推理过程,让 AI 决策"看得见、说得清"。
GitHub Actions CI/CD 自动部署 · 阿里云 ESA 边缘加速 · ICP 备案 · 1Panel + Nginx 生产环境 —— push 即上线。
push 到 master 触发 GitHub Actions,SSH 到生产服务器,智能增量构建。
全站接入阿里云 Edge Security Acceleration,全球边缘节点缓存静态资源,API 请求就近回源。
1Panel 管理 PostgreSQL / Redis / Nginx,Docker host 网络模式,全栈 127.0.0.1 互连。
市面上同类方案常见局限 —— SingX 在架构深度、AI 集成、工程化三个维度做了本质区别。
| 维度 | 行业常见 | SingX |
|---|---|---|
| 后端语言 | 单语言 | Go + Python |
| 数据库 | SQLite/MySQL | PG+pgvector+Redis |
| AI 能力 | 关键词/单次 | 10端点·流式·三级 |
| 部署 | localhost | CI/CD+Docker+ESA |
| 安全防护 | 无 | 风控+WAF+审计 |
Next.js 16 + Go 1.26 + Python 3.12 + PostgreSQL 16 + Redis 7,全栈 LTS 稳定版本。已部署到 ktv.fycyf.xyz,经真实流量验证。
节目单从"拍脑袋"变"有依据";复盘从"看数字"变"拿建议";观众从"看客"变"参与者"。每个模块都有独立 AI 端点支撑。
Fallback-First 零宕机;CI/CD push 即上线;ESA 边缘加速 + DDoS 防护;Redis Streams 断线续推;分布式锁防重入。
主播端 / 观众端 / 管理端覆盖完整角色链路,10 种氛围主题,60+ 组件,SSE 实时事件流贯穿全链路。
| # | 功能 | 说明 | 流式 |
|---|---|---|---|
| 1 | AI 节目单生成 | 主题驱动 + 五因子加权评分 | 逐条 |
| 2 | 歌词情绪曲线 | 12 首歌情绪张力贝塞尔曲线可视化 | — |
| 3 | AI 串场词 | 曲间互动台词,深夜/演唱会双风格 | 逐字 |
| 4 | AI 报表点评 | 五维声线雷达 + LLM 评语 + 策略卡 | 逐字 |
| 5 | AI 献歌寄语 | LLM 多风格定制寄语 + 全屏弹幕 | 逐字 |
| 6 | 声线契合度 | MIDI 向量化 + 余弦匹配 + 音域偏移 | — |
| 7 | AI 演唱评分 | 音准/节奏/表现力三维实时打分 | — |
| 8 | AI 点歌推荐 | 声线画像 + 偏好智能推荐 | 逐条 |
| 9 | 全局对话助手 | 自然语言操控,语音长按输入 | 逐字 |
| 10 | 实时风控 | 敏感词拦截 + 刷屏检测 + 审计日志 | — |
Claude Opus 负责架构设计、代码审查与复杂逻辑;Codex 负责快速原型与重复性代码生成。
导师核心建议:功能要能现场跑通、技术要能实际部署、架构要能持续迭代。我们全部做到 —— 已上线运行。
减少主播操作步骤,观众长按 AI 图标语音输入,管理端一键审核。可拖拽面板系统,主播自定义布局。
SSE 逐字/逐条流式输出,用户感知延迟 < 500ms。推理过程打字机效果可视化,增强 AI 信任感。
LLM 超时 / Agent 容器不可达 / 网络异常 —— 全链路兜底,前端无感切换,零宕机保障。
五维雷达动态形变,情绪曲线贝塞尔渲染,24h 时段分布,下周热度趋势预测,全部实时数据驱动。
AI 编排 · AI 复盘 · AI 互动 —— 10 大 AI 端点、三端统一架构、CI/CD 自动部署、阿里云 ESA 边缘加速,已上线 ktv.fycyf.xyz。