1. 03 Dec, 2025 1 commit
    • LiangLiu's avatar
      multi-person & animate & podcast (#554) · f7cdbcb5
      LiangLiu authored
      
      
      - 服务化功能新增(前端+后端):
      1、seko-talk 模型支持多人输入
      2、支持播客合成与管理
      3、支持wan2.2 animate 模型
      
      - 后端接口新增:
      1、 基于火山的播客websocket合成接口,支持边合成边听
      2、播客的查询管理接口
      3、基于 yolo 的多人人脸检测接口
      4、音频多人切分接口
      
      - 推理代码侵入式修改
      1、将 animate 相关的 输入文件路径(mask/image/pose等)从固定写死的config中移除到可变的input_info中
      2、animate的预处理相关代码包装成接口供服务化使用
      
      @xinyiqin
      
      ---------
      Co-authored-by: default avatarqinxinyi <qxy118045534@163.com>
      f7cdbcb5
  2. 10 Oct, 2025 1 commit
  3. 29 Sep, 2025 1 commit
  4. 27 Sep, 2025 1 commit
  5. 06 Aug, 2025 1 commit
  6. 31 Jul, 2025 1 commit
  7. 30 Jul, 2025 1 commit
  8. 29 Jul, 2025 2 commits
  9. 01 Jul, 2025 1 commit
  10. 16 Jun, 2025 1 commit
  11. 08 May, 2025 1 commit
  12. 27 Apr, 2025 1 commit
  13. 24 Apr, 2025 1 commit
  14. 23 Apr, 2025 3 commits
  15. 22 Apr, 2025 1 commit
  16. 21 Apr, 2025 1 commit
  17. 20 Apr, 2025 1 commit
  18. 08 Apr, 2025 7 commits