Skip to content

模型管理

模型管理是系统的核心模块, 用于统一维护模型能力、计费方式、权限范围和最终对外调用入口

适用角色

  • 管理员: 仅管理员可进入, 负责维护平台可用模型和统一计费规则

功能说明

  • 提供商与真实模型: 每个模型都归属于一个提供商, 并对应一个真实可调用的上游模型

  • 模型名称: 模型名称是系统内部统一对外的调用名称, 调用方只需要记住这一套名称即可

  • 模型类型: 可区分文本、绘图、识图、语音、向量、视频、多模态、通用等能力, 方便后续授权和筛选

  • 模型地址与模型路径: 可按实际情况覆盖默认地址和路径, 便于接入不同上游线路

模型列表页

  • 模型广场: 可用卡片方式浏览平台可用模型, 支持按关键字筛选, 并查看模型类型、提供商、计费方式和价格摘要

  • 模型信息复制: 在模型广场中可快速复制模型名称, 方便配置应用、分组或调用参数

  • 价格展示: 模型广场会展示常用输入、输出、读取、写入等价格信息, 需要完整价格时可进入详情继续查看

  • 计费规则: 支持按官方返回数据计费, 也支持按系统统一口径计费

  • 计费方式: 可按 Tokens 计费, 也可按次计费, 适合不同类型的商业方案

  • 多计费项: 支持文本、缓存、识图、图像、音频、视频、搜索等多种计费项自由组合

  • 服务层与模式计费: 支持按不同服务层、思考模式与非思考模式分别设置价格

  • 阶梯计费: 支持按用量区间配置不同文本价格, 适合做更细的套餐和商业定价

  • 时段计费: 支持按全天、工作日、周末或自定义时段设置不同折扣, 适合做峰谷价、活动价和限时优惠

  • 细分价格项: 支持按搜索、视频分辨率、图像分辨率等维度设置差异化价格, 适合更精细的商业定价

  • 请求与响应格式: 可分别设置请求格式和响应格式, 便于统一接入或按上游原生格式透传

模型计费配置

不同提供商的价格配置差异

  • 默认通用配置: 大多数兼容 OpenAI 标准的平台, 都可以按通用的文本、缓存、图像、音频、视频、搜索、按次等方式配置价格

  • OpenAI / Azure / Claude / DeepSeek / 豆包 / 通义千问 / 智谱 GLM 等常见平台

    • 更适合按文本、缓存、按次、时段折扣、阶梯计费等通用方式配置
    • 如果同一个模型既要做 Tokens 计费, 又要做按次计费, 也可以组合配置
  • Gemini / Google 系

    • 图像生成价格支持按不同分辨率方案细分配置
    • 更适合对不同输出尺寸分别定价
  • 火山引擎

    • 视频生成价格支持更多分辨率组合
    • 可区分不同视频输入场景做更细的价格配置, 更适合视频模型运营
  • Midjourney 类能力

    • 支持按不同动作分别配置价格, 例如绘图、放大、变换、重绘、变焦、换脸等
    • 适合把不同操作拆成独立收费项
  • 搜索类能力

    • 可按不同上下文档位分别配置价格
    • 适合对高上下文、低上下文等不同搜索模式区分收费
  • 识图 / 图像生成 / 视频生成

    • 这类能力可按模式、尺寸、清晰度等维度细分价格
    • 更适合多媒体模型做精细化商业定价
  • 公开范围: 模型可设置为公开或非公开, 决定是否能直接被授权给用户、分组或应用

  • 所属分组: 可把模型加入指定分组, 让分组统一控制模型权限

  • 默认参数与预设: 可设置 system 角色、提示词、流式能力和参数范围, 降低调用方传错参数的概率

  • 启用代理: 模型可绑定一个或多个模型代理, 通过轮询或权重方式分流请求

  • 模型转发: 可按关键字、内容长度、已用额度等条件自动切换到目标模型

  • 多模型转发: 支持固定转发或轮询转发多个目标模型, 适合做多线路分流和多模型兜底

  • 后备能力: 当当前模型或代理不可用时, 可自动切换到后备模型或后备代理, 保持服务连续性

模型转发与后备配置

管理用途

  • 统一维护模型名称、能力、价格和授权范围, 避免不同业务各自单独定价

  • 通过模型广场快速查找可用模型和价格信息, 降低用户选型成本

  • 给不同分组、会员和应用提供稳定一致的调用入口, 让前台调用名称保持不变

  • 可按 Tokens、按次、多计费项、阶梯区间、时段折扣等方式组合定价, 适合做标准套餐价、阶梯价、峰谷价和活动价

  • 可按服务层、思考模式、搜索、视频分辨率、图像分辨率等维度拆分价格, 更适合高低配模型混合运营

  • 方便后续做模型切换、扩容、线路分流和更灵活的商业化定价

智元 Fast API