WAW-Agent

Identity & Emotion Intelligence API

面向人员身份识别、情绪识别的智能服务

W-Agent 聚焦人员身份识别、情绪识别、2D/3D关节点,融合人脸、步态、ReID 等特征,提供稳定的公网 API。开发者可以上传完整视频,或上传已经跟踪好的人形序列,快速得到可用于搜人、查人、比对、复核和业务分析的 JSON 结果。

接入流程

先用 Demo 跑通,再根据业务系统使用注册用户 API Key 模式接入。

STEP 1

注册账号

使用邮箱注册账号,登录后创建 API Key,并在业务系统中使用 API Key 调用接口。

STEP 2

上传数据

视频上传完整文件,序列上传有序图片帧;服务端保留任务和上传资产。

STEP 3

执行解析

视频异步处理并轮询状态;序列同步处理并立即返回结果。

STEP 4

获取结果

读取完整 JSON、特征向量、结构化属性、帧坐标和结果图片资产。

API 接入

提供面向开发者和 Agent 的公网 API。不同调用方式的鉴权和支付流程不同,但业务字段和结果结构保持一致,便于自动化系统直接解析、检索和比对。

解析序列示例

客户端请求

创建一个序列解析任务,告诉服务端本次会上传多少帧图片。

POST /v1/sequences
{
  "frame_count": 12
}

服务端返回

返回任务 ID 和每一帧图片对应的上传地址。

{
  "task_id": "seq_xxx",
  "uploads": [
    {"index": 0, "url": "/v1/sequences/seq_xxx/frames/0"},
    ...
  ]
}

客户端请求

客户端按 uploads 中的地址逐帧上传图片。

PUT /v1/sequences/seq_xxx/frames/0
Content-Type: image/jpeg

<binary image bytes>

服务端返回

确认当前帧已经上传成功。

{
  "uploaded": true
}

客户端请求

所有图片上传完成后,发起同步解析。

POST /v1/sequences/seq_xxx/parse
{
  "frame_count": 12
}

服务端返回

返回该序列的身份识别特征、结构化属性、姿态和情绪结果。

{
  "status": "succeeded",
  "result": {
    "sequence_id": "seq_xxx",
    "frame_count": 12,
    "gait_feature": [0.12, ...],
    "face_feature": [0.08, ...],
    "reid_feature": [0.31, ...],
    "reid_struct": {...},
    "pose_2ds": [...],
    "pose_3ds": [...],
    "emotion": "neutral"
  }
}

字段说明

  • frame_count 序列图片数量,用于计费和校验。
  • uploads[].url 每帧图片的上传地址。
  • gait_feature / face_feature / reid_feature 身份识别相关特征向量。
  • reid_struct / pose_2ds / pose_3ds / emotion 结构化属性、姿态和情绪识别结果。

计费方式

W-Agent 按实际处理量计费,注册用户从账户余额扣费。计费字段会出现在任务账单和使用记录中,便于系统自动对账。

解析视频
按视频帧数计费
获取视频结果
按序列个数 + 序列总帧数计费
解析序列
按 1 个序列 + 序列帧数计费
人体2D/3D关节点
按序列帧数单独计费
解析视频 上传完成后先按视频总帧数计费,金额 = 视频帧数 × 视频每千帧费用 / 1000。
获取视频结果 视频解析完成后,获取结果时再按识别出的序列个数和序列总帧数计费,金额 = 序列个数 × 每个序列费用 + 序列总帧数 × 序列每千帧费用 / 1000。
解析序列 序列接口同步返回结果,按 1 个序列和上传序列帧数一次性计费,金额 = 每个序列费用 + 序列帧数 × 序列每千帧费用 / 1000。
人体2D/3D关节点 人体2D/3D关节点是单独接口,按上传序列帧数独立计费,$0.10 / 千帧。

支付与调用方式

注册用户适合稳定业务接入,支持账号充值、API Key 调用和使用记录查询。

注册用户 邮箱注册、预充值、API Key 调用。计费和充值记录在用户中心查看。
匿名 Agent public API 返回 402 challenge,Agent 用钱包签名付款后重试请求。
x402 路线 匿名支付支持:Base / Polygon / Arbitrum 的 USDC、USDT,以及 Base 的 EURC。

Agent 接入

为自动化 Agent 提供稳定的机器可读说明文件,便于发现服务能力、接口、认证方式、支付方式和输出字段。

机器可读文件 /.well-known/w-agent.md
OpenAPI 规范 /openapi.json
MCP 接入 /mcp
MCP 调用边界 MCP task tools 面向注册用户 API Key;匿名 x402 付款走 public HTTP API 的 402 payment_context 流程。
能力摘要 支持视频解析、序列解析、身份识别特征、ReID 结构化属性和人体 2D/3D 关节点。
相似度计算 gait_feature、face_feature、reid_feature 同类型特征向量使用点积计算相似度。

下载调用 Demo

注册用户 Demo 提供 Python、C++、Go 示例,便于快速接入 API Key 调用。

注册用户 Demo

适合已注册、已充值并拥有 API Key 的用户。示例包含 Python、C++、Go 三种调用方式。

匿名调用 Demo

适合 Agent 不注册账号、通过 x402 自动支付后调用公开视频和序列解析接口。