1. 媒体识别(多模态)
APIAny - 接口帮助文档
  • 使用须知
  • Chat(聊天)
    • OpenAI
      • Chat Completions
        • Chat Completions - 基础对话
        • Chat Completions - 流式输出 (Stream)
        • Chat Completions - 多轮对话
        • Chat Completions - 视觉(图片理解)
      • Responses API
        • Responses - 基础文本生成
        • Responses - 多轮对话(messages 格式)
        • Responses - 流式输出 (Stream)
        • Responses - 视觉(图片 + 文本)
    • Gemini (Google AI)
      • 文本聊天
        • Gemini - 文本生成(generateContent)
        • Gemini - 文本生成流式(streamGenerateContent)
        • Gemini - 多轮对话(Chat)
      • 媒体识别(多模态)
        • Gemini - 图片理解(inlineData Base64)
          POST
        • Gemini - 图片理解(fileData 方式)
          POST
        • Gemini - 视频理解(fileData)
          POST
        • Gemini - 音频理解
          POST
        • Gemini Files API - 上传文件
          POST
    • Claude (Anthropic)
      • Messages API
        • Messages - 基础文本对话
        • Messages - 含 System Prompt
        • Messages - 多轮对话
        • Messages - 流式输出 (Stream)
        • Messages - 视觉(图片理解 Base64)
        • Messages - 视觉(图片理解 URL)
        • Messages - Tool Use(工具调用)
        • Messages - 统计 Token(Token Count)
      • 模型列表
        • 获取可用模型列表
  • Image(图像)
    • Gemini - 图像生成(文生图)
      POST
    • Gemini - 图像编辑(图生图)
      POST
  • Video(视频)
    • Jimeng
      • Create Video of File
      • Create Video of URL
      • Retrieve Video
  1. 媒体识别(多模态)

Gemini - 视频理解(fileData)

POST
/v1beta/models/gemini-2.0-flash:generateContent
Gemini 视频理解 - 通过 Files API 上传视频后使用 fileUri

Request

Query Params

Header Params

Body Params application/json

Examples

Responses

🟢200
application/json
Body

Request Request Example
Shell
JavaScript
Java
Swift
curl --location -g --request POST 'https://newapi.mexxxxai.win/v1beta/models/gemini-2.0-flash:generateContent?key={{GEMINI_API_KEY}}' \
--header 'Content-Type: application/json' \
--data-raw '{
  "contents": [
    {
      "parts": [
        {"fileData": {"mimeType": "video/mp4", "fileUri": "https://your-video-file-uri-from-files-api"}},
        {"text": "请描述这段视频的主要内容和关键时刻。"}
      ]
    }
  ],
  "generationConfig": {"temperature": 0.4, "maxOutputTokens": 2048}
}'
Response Response Example
{
  "candidates": [
    {
      "content": {
        "parts": [
          {
            "text": "这段视频时长约2分30秒,主要内容如下:\n\n**0:00-0:30** 开场介绍,展示了产品Logo和品牌标语。\n\n**0:30-1:20** 产品功能演示,展示了核心界面的操作流程,包括用户注册和主要功能模块。\n\n**1:20-2:00** 用户案例展示,通过3个真实用户的使用场景说明产品价值。\n\n**2:00-2:30** 结尾呼吁行动,显示下载链接和联系方式。\n\n整体风格专业,配乐轻快,旁白清晰。"
          }
        ],
        "role": "model"
      },
      "finishReason": "STOP",
      "index": 0
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 8420,
    "candidatesTokenCount": 136,
    "totalTokenCount": 8556
  }
}
Modified at 2026-04-02 11:32:32
Previous
Gemini - 图片理解(fileData 方式)
Next
Gemini - 音频理解
Built with