1. 媒体识别(多模态)
APIAny - 接口帮助文档
  • 使用须知
  • Chat(聊天)
    • OpenAI
      • Chat Completions
        • Chat Completions - 基础对话
        • Chat Completions - 流式输出 (Stream)
        • Chat Completions - 多轮对话
        • Chat Completions - 视觉(图片理解)
      • Responses API
        • Responses - 基础文本生成
        • Responses - 多轮对话(messages 格式)
        • Responses - 流式输出 (Stream)
        • Responses - 视觉(图片 + 文本)
    • Gemini (Google AI)
      • 文本聊天
        • Gemini - 文本生成(generateContent)
        • Gemini - 文本生成流式(streamGenerateContent)
        • Gemini - 多轮对话(Chat)
      • 媒体识别(多模态)
        • Gemini - 图片理解(inlineData Base64)
          POST
        • Gemini - 图片理解(fileData 方式)
          POST
        • Gemini - 视频理解(fileData)
          POST
        • Gemini - 音频理解
          POST
        • Gemini Files API - 上传文件
          POST
    • Claude (Anthropic)
      • Messages API
        • Messages - 基础文本对话
        • Messages - 含 System Prompt
        • Messages - 多轮对话
        • Messages - 流式输出 (Stream)
        • Messages - 视觉(图片理解 Base64)
        • Messages - 视觉(图片理解 URL)
        • Messages - Tool Use(工具调用)
        • Messages - 统计 Token(Token Count)
      • 模型列表
        • 获取可用模型列表
  • Image(图像)
    • Gemini - 图像生成(文生图)
      POST
    • Gemini - 图像编辑(图生图)
      POST
  • Video(视频)
    • Jimeng
      • Create Video of File
      • Create Video of URL
      • Retrieve Video
  1. 媒体识别(多模态)

Gemini - 图片理解(fileData 方式)

POST
/v1beta/models/gemini-2.0-flash:generateContent
Gemini 图片理解 - 使用 Files API 上传后的 fileUri(适合大文件)

Request

Query Params

Header Params

Body Params application/json

Examples

Responses

🟢200
application/json
Body

Request Request Example
Shell
JavaScript
Java
Swift
curl --location -g --request POST 'https://newapi.mexxxxai.win/v1beta/models/gemini-2.0-flash:generateContent?key={{GEMINI_API_KEY}}' \
--header 'Content-Type: application/json' \
--data-raw '{
  "contents": [
    {
      "parts": [
        {"fileData": {"mimeType": "image/jpeg", "fileUri": "https://your-file-uri-from-files-api"}},
        {"text": "这张图片里有什么内容?"}
      ]
    }
  ],
  "generationConfig": {"temperature": 0.4, "maxOutputTokens": 1024}
}'
Response Response Example
{
  "candidates": [
    {
      "content": {
        "parts": [{"text": "图片显示了一张产品设计图,包含多个UI组件的布局示意图,主要以蓝色和白色为主色调,整体风格简洁现代。"}],
        "role": "model"
      },
      "finishReason": "STOP",
      "index": 0
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 270,
    "candidatesTokenCount": 38,
    "totalTokenCount": 308
  }
}
Modified at 2026-04-02 11:32:32
Previous
Gemini - 图片理解(inlineData Base64)
Next
Gemini - 视频理解(fileData)
Built with