1. 媒体识别(多模态)
APIAny - 接口帮助文档
  • 使用须知
  • Chat(聊天)
    • OpenAI
      • Chat Completions
        • Chat Completions - 基础对话
        • Chat Completions - 流式输出 (Stream)
        • Chat Completions - 多轮对话
        • Chat Completions - 视觉(图片理解)
      • Responses API
        • Responses - 基础文本生成
        • Responses - 多轮对话(messages 格式)
        • Responses - 流式输出 (Stream)
        • Responses - 视觉(图片 + 文本)
    • Gemini (Google AI)
      • 文本聊天
        • Gemini - 文本生成(generateContent)
        • Gemini - 文本生成流式(streamGenerateContent)
        • Gemini - 多轮对话(Chat)
      • 媒体识别(多模态)
        • Gemini - 图片理解(inlineData Base64)
          POST
        • Gemini - 图片理解(fileData 方式)
          POST
        • Gemini - 视频理解(fileData)
          POST
        • Gemini - 音频理解
          POST
        • Gemini Files API - 上传文件
          POST
    • Claude (Anthropic)
      • Messages API
        • Messages - 基础文本对话
        • Messages - 含 System Prompt
        • Messages - 多轮对话
        • Messages - 流式输出 (Stream)
        • Messages - 视觉(图片理解 Base64)
        • Messages - 视觉(图片理解 URL)
        • Messages - Tool Use(工具调用)
        • Messages - 统计 Token(Token Count)
      • 模型列表
        • 获取可用模型列表
  • Image(图像)
    • Gemini - 图像生成(文生图)
      POST
    • Gemini - 图像编辑(图生图)
      POST
  • Video(视频)
    • Jimeng
      • Create Video of File
      • Create Video of URL
      • Retrieve Video
  1. 媒体识别(多模态)

Gemini - 图片理解(inlineData Base64)

POST
/v1beta/models/gemini-2.0-flash:generateContent
Gemini 图片理解 - 使用 inlineData 传入 Base64 编码的图片

Request

Query Params

Header Params

Body Params application/json

Examples

Responses

🟢200
application/json
Body

Request Request Example
Shell
JavaScript
Java
Swift
curl --location -g --request POST 'https://newapi.mexxxxai.win/v1beta/models/gemini-2.0-flash:generateContent?key={{GEMINI_API_KEY}}' \
--header 'Content-Type: application/json' \
--data-raw '{
  "contents": [
    {
      "parts": [
        {"text": "请详细描述这张图片中的内容。"},
        {"inlineData": {"mimeType": "image/jpeg", "data": "<BASE64_ENCODED_IMAGE_DATA>"}}
      ]
    }
  ],
  "generationConfig": {"temperature": 0.4, "maxOutputTokens": 1024}
}'
Response Response Example
{
  "candidates": [
    {
      "content": {
        "parts": [
          {
            "text": "这张图片展示了一只可爱的橘猫,正悠闲地躺在阳光充足的窗台上。猫咪毛色为橙色和白色相间,眼睛半眯着,神态安详。窗外可以看到绿色的树木,室内光线明亮,整体画面温馨宁静。"
          }
        ],
        "role": "model"
      },
      "finishReason": "STOP",
      "index": 0,
      "safetyRatings": [
        {"category": "HARM_CATEGORY_SEXUALLY_EXPLICIT", "probability": "NEGLIGIBLE"},
        {"category": "HARM_CATEGORY_HATE_SPEECH", "probability": "NEGLIGIBLE"},
        {"category": "HARM_CATEGORY_HARASSMENT", "probability": "NEGLIGIBLE"},
        {"category": "HARM_CATEGORY_DANGEROUS_CONTENT", "probability": "NEGLIGIBLE"}
      ]
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 265,
    "candidatesTokenCount": 72,
    "totalTokenCount": 337
  }
}
Modified at 2026-04-02 11:32:32
Previous
Gemini - 多轮对话(Chat)
Next
Gemini - 图片理解(fileData 方式)
Built with