1. 媒体识别(多模态)
APIAny - 接口帮助文档
  • 使用须知
  • Chat(聊天)
    • OpenAI
      • Chat Completions
        • Chat Completions - 基础对话
        • Chat Completions - 流式输出 (Stream)
        • Chat Completions - 多轮对话
        • Chat Completions - 视觉(图片理解)
      • Responses API
        • Responses - 基础文本生成
        • Responses - 多轮对话(messages 格式)
        • Responses - 流式输出 (Stream)
        • Responses - 视觉(图片 + 文本)
    • Gemini (Google AI)
      • 文本聊天
        • Gemini - 文本生成(generateContent)
        • Gemini - 文本生成流式(streamGenerateContent)
        • Gemini - 多轮对话(Chat)
      • 媒体识别(多模态)
        • Gemini - 图片理解(inlineData Base64)
          POST
        • Gemini - 图片理解(fileData 方式)
          POST
        • Gemini - 视频理解(fileData)
          POST
        • Gemini - 音频理解
          POST
        • Gemini Files API - 上传文件
          POST
    • Claude (Anthropic)
      • Messages API
        • Messages - 基础文本对话
        • Messages - 含 System Prompt
        • Messages - 多轮对话
        • Messages - 流式输出 (Stream)
        • Messages - 视觉(图片理解 Base64)
        • Messages - 视觉(图片理解 URL)
        • Messages - Tool Use(工具调用)
        • Messages - 统计 Token(Token Count)
      • 模型列表
        • 获取可用模型列表
  • Image(图像)
    • Gemini - 图像生成(文生图)
      POST
    • Gemini - 图像编辑(图生图)
      POST
  • Video(视频)
    • Jimeng
      • Create Video of File
      • Create Video of URL
      • Retrieve Video
  1. 媒体识别(多模态)

Gemini Files API - 上传文件

POST
/upload/v1beta/files
Gemini Files API - 上传媒体文件,返回 fileUri 供后续识别接口使用(文件保留 48 小时)

Request

Query Params

Header Params

Body Params multipart/form-data

Responses

🟢200
application/json
Body

Request Request Example
Shell
JavaScript
Java
Swift
curl --location -g --request POST 'https://newapi.mexxxxai.win/upload/v1beta/files?key={{GEMINI_API_KEY}}' \
--header 'X-Goog-Upload-Protocol: multipart' \
--header 'X-Goog-Upload-Command: start, upload, finalize' \
--form 'metadata="{\"file\": {\"displayName\": \"my-media-file\"}}";type=application/json' \
--form 'file=@""'
Response Response Example
{
  "file": {
    "name": "files/abc123xyz",
    "displayName": "my-media-file",
    "mimeType": "image/jpeg",
    "sizeBytes": "204800",
    "createTime": "2026-04-02T08:00:00.000Z",
    "updateTime": "2026-04-02T08:00:00.000Z",
    "expirationTime": "2026-04-04T08:00:00.000Z",
    "sha256Hash": "YWJjZGVmMTIzNDU2Nzg5MA==",
    "uri": "https://generativelanguage.googleapis.com/v1beta/files/abc123xyz",
    "state": "ACTIVE"
  }
}
Modified at 2026-04-02 11:32:32
Previous
Gemini - 音频理解
Next
Messages - 基础文本对话
Built with