{"data":[{"id":"glm-4.7","name":"Z.ai: GLM 4.7","created":1774276587,"description":"GLM-4.7 是 Z.ai 最新一代旗舰模型，在两个关键方向上做了强化：更强的编程能力，以及更稳定的多步推理 / 执行表现。它在处理复杂 Agent 任务时有显著提升，同时对话体验更加自然流畅，前端呈现的观感也更加出色精致。","context_length":200000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"glm-5","name":"Z.ai: GLM 5","created":1774275743,"description":"GLM-5 是 Z.ai 打造的一款旗舰级开源基础模型，专为复杂系统设计与长链路 Agent 工作流而生。它面向资深开发者，在大规模编程任务上具备生产可用的稳定表现，已能正面比肩一线闭源模型。凭借更强的 Agent 级任务规划能力、深度后端推理，以及自我迭代纠错机制，GLM-5 不再只是“写代码”，而是完成从整体系统构建到自主执行的一整套工程闭环。","context_length":200000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"qwen3-max","name":"Qwen: Qwen3 Max","created":1774287535,"description":"Qwen3-Max 是基于 Qwen3 系列迭代升级的版本，相较 2025 年 1 月版，在推理能力、指令跟随、多语种支持以及长尾知识覆盖上都有显著提升。它在数学、编码、逻辑和科学任务上的准确率更高，对中英文复杂指令的执行更加稳定可靠，幻觉大幅减少，在开放式问答、写作和对话等场景中能产出质量更高的回复。该模型支持 100 多种语言，在翻译和常识推理方面更强，并针对检索增强生成（RAG）和工具调用做了专门优化，不过并不提供独立的「思维（thinking）」模式。","context_length":256000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"deepseek-v3.2","name":"DeepSeek: DeepSeek V3.2","created":1774283167,"description":"DeepSeek-V3.2 是一款旨在在算力效率与强悍推理、智能工具使用能力之间取得极致平衡的大语言模型。它引入了 DeepSeek Sparse Attention（DSA）这一精细化稀疏注意力机制，大幅降低训练与推理成本的同时，在长上下文场景中依然保持输出质量。  在此基础上，DeepSeek-V3.2 又叠加了可扩展的强化学习后训练框架，进一步打磨推理能力，其整体表现被定位在 GPT-5 级别，并已在 2025 年 IMO 和 IOI 赛事中取得“金牌”级成绩。  同时，V3.2 还借助大规模的“智能体任务合成”流水线，把推理能力深度嵌入到工具调用与 Agent 场景中，在交互式环境里显著提升了合规性与泛化表现，让模型在实际应用中更像一位思路清晰、动作老练的智能合作者。","context_length":128000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"minimax-m2.5","name":"MiniMax: MiniMax M2.5","created":1774202595,"description":"MiniMax-M2.5 是一款专为真实工作场景打造的最先进大语言模型。该模型在多样化的复杂真实世界数字工作环境中进行训练，在 M2.1 编码专长的基础上拓展至通用办公领域，能够流畅生成和操作 Word、Excel 及 PowerPoint 文件，在不同软件环境间进行上下文切换，并协同各类智能体与人类团队开展工作。M2.5 在 SWE-Bench Verified 上取得 80.2% 的得分，在 Multi-SWE-Bench 上得分 51.3%，在 BrowseComp 上得分 76.3%，同时相比前代模型具有更高的令牌效率，其训练过程优化了基于规划的行动与输出能力。","context_length":200000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"minimax-m2.7","name":"MiniMax: MiniMax M2.7","created":1774255697,"description":"MiniMax-M2.7 是专为自主执行、真实场景生产力与持续优化而设计的下一代大语言模型。该模型深度参与自身进化进程，通过多智能体协同机制集成先进智能体能力，可在动态环境中完成复杂任务的规划、执行与精调。  该模型以生产级性能为训练目标，能够处理实时调试、根因分析、财务建模及跨 Word、Excel 与 PowerPoint 的全文档生成等工作流。其在基准测试中表现优异：SWE-Pro 得分 56.2%，Terminal Bench 2 得分 57.0%，并在 GDPval-AA 上取得 1495 ELO 评分，为面向真实世界数字工作流的多智能体系统树立了全新标杆。","context_length":200000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"kimi-k2.5","name":"MoonshotAI: Kimi K2.5","created":1774282631,"description":"Kimi K2.5 是 Moonshot AI 打造的原生多模态大模型，在视觉编程能力和自驱动代理群（agent swarm）范式上处于业界领先水准。它基于 Kimi K2 架构，在约 15 万亿混合图文 Token 上持续预训练而成，在通用推理、视觉编码，以及具备代理能力的工具调用等方面，都展现出极为出色的表现。","context_length":256000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"glm-4.5-air","name":"Z.ai: GLM 4.5 Air","created":1774841031,"description":"GLM-4.5-Air 是我们最新旗舰模型家族中的轻量级成员，同样为智能体场景量身打造。和 GLM-4.5 一样，它采用 Mixture-of-Experts（MoE，专家混合）架构，但参数规模更加紧凑精炼。GLM-4.5-Air 支持混合推理模式，既有面向高级推理与工具调用的「思考模式」，也有用于实时交互的「非思考模式」。用户可以通过一个名为 ‎⁠reasoning⁠ ‎⁠enabled⁠ 的布尔开关，自主控制模型是否进入推理状态。","context_length":128000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"glm-4.6v","name":"Z.ai: GLM 4.6V","created":1774844268,"description":"GLM-4.6V 是一款面向多模态场景的大模型，专注于高精度的视觉理解，以及在图像、文档和多媒体混合内容上的长上下文推理能力。它支持最长 128K 的上下文窗口，能够将复杂的页面排版和图表直接作为视觉输入进行解析，并原生融合多模态函数调用，将「看懂世界」与「驱动工具」无缝衔接。 在生成层面，它还支持图文交错输出与界面重建等工作流，例如将截图还原为 HTML 页面，以及对界面进行多轮、可视化的迭代编辑。","context_length":128000,"supported_protocols":["openai:chat-completions"]},{"id":"deepseek-ocr-2","name":"DeepSeek: DeepSeek OCR 2","created":1774845774,"description":"DeepSeek-OCR 2 是 DeepSeek-OCR 的后续工作，用于探索一种新的编码器 DeepEncoder V2 的可行性：它能够根据图像语义对视觉 token 进行动态重排，从而在进入大语言模型（LLM）进行内容理解之前，以更符合语义结构的顺序组织视觉信息。相较于传统视觉语言模型通常以固定的「自左上到右下」栅格顺序处理视觉 token、并采用固定位置编码的方式，DeepEncoder V2 借鉴人类视觉在复杂版式场景下的「语义连贯、带因果线索的序列化处理」机制，尝试让编码器具备因果推理能力，以更智能地服务于后续的文本/结构恢复与理解。","context_length":8000,"supported_protocols":["openai:chat-completions"]},{"id":"step-3.5-flash","name":"StepFun: Step 3.5 Flash","created":1775578310,"description":"Step 3.5 Flash 是 StepFun 迄今最强大的开源基础模型。它基于稀疏专家混合（Mixture of Experts, MoE）架构构建，每个 token 只会激活 1960 亿参数中的 110 亿。作为一款侧重推理的模型，它即便在超长上下文下，依然能保持惊人的速度与效率。","context_length":256000,"supported_protocols":["openai:chat-completions"]},{"id":"seed-2.0-pro","name":"ByteDance Seed: Seed-2.0-Pro","created":1774948852,"description":"旗舰级全能通用模型，面向 Agent 时代的复杂推理与长链路任务执行场景。强调多模态理解、长上下文推理、结构化生成与工具增强执行。复杂指令与多约束执行能力突出，可稳定应对多步复杂规划、复杂图文推理、视频内容理解与高难度分析等场景。","context_length":256000,"supported_protocols":["openai:chat-completions"]},{"id":"seed-2.0-lite","name":"ByteDance Seed: Seed-2.0-Lite","created":1774952831,"description":"面向高频企业场景兼顾性能与成本的均衡型模型，综合能力超越上一代Doubao-Seed-1.8。胜任非结构化信息处理、内容创作、搜索推荐、数据分析等生产型工作，支持长上下文、多源信息融合、多步指令执行与高保真结构化输出。在保障稳定效果的同时显著优化成本。","context_length":256000,"supported_protocols":["openai:chat-completions"]},{"id":"seed-2.0-mini","name":"ByteDance Seed: Seed-2.0-Mini","created":1774953794,"description":"面向低时延、高并发与成本敏感场景，提供极致的模型推理速度。模型效果与Doubao-Seed-1.6相当。支持256k上下文、4档思考长度和多模态理解，适合成本和速度优先的轻量级任务。","context_length":256000,"supported_protocols":["openai:chat-completions"]},{"id":"glm-5v-turbo","name":"Z.ai: GLM 5V Turbo","created":1775659659,"description":"多模态 Coding 模型：将多模态理解与 Coding 能力深度融入模型架构，上下文提升至 200K，针对视觉编程与龙虾类 Agent 任务进行专项优化。","context_length":202752,"supported_protocols":["openai:chat-completions"]},{"id":"seedream-5.0-lite","name":"ByteDance Seed: Seedream 5.0 lite","created":1774502790,"description":"Seedream-5.0-lite 是字节跳动最新推出的图像生成模型。它首次集成了在线检索能力，能够引入实时网页信息，从而提升生成图像的时效性。同时，模型整体智能水平进一步升级，能够更加精准地理解复杂指令和视觉内容。此外，模型在世界知识广度、参考元素的一致性，以及各类专业场景下的生成质量方面也全面增强，更好地满足企业级视觉创作的需求。","context_length":0,"supported_protocols":["ark:image-generations","openai:image-generations"]},{"id":"qwen3.6-max-preview","name":"Qwen: Qwen3.6 Max Preview","created":1777357643,"description":"Qwen3.6-Max-Preview 是阿里云推出的一款前沿级闭源大模型，采用稀疏专家混合（MoE）架构，总参数规模约 1 万亿。它特别针对智能体式编码、工具调用以及长上下文推理进行了深度优化，原生支持 262K 令牌的超长上下文窗口。  该模型内置“思维模式”，可以在多轮对话中保留完整的推理轨迹，并天然支持结构化输出与函数调用。","context_length":262144,"supported_protocols":["openai:chat-completions"]},{"id":"glm-5.1","name":"Z.ai: GLM 5.1","created":1775579873,"description":"GLM-5.1 在代码能力上实现了质的飞跃，尤其擅长处理长链路任务。不同于以往围绕“几分钟交互”构建的模型，GLM-5.1 能够在单一任务上独立持续工作超过 8 小时，在此过程中自主规划、执行并不断自我改进，最终产出完整且符合工程标准的成果。","context_length":202752,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"qwen3-vl-plus","name":"Qwen: Qwen3 VL Plus","created":1775755658,"description":"Qwen3 系列视觉理解模型，实现思考模式和非思考模式的有效融合，视觉智能体能力在OS World等公开测试集上达到世界顶尖水平。此版本在视觉coding、空间感知、多模态思考等方向全面升级；视觉感知与识别能力大幅提升，支持超长视频理解。","context_length":256000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"glm-ocr","name":"Z.ai: GLM-OCR","created":1776779484,"description":"小尺寸高精度文档解析模型，支持PDF/图片输入，输出结构化Markdown，0.9B参数","context_length":128000,"supported_protocols":["zai:layout-parsing"]},{"id":"qwen-text-embedding-v4","name":"Qwen: Text Embedding V4","created":1776847626,"description":"通义实验室基于Qwen3训练的多语言文本统一向量模型，相较V3版本在文本检索、聚类、分类性能大幅提升；在MTEB多语言、中英、Code检索等评测任务上效果提升15%~40%；支持64~2048维用户自定义向量维度。","context_length":8000,"supported_protocols":["openai:embeddings"]},{"id":"kimi-k2.6","name":"MoonshotAI: Kimi K2.6","created":1776770069,"description":"Kimi K2.6 是 Moonshot AI 打造的下一代多模态大模型，专为长链路编程、代码驱动的 UI/UX 生成，以及多智能体编排而生。它可以跨 Python、Rust、Go 等多种语言，完成复杂的端到端开发任务，并将文本提示和视觉输入一并“熬制”成可直接上线的产品级界面。其“智能体蜂群”架构最多可并行调度数百个子智能体，自动拆解任务，在无需人工干预的情况下，一次性产出文档、网站、表格等完整成果。","context_length":262144,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"deepseek-v4-pro","name":"DeepSeek: DeepSeek V4 Pro","created":1777005065,"description":"DeepSeek-V4 拥有百万字超长上下文，在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。Agent 能力大幅提高：相比前代模型，DeepSeek-V4-Pro 的 Agent 能力显著增强。在 Agentic Coding 评测中，V4-Pro 已达到当前开源模型最佳水平，并在其他 Agent 相关评测中同样表现优异。目前 DeepSeek-V4 已成为公司内部员工使用的 Agentic Coding 模型，据评测反馈使用体验优于 Sonnet 4.5，交付质量接近 Opus 4.6 非思考模式，但仍与 Opus 4.6 思考模式存在一定差距。  丰富的世界知识：DeepSeek-V4-Pro 在世界知识测评中，大幅领先其他开源模型，仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。  世界顶级推理性能：在数学、STEM、竞赛型代码的测评中，DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型，取得了比肩世界顶级闭源模型的优异成绩。","context_length":1048576,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"ernie-image","name":"Baidu: ERNIE Image","created":1776765151,"description":"ERNIE-Image 是由百度 ERNIE-Image 团队研发的一款开放式文生图模型。它基于单流式 Diffusion Transformer（DiT）架构，并配备了一个轻量级的 Prompt 增强模块，可以把用户寥寥数语的输入，扩展成更为丰富、结构化的描述。仅凭区区 80 亿 DiT 参数，它就在开源文生图模型中达到了业界领先的表现。  这款模型追求的，不只是图像的视觉质感，更是生成过程中的可控性——在很多实际应用场景里，内容是否准确实现，往往与审美效果同等重要。尤其在复杂指令跟随、文字排版渲染以及结构化图像生成方面，ERNIE-Image 表现出色，非常适合用于商业海报、漫画、多宫格排版等既讲究画面质量、又要求结构精确的内容创作任务。  在风格表现上，它覆盖的谱系相当宽泛：既能呈现逼真的摄影风格，也能生成偏设计感的图像，还能塑造更具个人气质的艺术化画面，从柔和通透到电影感十足，都能信手拈来。","context_length":65536,"supported_protocols":["openai:image-generations"]},{"id":"qwen3-8b","name":"Qwen: Qwen3 8B","created":1776875316,"description":"Qwen3-8B 是 Qwen3 系列中的一款 82 亿参数致密因果语言模型，既擅长重度推理任务，也兼顾高效对话。它支持在「思维模式」与「常规模式」之间无缝切换——前者用于数学、编程与逻辑推演，后者用于日常交流与泛用对话。模型针对指令跟随、Agent 集成、创意写作进行了精调，并原生支持 100+ 种语言与方言的多语种场景。其上下文窗口原生可达 32K tokens，并可借助 YaRN 扩展至 131K tokens。","context_length":40960,"supported_protocols":["openai:chat-completions"]},{"id":"qwen3.5-plus","name":"Qwen: Qwen3.5 Plus","created":1776875619,"description":"Qwen3.5原生视觉语言系列Plus模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。在多项任务评测中，3.5系列均展现出与当前顶尖前沿模型相媲美的卓越性能，模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步。  该模型版本功能等同于快照模型qwen3.5-plus-2026-02-15","context_length":1000000,"supported_protocols":["openai:chat-completions"]},{"id":"qwen3.5-flash","name":"Qwen: Qwen3.5 Flash","created":1776875707,"description":"Qwen3.5原生视觉语言系列Flash模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步；响应速度快，兼具推理速度和性能。","context_length":1000000,"supported_protocols":["openai:chat-completions"]},{"id":"happyhorse-1.0-video-edit","name":"Alibaba: HappyHorse 1.0 Video Edit","created":1777301484,"description":"支持输入视频与参考图，结合文本指令完成风格变换、局部替换等编辑任务。","context_length":0,"supported_protocols":["happyhorse:video-synthesis"]},{"id":"happyhorse-1.0-i2v","name":"Alibaba: HappyHorse 1.0 Image To Video","created":1777298799,"description":"HappyHorse 图生视频模型，支持 720P/1080P，3-15 秒","context_length":0,"supported_protocols":["happyhorse:video-synthesis"]},{"id":"happyhorse-1.0-t2v","name":"Alibaba: HappyHorse 1.0 Text To Video","created":1777293973,"description":"HappyHorse 文生视频模型，支持 720P/1080P，3-15 秒","context_length":0,"supported_protocols":["happyhorse:video-synthesis"]},{"id":"happyhorse-1.0-r2v","name":"Alibaba: HappyHorse 1.0 Reference To Video","created":1777301168,"description":"支持传入多张参考图像，通过文本提示词描述场景，将图像中的主体角色融合生成一段流畅的视频。","context_length":0,"supported_protocols":["happyhorse:video-synthesis"]},{"id":"qwen3.6-plus","name":"Qwen: Qwen3.6 Plus","created":1777361318,"description":"Qwen 3.6 Plus 基于一种混合式架构，将高效的线性注意力与稀疏专家混合（MoE）路由相结合，在可扩展性和推理性能之间取得了强有力的平衡。相较 3.5 系列，它在智能体式编码、前端开发和整体推理能力上都有显著提升，带来更加顺滑、得心应手的「vibe coding」体验。  这款模型擅长处理 3D 场景、游戏开发以及仓库级别的代码问题求解，并在 SWE-bench Verified 基准上拿下 78.8 的成绩。无论纯文本任务还是多模态任务，它都实现了大幅跃升，整体表现已站在当前一流水平模型的行列之中。","context_length":1000000,"supported_protocols":["openai:chat-completions"]},{"id":"mimo-v2.5","name":"Xiaomi: MiMo-V2.5","created":1777363331,"description":"MiMo-V2.5 是小米自研的原生全模态大模型，在智能体场景下具备旗舰水准的综合能力，却只需约一半推理成本。相比 MiMo-V2-Omni，它在图像、视频等多模态理解任务上的感知能力全面提升。它提供最高 100 万上下文窗口，可在单次推理中容纳整份文档、超长对话与复杂任务上下文，非常适合集成进各类智能体框架，在同时追求强推理力、丰富感知和成本效率的场景中发挥作用。","context_length":1048576,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"mimo-v2-omni","name":"Xiaomi: MiMo-V2-Omni","created":1777363394,"description":"MiMo-V2-Omni 是一款站在多模态前沿的通用模型，能够在统一架构下原生处理图像、视频和音频等输入。它将强大的多模态感知与智能体能力相融合——既能进行视觉锚定、多步规划，又支持工具调用与代码执行，非常适合处理跨模态的复杂真实世界任务，并提供 256K 级上下文窗口作为支撑。","context_length":262144,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"mimo-v2.5-pro","name":"Xiaomi: MiMo-V2.5-Pro","created":1777363245,"description":"MiMo-V2.5-Pro 是小米的旗舰大模型，在通用智能体能力、复杂软件工程以及长周期任务上表现强劲，在 ClawEval、GDPVal 和 SWE-bench Pro 等基准测试中名列前茅。它能够独立而自主地完成专业级任务，这类任务在人类专家手中往往需要耗费数天甚至数周，并且过程中可能涉及上千次工具调用。  它支持最高约 100 万上下文长度，非常适合嵌入各类智能体框架之中，作为大体量任务编排与执行的核心引擎来使用。","context_length":1048576,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"seedance-2.0-fast","name":"ByteDance: Seedance 2.0 Fast","created":1778573228,"description":"Seedance 2.0 fast是豆包大模型团队推出的新一代多模态视频创作模型，它继承了Seedance 2.0模型的核心功能和优势，生成速度更快。","context_length":0,"supported_protocols":["seedance:generations"]},{"id":"unifuncs-s3","name":"UniFuncs: Deep Search S3","created":1778471700,"description":"S3 是 UniFuncs 推出的新一代深度搜索模型，可以在互联网中高速、准确、全面地搜索任何信息。更多参数与用法请查看：https://unifuncs.com/api/deepsearch","context_length":200000,"supported_protocols":["openai:chat-completions"]},{"id":"unifuncs-u3","name":"UniFuncs: Deep Research U3","created":1778471936,"description":"U3 是 UniFuncs 提供的深度研究模型，主打“深度研究 / 万字报告”能力。它通过 API 形式提供服务，兼容 OpenAI ‎`chat/completions` 协议，可选是否流式返回，支持通过参数设置研究深度（Max Depth，文档建议 25 轮为最佳）、引用格式（link / character / hidden）、输出体裁（report、summary、各类文章形态等）、搜索域白名单与黑名单，以及是否先生成研究计划（Plan Approval）等。更多参数与用法请查看：https://unifuncs.com/api/deepresearch","context_length":200000,"supported_protocols":["openai:chat-completions"]},{"id":"qianfan-ipcharacter","name":" Baidu: Qianfan-IPCharacter","created":1778943265,"description":"超拟人角色扮演模型，具备高智商表现与海量知识储备。模型基于超过2万亿tokens的高质量多源对话数据训练，融合影视剧、综艺、社交互动等真实语料，实现对人类情感和行为的深度模拟。在多重角色设定下保持高度一致性，响应延迟低于500ms。强大的泛化能力使其可适配情感陪伴、游戏陪玩、剧情推动、客服等多类场景，确保安全可控的内容生成。","context_length":16000,"supported_protocols":["openai:chat-completions"]},{"id":"mimo-v2-pro","name":"Xiaomi: MiMo-V2-Pro","created":1778944660,"description":"MiMo-V2-Pro 是小米打造的旗舰级基础模型，整体参数规模超 1 万亿，支持最长 100 万上下文，针对各类 Agent 场景做了深度优化。它可以无缝适配 OpenClaw 等通用智能体框架，在标准的 PinchBench 与 ClawBench 基准测试中均处于全球第一梯队，实际体验已相当逼近 Opus 4.6。MiMo-V2-Pro 被设计为智能体系统的「中枢大脑」，能够编排复杂工作流，驱动生产级工程任务，并稳定产出可托付的结果。","context_length":256000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"seedance-2.0","name":"ByteDance: Seedance 2.0","created":1778141389,"description":"Seedance 2.0 是字节跳动的视频生成模型。支持文生视频、图生视频（含首尾帧控制）和多模态参考生视频。在角色一致性、视觉风格保持和参考素材的镜头运动还原方面表现突出。","context_length":0,"supported_protocols":["seedance:generations"]},{"id":"jina-embeddings-v2-base-zh","name":"JinaAI: Jina Embeddings V2 Base ZH","created":1776767392,"description":"模型介绍 jina-embeddings-v2 系列是 JINA AI 自主研发的第二代 Embedding 系列模型。  模型亮点 jina-embeddings-v2-base-zh 是支持中英双语的文本向量模型，支持长达 8192 字符的文本编码。该模型的研发基于 BERT 架构(JinaBERT)，JinaBERT 是在 BERT 架构基础上的改进，首次将 ALiBi 应用到编码器架构中以支持更长的序列。 不同于以往的单语言/多语言向量模型，该模型设计双语模型来更好的支持单语言（中搜中）以及跨语言（中搜英）文档检索。","context_length":8000,"supported_protocols":["openai:embeddings"]},{"id":"deepseek-chat-v3-0324","name":"DeepSeek: DeepSeek V3 0324","created":1779700339,"description":"DeepSeek-V3 是一款自研的 Mixture-of-Experts（MoE）大模型，拥有 6710 亿参数、每次推理激活 370 亿参数，基于 14.8 万亿 Token 进行预训练，在长文本理解与生成、代码、数学推理、通识百科以及中文能力等方面都有出色表现。","context_length":128000,"supported_protocols":["openai:chat-completions"]},{"id":"seedance-2.0-fast:save","name":"ByteDance: Seedance 2.0 Fast (Save)","created":1779792201,"description":"Seedance 2.0 fast是豆包大模型团队推出的新一代多模态视频创作模型，它继承了Seedance 2.0模型的核心功能和优势，生成速度更快。","context_length":0,"supported_protocols":["seedance:generations"]},{"id":"mimo-v2.5-tts","name":"Xiaomi: MiMo-V2.5-TTS","created":1779716484,"description":"MiMo-V2.5-TTS 系列是一款面向多场景语音创作的高品质文本转语音模型。内置多种精品音色，支持精细控制语速、情绪与语气，适配有声书、短视频配音、虚拟主播等应用。  模型支持一句话快速生成全新音色，并提供基于少量样本的高保真音色克隆能力，在保证音色特征一致性的同时，具备良好的泛化与稳定性。完整调用文档请查阅：https://platform.xiaomimimo.com/docs/zh-CN/usage-guide/speech-synthesis-v2.5","context_length":8000,"supported_protocols":["openai:chat-completions"]},{"id":"mimo-v2.5-tts-voicedesign","name":"Xiaomi: MiMo-V2.5-TTS-VoiceDesign","created":1779725463,"description":"MiMo-V2.5-TTS-VoiceDesign： 一句话快速定义并生成全新音色，让音色创作更直观、更高效。MiMo-V2.5-TTS 系列是一款面向多场景语音创作的高品质文本转语音模型。内置多种精品音色，支持精细控制语速、情绪与语气，适配有声书、短视频配音、虚拟主播等应用。 模型支持一句话快速生成全新音色，并提供基于少量样本的高保真音色克隆能力，在保证音色特征一致性的同时，具备良好的泛化与稳定性。完整调用文档请查阅：https://platform.xiaomimimo.com/docs/zh-CN/usage-guide/speech-synthesis-v2.5","context_length":8000,"supported_protocols":["openai:chat-completions"]},{"id":"mimo-v2.5-tts-voiceclone","name":"Xiaomi: MiMo-V2.5-TTS-VoiceClone","created":1779725533,"description":"MiMo-V2.5-TTS-VoiceClone： 少量样本高保真复刻目标音色，同时保持稳定的风格指令遵循与音频标签控制能力。MiMo-V2.5-TTS 系列是一款面向多场景语音创作的高品质文本转语音模型。内置多种精品音色，支持精细控制语速、情绪与语气，适配有声书、短视频配音、虚拟主播等应用。 模型支持一句话快速生成全新音色，并提供基于少量样本的高保真音色克隆能力，在保证音色特征一致性的同时，具备良好的泛化与稳定性。完整调用文档请查阅：https://platform.xiaomimimo.com/docs/zh-CN/usage-guide/speech-synthesis-v2.5","context_length":8000,"supported_protocols":["openai:chat-completions"]},{"id":"qwen3.7-plus","name":"Qwen: Qwen3.7 Plus","created":1780421946,"description":"Qwen3.7系列中高性价比Plus模型，在强大文本能力的基础上全面升级了视觉-语言能力，同时保持了在编码、工具使用和生产力工作流方面的完整智能体能力。其核心特色为多模态交互混合智能体能力，能够感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代码、端到端导航移动应用。  该模型版本功能等同于快照模型qwen3.7-plus-2026-05-26","context_length":1000000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"qwen3.7-max","name":"Qwen: Qwen3.7 Max","created":1779708983,"description":"Qwen3.7-Max 是阿里巴巴 Qwen3.7 系列中的旗舰模型。它支持纯文本的输入和输出，专为以智能体为中心的工作负载而设计，在编码、办公与效率工具以及长周期自主任务执行方面尤为擅长。与之前几代 Qwen 模型相比，该模型在代码生成和智能体能力上都有显著提升，并支持显式提示缓存，用于在重复使用相同上下文时显著提高效率。","context_length":1000000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"minimax-speech-2.8-hd","name":"MiniMax: Speech-2.8-HD","created":1780391046,"description":"新一代语音 HD 模型，情绪渲染融合语气词，重塑自然听感","context_length":0,"supported_protocols":["minimax:t2a_v2","minimax:t2a_v2_ws","minimax:voice_clone"]},{"id":"minimax-speech-2.8-turbo","name":"MiniMax: Speech-2.8-Turbo","created":1780391080,"description":"新一代语音 Turbo 模型，极致生成速度，更自然逼真的音频效果","context_length":0,"supported_protocols":["minimax:t2a_v2","minimax:t2a_v2_ws","minimax:voice_clone"]},{"id":"deepseek-v4-flash","name":"DeepSeek: DeepSeek V4 Flash","created":1777004987,"description":"DeepSeek-V4 拥有百万字超长上下文，在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。相比 DeepSeek-V4-Pro，DeepSeek-V4-Flash 在世界知识储备方面稍逊一筹，但展现出了接近的推理能力。而由于模型参数和激活更小，相较之下 V4-Flash 能够提供更加快捷、经济的 API 服务。  在 Agent 测评中，DeepSeek-V4-Flash 在简单任务上与 DeepSeek-V4-Pro 旗鼓相当，但在高难度任务上仍有差距。","context_length":1048576,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"step-3.7-flash","name":"StepFun: Step 3.7 Flash","created":1780068226,"description":"Step 3.7 Flash 是 StepFun 最新推出的高效多模态专家混合模型。它采用 1960 亿参数的语言主干网络，搭配视觉编码器，实现对图片和视频的原生理解，每个 token 实际激活的参数约为 110 亿。该模型支持 256K 超长上下文窗口，并开放高 / 中 / 低多档位推理强度，让调用方在速度、成本与推理深度之间自由取舍。  它天生适合代码生成、智能体工作流、结构化输出，以及一切依赖长上下文的高效生产力场景。","context_length":256000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"seedance-2.0:save","name":"ByteDance: Seedance 2.0 (Save)","created":1779792154,"description":"Seedance 2.0 是字节跳动的视频生成模型。支持文生视频、图生视频（含首尾帧控制）和多模态参考生视频。在角色一致性、视觉风格保持和参考素材的镜头运动还原方面表现突出。","context_length":0,"supported_protocols":["seedance:generations"]},{"id":"bocha-web-search","name":"Bocha: Web Search","created":1780561436,"description":"从全网搜索任何网页信息和网页链接，结果准确、摘要完整，更适合 AI 使用。","context_length":0,"supported_protocols":["bocha:web-search"]},{"id":"unifuncs-u3-pro","name":"UniFuncs: Deep Research U3 Pro","created":1780460866,"description":"U3 是 UniFuncs 提供的深度研究模型，主打“深度研究 / 万字报告”能力。它通过 API 形式提供服务，兼容 OpenAI ‎`chat/completions` 协议，可选是否流式返回，支持通过参数设置研究深度（Max Depth，文档建议 25 轮为最佳）、引用格式（link / character / hidden）、输出体裁（report、summary、各类文章形态等）、搜索域白名单与黑名单，以及是否先生成研究计划（Plan Approval）等。更多参数与用法请查看：https://unifuncs.com/api/deepresearch","context_length":200000,"supported_protocols":["openai:chat-completions"]},{"id":"unifuncs-s3-pro","name":"UniFuncs: Deep Search S3 Pro","created":1780460486,"description":"S3 Pro 是 UniFuncs 推出的新一代旗舰深度搜索模型，可以在互联网中高速、准确、全面地搜索任何信息。更多参数与用法请查看：https://unifuncs.com/api/deepsearch","context_length":200000,"supported_protocols":["openai:chat-completions"]},{"id":"unifuncs-web-reader","name":"UniFuncs: Web Reader","created":1780484555,"description":"快速阅读网页全文内容，支持抓取网页、PDF、Word、Excel等格式，并提供内容提取、摘要生成功能。","context_length":0,"supported_protocols":["unifuncs:web-reader"]},{"id":"unifuncs-web-search","name":"UniFuncs: Web Search","created":1780484622,"description":"快速的实时搜索服务，基于 UniFuncs 拥有最全面的搜索信源，独特的搜索算法让应用快速支持联网搜索。","context_length":0,"supported_protocols":["unifuncs:web-search"]},{"id":"hy3-preview","name":"Tencent: Hy3 preview","created":1780592369,"description":"混元 Hy3 preview 面向 Agent 工作负载设计，采用 295B/21B 激活的 MoE 架构。在同一个模型内提供 no_think（极速响应）、think_low（快速思考）、think_high（深度推理）三档模式，适配从高频交互到复杂工程任务的不同延迟与深度需求。在 SWE-bench Verified 等代码基准上接近当前最强水平，256K 上下文支持跨文件代码重构与长文档分析。适合需要可靠任务完成度、同时对推理成本敏感的开发者。","context_length":256000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"kimi-k2.7-code","name":"MoonshotAI: Kimi K2.7 Code","created":1781260551,"description":"Kimi K2.7 Code 是 Kimi 迄今最智能的 Coding 模型，在长上下文中更可靠地遵循指令，能以更高的成功率完成编程任务，同时支持文本、图片与视频输入，思考模式，对话与 Agent 任务。Kimi K2.7 Code HighSpeed 是 Kimi K2.7 Code 的高速版模型，与 Kimi K2.7 Code 是相同模型，但输出速度约 180 Tokens/s，短上下文场景可达 260 Token/s，带来更极致的编程体验。","context_length":262144,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"seed-2.1-turbo","name":"ByteDance Seed: Seed-2.1-Turbo","created":1782179873,"description":"效果与成本均衡，全面升级 Coding、Agent 与多模态能力，以更强的自主规划、长链路执行和动态修复能力，胜任企业真实复杂任务。","context_length":256000,"supported_protocols":["openai:chat-completions"]},{"id":"glm-5.2","name":"Z.ai: GLM 5.2","created":1781352257,"description":"GLM-5.2 是智谱迄今能力最强的开源模型，支持真正可用的 1M 上下文，并在长程任务中继续保持领先。","context_length":1000000,"supported_protocols":["openai:chat-completions","anthropic:messages"]},{"id":"seed-2.1-pro","name":"ByteDance Seed: Seed-2.1-Pro","created":1782179824,"description":"迈向生产级智能的新一代大模型，全面升级 Coding、Agent 与多模态能力，以更强的自主规划、长链路执行和动态修复能力，胜任企业真实复杂任务。","context_length":256000,"supported_protocols":["openai:chat-completions"]},{"id":"seed-evolving","name":"ByteDance Seed: Seed-Evolving","created":1782179908,"description":"Doubao-Seed-Evolving 面向 Coding 与 Agent 场景，持续周级升级，以统一模型 ID 提供最新能力，助力复杂任务高效落地。当前版本与 ByteDance Seed: Seed-2.1-Pro 相同。","context_length":256000,"supported_protocols":["openai:chat-completions"]},{"id":"minimax-m3","name":"MiniMax: MiniMax M3","created":1780286010,"description":"MiniMax-M3 是 MiniMax 推出的多模态基础模型，支持文本、图像和视频输入，并以文本形式输出。它提供最长 100 万 Token 的上下文窗口，特别适合长程 Agent 工作、代码编写和工具调用等场景。  它基于 MiniMax 稀疏注意力机制（MiniMax Sparse Attention, MSA）构建：用 KV 块选择替代完整注意力，在超长上下文下大幅削减单 Token 计算量——在 100 万 Token 级别，计算成本约为上一代模型的 1/20，同时显著加快 prefill 和 decode 速度，并在大多数任务上保持接近原有的效果水平。  该模型从一开始就作为“原生多模态模型”训练，使用交织的多模态数据，并通过交互式用户模拟器框架进行多轮对话与贴近真实生产环境的协作调优。因此，它的设计重心，是持续性的、多步骤任务执行，而不是单轮指令的即时完成。","context_length":1000000,"supported_protocols":["openai:chat-completions","anthropic:messages"]}]}