大模型

🤖 AI大模型行业新闻速递 (2026-02-18)

6 分钟阅读0 次浏览

Test Editor

🤖 AI大模型行业新闻速递

发布时间: 2026年2月18日 18:05
频道: Models - AI大模型与基础模型动态

📅 发布时间: 2026年2月18日
🏢 来源: Anthropic / CNBC / DoNews
🔗 参考链接:

核心要点:

🚀 性能升级: Claude Sonnet 4.6在编程、计算机操作、长文本推理、智能体规划、知识工作和设计等多个领域实现显著提升
💰 定价策略: 保持与前代Sonnet 4.5相同定价（输入$3/百万token，输出$15/百万token），但性能已接近旗舰Opus 4.6（Opus定价为输入$15/百万token，输出$75/百万token）
🎯 核心能力: 特别强化计算机操作能力，可执行填写网页表单、跨浏览器标签页协调信息等多步骤操作
⏱️ 发布节奏: 这是Anthropic在不到两周内发布的第二款主要产品（Claude Opus 4.6于2月5日发布）

行业影响: Anthropic的快速迭代展示了AI大模型领域的激烈竞争，Sonnet 4.6以"五分之一价格提供接近旗舰性能"的策略，直接挑战OpenAI和Google在性价比市场的地位。

📅 时间: 2026年2月13日
🏢 来源: OpenAI / DoNews
🔗 参考链接:

核心要点:

行业影响: OpenAI的这一举措反映了大模型安全性和用户体验之间的平衡挑战，也显示出公司正在加速向下一代模型转型。

📅 预计时间: 2026年除夕（阿里计划）
🏢 来源: 阿里巴巴 / 36氪 / 搜狐科技
🔗 参考链接:

核心要点:

行业影响: 继"DeepSeek时刻"之后，中国AI迎来"千问周期"。开源开放策略让千问在全球范围内获得广泛认可，性能优异且适于灵活部署应用。

📅 升级时间: 近期
🏢 来源: DeepSeek / 中大职业培训
🔗 参考链接:

核心要点:

📏 上下文扩展: DeepSeek在网页端和APP端进行版本更新，支持最高1M（百万）Token的上下文长度，相比去年8月发布的DeepSeek V3.1的128K Token大幅提升
🚀 V4预告: DeepSeek新一代大模型V4预计2月春节前后发布（以官方实际发布为准）
💼 团队扩张: DeepSeek近期大量招聘，包括深度学习研究员等技术核心岗位

行业影响: DeepSeek持续在上下文处理能力上发力，1M Token的上下文长度为处理超长文档和复杂任务提供了强大支持。

📅 时间: 2026年2月
🏢 来源: 字节跳动
🔗 参考链接: https://new.qq.com/rain/a/20260216A03LXK00

核心要点:

行业影响: 国内大模型企业集体发力，2026年2月成为AI大模型的"超级月"。

📅 预计发布: 2026年春季
🏢 来源: 苹果 / 彭博社
🔗 参考链接:

核心要点:

行业影响: 苹果入局大模型对话助手市场，将为移动端AI应用带来新的竞争格局。13年历史的Siri即将迎来重大变革。

根据综合指数和最新评测：

OpenAI GPT-5系列 - 综合指数: 91.6
- GPT-5.2 (2025.12.11发布): 全能旗舰，ARC-AGI-2达54.2%
- 三个版本：Instant（极速）、Thinking（深度推理，40万Token输入/12.8万输出）、Pro（全领域领先）
Anthropic Claude-Opus-4.5 - 综合指数: 90.4
- Claude Opus 4.6 (2026.2.5发布): 旗舰模型
- Claude Sonnet 4.6 (2026.2.18发布): 中型模型，性能接近Opus，价格仅1/5
Google Gemini 3 Pro - 综合指数: 89.8
- 2025年11月18日发布
- 世界领先的多模态理解力，纯文本任务中展现与GPT-4o相当或更优性能
中国模型崛起:
- 阿里千问Qwen3.5: 全球最强开源模型，性能媲美Gemini 3 Pro
- DeepSeek V3.1/V4: 上下文1M Token，V4即将发布
- 字节豆包2.0: 复杂任务优化