年初大模型技术的爆发式发展,使得传统用户搜索场景被颠覆,据某权威研究机构数据显示,超58%的美国用户使用Google时不再点击搜索结果,传统搜索流量逐渐转向AI驱动工具,这一转变背后将重构用户搜索的交互逻辑、数据形态与技术架构。
9月26日杭州举行的云栖大会AI搜索专场上,阿里云智能集团计算平台事业部AI搜索负责人邢少敏与产品负责人汤祯捷重磅发布年度AI搜索技术与产品升级成果。阿里云搜索技术通过重塑信息交互范式、Agentic Search架构创新、优化云原生引擎性能,从传统“信息匹配”迈向“智能问题解决”的全新时代,成为信息交互的核心范式,助力金山办公在文档协作领域实现百万向量/千QPS检索能力,货拉拉在物流调度的洪峰压力下保持核心业务极低延迟,实现了客户业务性能突破与成本优化的双赢。
AI搜索:颠覆传统,重塑信息交互范式
如今,三大核心趋势正在重塑搜索边界:
1. 用户交互升级:用户需求从“找到链接”转向“解决问题”,搜索普惠化加速;
2. 数据模态进化:文本、图像、视频、代码等多模态混合搜索成为刚需;
3. 主动智能跃迁:以大模型为核、Agent为引擎的协同架构,实现跨工具、跨数据源的深度推理。
阿里云AI搜索通过技术架构与产品生态的全面革新,正推动搜索从“检索工具”升维为“智能AI助手”。
Agentic Search:AI搜索迈入自主协作时代
演讲中邢少敏详细阐释了阿里云AI搜索的核心突破——Agentic Search架构创新。该架构通过多Agent协同、多模态数据处理与任务自主规划,构建了从“问题提出”到“方案自主生成”的智能闭环。
其技术优势体现在:
多模态数据处理:支持文档、图像、代码、视频等内容的解析、实体抽取与向量化,覆盖向量引擎、数据库、知识图谱等多引擎协同;
自主任务规划:依托Qwen3大模型与短期/长期记忆能力,主Agent可动态调用Code Agent、Browser Agent等工具,实现复杂问答与多跳推理;
权威测试领先:在OpenAI的BrowseComp与Deep Research评测集中,Agentic Search检索与推理能力超越Gemini、OpenAI等国际主流方案,复杂任务准确率提升超40%。
此外,阿里云构建了覆盖文档解析、多模态向量化、NL2SQL、重排序的全链路 AI搜索专属大模型体系,并开放Qwen3-Plus、DeepSeek等多模态生成模型,为企业提供定制化智能搜索基座。
云原生引擎突破:性能倍增,成本优化
为支撑AI搜索的高并发与复杂计算需求,阿里云发布面向多场景检索的云原生引擎技术升级,实现性能与成本的双重突破:
Elasticsearch高性能检索引擎:通过CPU向量化计算、存算分离架构,复杂查询性能最高可提升6倍,存储成本降低50%,支持文本、日志、向量、时序等混合检索场景;
向量检索进化:向量检索GPU加速,基于高性能GPU卡的索引构建性能提升13倍,资源成本下降5倍;结合BBQ量化技术,内存占用降低95%,支持百亿级向量检索;
全模态数据治理:从文档、数据库到湖仓的多源数据,通过结构化抽取、实体关系建模,实现非结构化数据到知识图谱的转化,为多模态搜索提供实时索引能力。
产品矩阵融合升级:AI搜索产品的'一横三纵'
从Agentic Search创新,再到基于云原生引擎突破,向量引擎全面升级,AI搜索全模态数据治理等技术能力深耕,在此次年度产品发布中,汤祯捷从产品角度分享了三个主题-融合,加速,开箱即用, 将诸多核心领先AI搜索能力融合于在AI搜索多产品内的落地规划。打造业内领先的面向Agentic Search新时代的'一横三纵'的AI搜索产品矩阵。
1.AI搜索开放平台 - 面向人和 Agent 的Agentic Search基础设施。平台方式支撑多个AI搜索产品的AI原子能力。此为'一横'。
● 提供多模态解析、视频解析、向量化等全链路AI搜索服务,支持API调用与按量计费。
● 全链路搜索开发基础能力,覆盖模型微调-模型部署-编排。
● 搜索链路效果测评:内置Qwen3大模型与测评工具,助力企业快速构建RAG、智能问答等应用。
2.检索分析服务Elasticsearch - 开源企业级AI搜索平台。此为'一纵'。
Elasticsearch企业版在多类查询场景下的性能提升效果显著,其中文本检索方面,Terms/DateHist 聚合提升 2.59 倍、Query+Sort 查询提升 3 倍、MultiTerms 聚合提升 6.83 倍;向量检索方面,普通向量查询提升 1.7 倍、带过滤条件的向量查询提升 4 倍,全面体现了云原生架构对检索效率的显著增强。
a.场景增强:支持全文、语义、日志、向量、时序分析等多场景检索分析能力。
b.引擎加速:NativeES引擎支持检索性能提升2倍至6倍;检索存算分离降本50%;向量检索内存优化20倍。
c.发布“企业专属Agent知识库”,提供一键RAG解决方案,帮助用户构建安全独享的专属知识库。
d.Elasticsearch Serverless版实现秒级弹性伸缩,保障安全与稳定性。
3.智能检索服务OpenSearch - 深度接入AI原生能力的自研AI Native搜索服务。此为'二纵'。
a.LLM智能问答版,集成DeepSearch/DeepResearch Agent,其AI+专业搜索能力效果领先,支持“答案直出”。
b.行业算法版 为电商,互联网等行业领域提供高精度定制AI检索能力,全面对接AI搜索平台。
c.向量检索版,支持多模态数据湖,向量引擎多算法加强(GPU加速/RabitQ量化/DiskANN算法),文搜视频/文搜图。
现在起,OpenSearch 不仅是自研搜索服务,更是AI原生多模态数据湖搜索。
4.向量检索服务Milvus版 - AI向量检索的利器。此为'三纵'。
a.全托管服务兼容开源Milvus,新增秒级弹性伸缩、数据分层存储功能;
b.内核性能提升100%,支持百亿级数据湖检索,集成Milvus Agent实现智能化交互。
客户实践:AI搜索从工具到智能助手,助力用户实现业务增长
阿里云AI搜索技术落地成效已在头部客户场景中率先验证:金山办公通过ES内核级优化实现百万级文档秒级响应,攻克高并发检索瓶颈,并构建冷热数据自动流转的"无感运维"体系;货拉拉依托ES重构智能调度系统,成功支撑300+业务应用并发访问的千万级QPS洪峰压力,核心业务响应延迟稳定在10ms RT,运维效率提升50%。两大案例揭示了阿里云AI搜索技术演进的新逻辑:当技术架构深度适配业务特征,搜索系统正在从"支撑业务"进化为"驱动增长"的核心引擎。
“AI搜索不仅是在信息获取领域的技术升级,更是用户检索分析体验的跃迁。”
阿里云AI搜索通过Agentic架构的智能化、云原生引擎的高性能与产品生态的开放融合与加速,正推动搜索从“被动响应”走向“主动服务”。未来,随着大模型、Agent与云原生技术的深度协同,AI搜索将进化为每个人的贴身智能助手,引领人类进入信息无界、交互自然的新纪元。
人工智能技术网 倡导尊重与保护知识产权。如发现本站文章存在版权等问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至1851688011@qq.com我们将及时沟通与处理。!:首页 > 新质生产力 » 云栖2025 | 阿里云AI搜索年度发布:开启Agent时代,重构搜索新范式