首页 > 排行>内容

Databricks的野心与国产数据平台的漫漫征途

时间:2025-10-22 18:09 来源:投资界 阅读量:11554   

如果你是老板,你的公司计划接入AI,面对五花八门各有所长的模型,你会怎么选?

性能要尽量高,成本要尽量低,操作起来越简单越好,对于想要快速高效地AI化的企业,推出一份合适的“套餐方案”,切中企业的需求痛点,在竞争激烈的企业AI市场不失为上佳选择。

近日,Databricks与OpenAI宣布建立多年期合作伙伴关系。Databricks称,1亿美元合作协议助力OpenAI模型原生集成至Databricks数据智能平台,惠及2万余家企业客户。世界顶 尖大数据公司与大模型公司宣布携手,这不仅是一次商业合作,更是数据行业与AI行业巨头公司为企业级AI未来发展方向规划的蓝图。

OpenAI+Databricks,

如何完成1+1>2?

Databricks与OpenAI的这项合作旨在简化企业智能体的部署,使企业能够直接在其数据之上构建AI应用程序,主要应用方式为以下几点:

1.OpenAI的模型将与Databricks的AI开发环境Agent Bricks紧密集成。这为企业提供了一个统一平台来开发、评估和扩展智能体,而不需要进行数据迁移等复杂操作。Databricks客户能够在其现有企业数据上运行大语言模型,通过SQL或API访问,并通过内置的治理和可观测性控制安全地大规模部署这些模型。

这一模式实现了“让模型找数据,而不是数据找模型”,从根本上降低了数据泄露的风险,同时也让企业部署AI变得更加方便快捷,降低了客户的部署成本。

2.合作的另一个关键组件是Databricks的Unity Catalog,它将被用于数据和AI模型的治理。Databricks表示,它可以帮助数据血缘追踪、控制访问并在跨部门和地理位置扩展AI部署时执行合规性。可观测性功能还帮助团队监控性能、准确性和安全性。

OpenAI拥有强大的模型能力,但没有获取企业数据的渠道,与Databricks的合作弥补了这一点,两家公司构筑了“模型+数据”的护城河,达成了双赢。

这并不是Databricks第 一次与大模型公司合作,今年3月,Databricks宣布与Anthropic达成合作,将Claude引入企业数据环境,这充分彰显了Databricks未来的发展方向:建设多模型集成的数据平台,在推进企业级AI落地这一道路上稳步前进,多模型的集成也将是Databricks与同类型数据平台竞争的关键优势。

AI竞赛核心转变:数据+生态站上高地

大模型的训练从最开始的不断提升能力,迭代新版本,向外界秀肌肉,到今天模型能力已经发展到一定阶段,AI面临着从纵向发展到横向发展的转变。如果说提升模型能力是在建一座高楼,那现在就到了让更多人住进高楼里的阶段,要将先进的能力应用到生产生活当中。这时,用户如何选择模型,它考虑的是什么?这里以企业级AI的应用场景为例来进行说明。

1.我知道你很强,但你怎样为我所用?

分属于不同行业的公司都有着一套专属的方法论与公司数据沉淀,公司的运作建立在这套系统之上,新员工进入一家公司,需要经历一段时间的培训与学习,掌握了相关知识之后才能与同事协同工作。企业接入AI也是相同的情况,AI就像智商超高的天才员工,但它也不能立马高效输出。大模型使用公共数据进行训练,接入到不同的企业里,如果不明白企业的工作逻辑,就无法发挥出它的真实水平。它能说一口流利的普通话,但却掌握不了各地的方言。横亘在大模型与企业之间的,是“专有数据”的鸿沟,数据平台的作用在此凸显。

在企业的数据平台之上接入大模型,将这些专有数据喂给大模型,它才能真正在企业运作中发挥作用,在企业接入AI的路径中,数据和模型缺一不可。如果在一个平台上可以同时实现两种功能甚至未来拓展到更多功能,无疑在企业AI的竞争中拥有巨大的优势。

2.你很强,他也很强,我为什么选择你?

以国内大模型发展来看,可以算的上是百家争鸣,各有所长,如果说年初DeepSeek的出现是国内大模型界的奇兵,那到今天其实没有哪家模型可以做到独占鳌头,大家有各自擅长的领域,同时也有不足。作为企业决策者,应该怎样选择呢?

上文我们已经提到,企业AI落地需要数据与模型的集成,在两者都为必需品的前提下,如果把两者的能力集成到一个平台上,相当于为企业节省了大量的选择成本与部署成本,直接向企业售卖组合套餐,增强竞争力的同时也提高了不可替代性,当我把鸡蛋都放到同一个篮子里,要拿出其中一个所付出的成本,远比把鸡蛋都单独分装大的多。构建集成多种能力的AI基础设施,打造“朋友多多”的生态圈,是Databricks的发展方向。

Databricks这样做,我也能这样做吗?

上文讲述了Databricks在企业AI上的布局及其背后揭示的AI竞赛下半场的重点,那么国内的同类型公司是否可以走相同道路呢?

答案是:逻辑可参考,路径不同。

Databricks的战略是与领 先的通用大模型集成。首先,Databricks为什么能走这条路,最核心的要点在于,它本身是首屈一指的数据智能平台公司,拥有庞大的客户群体,而目前国内暂时还没有可以称得上能对标Databricks的公司,Databricks与OpenAI集成,是“1+1>2”,如果本身不具备与Databricks相同的能力与条件,自然就谈不上可以复制它的道路。

其次,国内大模型的发展与国外较大的不同点在于,国内能力突出的几家通用大模型,大部分都隶属于大厂,字节的豆包、阿里的通义千问、百度的文心一言、腾讯的元宝,这些大厂本身就拥有与模型相配套的数据平台,基本不存在与单独的数据平台公司集成的可能,虽然我们也有非大厂的能力突出的大模型,比如DeepSeek、Kimi,但缺少可以称得上独树一帜的独立数据智能平台公司,如果你是B类的数据智能平台公司,那A类的通用大模型公司自然也就没有必要来与你合作。在此背景之下,国内大部分的AI基础设施市场基本都是大厂之间的争夺。

独立数据智能平台公司路在何方?

独立数据公司相比大厂而言资源与知名度都有所欠缺,在巨头争锋之中,如何找到自己的路?国内与Databricks同类型的公司之所以不能效仿它的路径,主要原因就是公司的体量与知名度都没有达到可与Databricks媲美的程度。目前这个阶段的主要任务依然是要提高市场占有率,在行业内打出声量。

1.针对不同客户提供差异化、轻量化解决方案,以拓宽市场为先。面对中小企业客户制定不同的解决方案,使客户可以尽量低门槛、低成本地接入系统,不与大厂进行直接竞争,在中小企业赛道发力,考虑提供轻量化的解决方案,以提高市场占有率为主要目标,走出自己的专属赛道。

2.不追求“大而全”,在垂直赛道发力,提高不可替代性。不同的细分行业往往对于数据智能平台不同模块的功能有特殊需求,如金融行业与医疗行业强调速度与准确性,科研项目强调大量非结构化数据的存储等,对于差异化场景制定专属的解决方案,满足通用平台不能满足的需求,在特定领域提高不可替代性,做到专而精,积累属于自己的行业know-how。

3.与行业专属大模型合作,推进部署可开箱即用的智能体。虽然无法复制与顶 尖通用大模型合作的路径,但背后包含的发展逻辑依然是相同的,可与特定行业的专属大模型深度集成,做到细分领域的高精尖,推进部署开箱即用的智能体,精准解决行业痛点。

目前国内已有发展势头强劲的独立数据智能平台公司,如星环科技、九章云极等,星环科技已经推出了针对金融、交通、医疗等垂直行业的解决方案,同时也拥有700多家生态合作伙伴;九章云极在GPU、CPU、服务器等领域均有广泛的生态合作伙伴,可适配信创生态多元需求,同时也在高校科研、生物医疗等行业持续发力。

企业级AI已逐步走向成熟,从技术探索迈向了技术与业务深度融合的阶段,智能体逐步参与到企业的日常工作中,AI基础设施的市场空间依然广阔,未来将成为企业不可或缺的数据基石。在AI基础设施市场的竞争中,大厂依然占据优势,但独立公司也会拥有自己的一席之地。大模型界拥有神兵天降的DeepSeek,AI基础设施领域也同样值得期待。

声明:免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。