文:李编辑:VickyXiao
大模型之风不可避免地吹进了大数据行业,火药味不小。
这种不快正在逼近。人们注意到,Databricks和Snowflake这两大数据行业的“宿敌”都将今年最重要的年度峰会选在了同一时间——6月26日-29日。
这是这么多年都没有过的事情。
不仅如此,他们还“不约而同”地将今年大会的主题向AI靠拢。Databricks直接把大会命名为“数据+AI峰会”,官网一进去就是一个巨大的“一代AI”:
雪花还为他的大会增加了一个很棒的属性,“全球最大的数据、App和AI主题大会”:
这是什么意思?说明这两家公司是在明目张胆地逼迫与会者做出选择:如果你想去参加他们的会议,可能再来找我们就来不及了。
要知道,这两家公司,一家在旧金山,一家在拉斯维加斯,开车要九个小时,坐飞机要一个半小时。参与者想要鱼和熊掌兼得,恐怕还不够折腾。
以下亮点来了。不仅时间重合,两家公司都邀请了重磅嘉宾发表主题演讲——data bricks邀请了微软CEO塞特亚·纳德拉,雪花则是英伟达CEO黄仁勋。
都是大老板。
有网友提醒大家,既然两家公司的峰会同时举行,“如果你还没选边站,那就该你选了。”
当然也有很多人准备往两边跑。Striim的产品经理John Kutay计划分别在两场会议上发言,但也“将评估拉斯维加斯和旧金山之间的距离和时间”。
一些尚未做出决定的网友问他在Databricks上的演讲会是什么。“我想去,但是那时候还得去顺丰,唉。”
对此,甚至有一位网友做了一个离谱的梦,“我刚刚梦见在雪花的大会上所有人都感染了新冠肺炎,因为雪花不想让我们参加Databricks的峰会……”
雪花和Databricks是目前最好的大数据分析公司。前者成立于2021年,2020年9月上市。上市首日,其收盘价飙升111.6%,至253.93美元,成为美国历史上最大的软件IPO。
此外,雪花的股东名单中还包括Salesforce、巴菲特等知名投资人。
Databricks成立于2013年,是一级市场的超级独角兽。2021年获得两轮10亿美元大规模融资,估值高达380亿美元(2021年数据)。
国内一些从业者更习惯称之为“砖厂”。
这两家公司不仅经常被外界比较,而且总是相互竞争。
最著名的一次是在2021年。当时雪花依靠云数据仓库实现了千亿市值。Databricks坐不住了,发文章称其数据湖技术创下了TPC-DS基准测试的新纪录。
重点是,Databricks还强调,第三方研究表明其实际性能可以达到雪花的2.5倍。
随后十天后,雪花做出回应,发布了自己的测试结果,称Databricks公布的性能对比结论缺乏完整性,研究本身存在缺陷。
雪花创始人也强调,这种基准测试毫无意义,在这个时代发布数据库基准结果就是“把正常的技术交流变成缺乏诚信的营销噱头”。
不甘心的Databricks再次回应。创始人发了一篇博客,这次是更严重的指责:雪花为了测试结果更改了TPC-DS的输入数据。
从那以后,两家的争吵就再也没有停止过。
在去年与投资者马特·图尔克(Matt Turck)的一次对话中,Databricks的联合创始人兼首席执行官阿里·高德西(Ali Ghodsi)也谈到了与雪花的竞争。
他首先吹嘘说,雪花拥有“可能是市场上最好的数据仓库”,“Databricks和雪花将在70%的客户中共存”。
这里补充一下,雪花主要使用数据仓库技术,而Databricks使用数据湖技术,这是两者技术思路的主要区别。
然后阿里Ghodsi推广了自己的数据湖。“公共云计算提供商有动力推动更多人将数据存储在他们的数据湖中...我认为数据湖的范例将会胜出。”
产品的性能还没完,现在Databricks和雪花都在偷偷戳大模型。
今年3月,Databricks发布了一个名为Dolly的开源大语言模型(据说是为了向第一只克隆羊Dolly致敬),称“只需要30美元,一台服务器,三个小时,我们就可以教会Dolly开始人类级别的交互”。
这显然是针对ChatGPT这种门槛更高的产品,也就是说AI不再是只有大型科技公司才买得起的东西,任何人都可以在没有太多融资的情况下开发出真正类似人类的AI。
Databricks随后在4月发布了Dolly 2.0,这是一个大语言模型的开源迭代版本。
雪花也在不断的炒大款。4月,它发表了一篇文章,称正在为生成式AI和大语言模型建立一个以数据为中心的平台,并详细解释了这样做的基础以及将带来的影响。
随后的5月,雪花宣布收购创业公司Neeva,将基于AI的生成搜索添加到其数据云平台中。
虽然在AI大模型方面,两家公司还没有涉足对方的领地,但本次年度峰会举办时间的重合已经说明了他们的态度。
有趣的是,当有人在谷歌搜索“雪花会议”时,第一个结果是Databricks的会议链接,其次是雪花。
也就是说,Databricks购买竞争对手的关键词来销售自己的广告。
我们还发现,当Google同时输入“data bricks+雪花”搜索时,前两个都是广告(这个结果是动态显示的)——data bricks仍然宣传其在竞价排名中的第一名的成绩,但第二个是技术服务提供商,宣传其帮助客户迁移到雪花的服务。这次发布会甚至比之前发现的两家公司之间的直接竞标更有意思。Databricks仍然可以被解释为更积极有效的一方,但在两家公司的竞争中,一些技术服务提供商也在寻找商机,似乎认为迁移到雪花的需求更大…
反正一场大战又要开始了。现在大模特领域不缺showstopper。到了Databricks和雪花,可能就变成谁先杀谁的问题了。
温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信,我们会及时处理和回复。
原文地址"大模型让数据库行业撕起来了:Databricks和Snowflake让开发者选边站":http://www.ljycsb.cn/qukuailian/213405.html。

微信扫描二维码投放广告
▲长按图片识别二维码