您好,欢迎您来到林间号!
官网首页 小额贷款 购车贷款 购房贷款 抵押贷款 贷款平台 贷款知识 手机租机

林间号 > 区块链 > 马斯克 pi,马斯克走下神坛

马斯克 pi,马斯克走下神坛

区块链 岑岑 本站原创

来源:作者:毕安迪,编辑:王静

马斯克硬刚OpenAI,用户惨遭池鱼之殃图像来源:生成者

只听说过社交媒体试图让用户多停留,但没听说过给人设上限。现在,埃隆·马斯克(elon musk)在给所有Twitter用户“轻微保护”,而这一切其实都是AI逼出来的?

现在Twitter用户每天能浏览的最大数量,并不取决于他们的手速,也不取决于他们是否愿意熬夜。而是有一个明确的数字:10000个已验证(即付费“蓝鸟”服务)的账号,1000个未验证的账号,而新注册的未验证账号只有500个。

在这方面,依然是马斯克面对愤怒的用户两次提高的标准。至于原因,是“为了解决数据捕捉和系统操控问题的极端水平。”

他指的是人工智能公司。为了训练模型,这些公司需要大量的数据作为饲料。去年12月,马斯克切断了与OpenAI的数据连接,今年4月,他指控微软非法使用Twitter数据。

在马斯克采取激进措施阻止数据抓取的同时,OpenAI正面临集体诉讼。诉讼的原告有16人,都是个人,换句话说就是普通的上网者。他们指控OpenAI在未经许可的情况下,秘密“从互联网上抓取了3000亿个单词”,并从互联网的那个用户那里窃取了“大量私人信息”,以训练ChatGPT。

一边是多年积累了大量UGC内容的互联网用户和平台,一边是新兴的AIGC企业,一场围绕数据抓取和隐私安全的战争已经打响。

01

星期五,星期五,敲锣打鼓。终于到周末了,但是推特用户都傻了。屏幕上会显示一条错误消息,提醒他们已经超过了“速率限制”,违反了Twitter规则,查看了太多的推文。

人们根本不知道这意味着什么。Twitter的老板马斯克站出来表示,确实存在速率限制,并宣布为了解决数据抓取和系统操控的极端问题,已验证、未验证和新注册的未验证账户的每日浏览限制分别为6000、600和300条推文。

马斯克硬刚OpenAI,用户惨遭池鱼之殃在此之前,马斯克刚刚宣布Twitter开始禁止未登录的用户浏览内容,用户仍然接受。限制锤子,用户麻木,再看看验证和不验证的区别,眉毛一扬:你个老六是不是想用这一招推广“青鸟订阅”?在评论区,不止一个用户评论:“现在一定要用钱赢吗?”

不满的声音很大。Twitter的竞品Hive、乳齿象、Tumblr等。出现在热门话题中,一个Twitter墓碑的梗图被广泛使用。在争议声中,马斯克两次将标准提高到10000次验证用户的查看和1000次未验证用户的查看。

马斯克硬刚OpenAI,用户惨遭池鱼之殃一个高仿号马斯克调侃道:“我设置限制是因为你们这些推特迷需要出去走走。我在为世界做好事。”这种有价值的思维是好的。马斯克反手就是一个转发,他还单独发了一条“去拜访你的朋友和家人”。

马斯克硬刚OpenAI,用户惨遭池鱼之殃不过玩笑归玩笑,马斯克对自己的“测试”给出了明确的解释:处理数据抓取。用户的不满也在于限流方式是否有效,而不在于数据抓取的问题。

AI创业公司来Twitter“发数据”有多严重?马斯克在一条推文中表示,流量激增,Twitter不得不启用备份服务器:“在紧急情况下启用大量在线服务器,只是为了帮助一些估值高得离谱的AI创业公司,这很烦人。”

在限流风暴的前一天,Epic Games的CEO蒂姆·斯维尼也抱怨Twitter也在建墙。马斯克回答说:“数百个(甚至更多)区块在抓取Twitter数据时极具攻击性,影响了用户体验。我们做什么呢我对所有想法都持开放态度。”

刚才还在抱怨的Tim很快就给出了严肃的建议,比如在Twitter的服务条款中加入禁止数据抓取的内容,用信息安全工程保护平台,对大规模滥用Twitter的公司采取法律行动。

值得注意的是,马斯克在回复中提到,“绝对”会对窃取数据的人采取法律行动:“(乐观地)从现在起的两到三年内,我期待在法庭上看到他们。”

不管“为付费订阅添柴”的猜想是不是马斯克以小人之心度君子之腹,马斯克或许自私到了高举用户隐私大旗之外。4月份,马斯克被传将成立X.AI新人工智能公司,对抗ChatGPT。如果真的想训练一个大语言模型,Twitter的用户数据当然是最适合自己的。

无论如何,主动限制平台的电流是可能的。马斯克准备和AI创业公司一起走到最后。

02

就在马斯克重拳限制全平台流量的时候,这股AICG热潮的“始作俑者”、ChatGPT的创造者OpenAI卷入了一场集体诉讼。

该诉讼是在美国加州北区地方法院提起的,共有16名原告,均为匿名个人。诉状很长,足足有157页,开头是斯蒂芬·霍金的一句话:“强大的人工智能的崛起,要么是人类历史上最好的事情,要么是最坏的事情。”除了OpenAI,被告还有微软,微软对其投资了数百亿美元。

核心指控是ChatGPT在使用从互联网上收集的数据来“训练其技术”时,侵犯了“无数人的版权和隐私”。

起诉书称,OpenAI从网上秘密抓取3000亿字,窃听“书籍、文章、网站和帖子,包括未经同意获取的个人信息”,违反了隐私法。其中提到OpenAI抓取了大量网络数据,包括社交媒体中的数据。

他们还指出,OpenAI拥有专有的AI语料库,积累了大量的个人数据,包括从Reddit帖子及其网站链接中获得的数据。

这是对培训模式的指责。此外,原告还声称,用户与OpenAI产品的交互以及产品中的隐私信息也被OpenAI大规模非法访问和窃取。

这并不是OpenAI第一次在美国面临集体诉讼。去年11月,Github程序员发起了针对Github、OpenAI和微软的集体诉讼,指控OpenAI违反开源许可,并使用他们贡献的代码来训练GitHub Copilot,这是一种专有的AI工具。

当时ChatGPT还没有上线,但是现在回过头来看,当时AI训练的问题已经暴露出来了。现在最新的集体诉讼是针对ChatGPT的,chat GPT的用户范围更广,被侵权的人群也更广(基本上是所有的受害者)。更重要的是,在AIGC的狂热下,任何法律先例都可能影响未来。

* *在一份声明中,本案的公益律师事务所Clarkson将这起集体诉讼称为“里程碑式”的联邦案件,这是对整个人工智能的警告。

从这个角度来说,OpenAI肩上的担子真的很重。

OpenAI因为数据抓取和隐私安全造成了很多麻烦。平台被锁,用户翻脸只是冰山一角。

在欧洲,OpenAI已经被很多国家调查过。甚至在今年4月,意大利还担心ChatGPT会违反欧洲数据保护,暂时禁止了ChatGPT。

对整个人工智能领域的监管正在推进。法国在5月份推出了一项人工智能行动计划。在AIGC,法国隐私监管机构特别关注一些人工智能模型从互联网收集数据并建立数据集来训练大型语言模型的做法。

最重要的是欧盟AI法案,现在已经到了最后阶段。该法案将有可能成为全球人工智能治理的典范。

03

平台、用户、监管,三股力量已经形成合围之势,誓要尽快为AIGC立规矩,从大规模模特培训的起点出发。

一方面,时间紧迫,AIGC发展太快。

不知道马斯克说的“估值高得离谱的AI创业公司”指的是谁。但是,此言一出,确实箭在弦上。毕竟AIGC领域的融资是一波又一波的,都是热钱。

创业公司中,OpenAI估值近300亿美元,总融资规模113亿美元,AIGC首富;然后是第二富有的Anthropic,估值超过40亿美元。仅几天前以13亿美元融资震惊硅谷的影响力,估值40亿美元,成立才一年多。

大地震可能还在后头。影响力用的是自己的大语言模型。这一次,它获得了13亿美元,并宣布将建立22,000个英伟达H100芯片,成为世界上最大的人工智能集群。如此大规模的计算,目标参数和数据集必然惊人。

另一方面,ChatGPT诞生了空,当它暴露出问题后,就没那么容易“修复”了。OpenAI的几代大语言模型,GPT-2数据集有40GB的文本,GPT-3(即ChatGPT发布时使用的模型)有570GB的训练数据。至于今年才发布的GPT-4,数据集大小根本没有披露。

海量数据从一开始就没有记录。谷歌前研究科学家尼西亚·桑巴斯·万(Nicia Sambas Wan)曾在接受采访时表示,科技公司不会记录他们如何收集或注释AI训练数据,甚至不知道数据集中有什么。

ChatGPT就像一个黑匣子,是建在密室里的黑匣子。现在要做到透明和隐私保护是很难的,比如列出哪些数据被爬取了,在使用过程中说明如何使用,在用户的要求下删除一段数据。

互联网冲浪者和监管者咬OpenAI还有一个原因。在社交媒体发展壮大的那些年,个人网络数据保护意识还处于初级阶段。到了比赛的时候,才发现已经错过太远了。

当扎克伯格在2018年第一次参加国会听证会时,他的社交媒体平台脸书已经推出了14年。当时,脸书陷入“剑桥丑闻”,该公司首席技术官表示,8700万用户受到影响。这也是数据采集造成的一个大错误。

到今年5月奥特曼在美国国会获得听证会席位时,议员们频繁表达对社交媒体时代做得不够的悔恨。意思很清楚:这一次,如果不是领先,至少我们应该跟上AIGC。

一个又一个的大模型还在训练中,数据捕捉是一个线程。只有抓住这一点,我们才有希望理清AIGC的乱账。

参考资料:

1.新浪科技:“马斯克是不是和微软杠上了?Twitter称微软非法使用其数据。

2、黑马程序员:“这些程序员起诉GitHub!索赔649亿”

3.界面新闻:欧盟AI法案出炉,OpenAI等公司能打几分。有哪些核心争议?》

4.腾讯科技:“对数据的渴求伤害了OpenAI?许多国家指责它违反了数据保护。

5.网易科技:“ChatGPT在意大利恢复上线,但OpenAI的监管麻烦才刚刚开始”

温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信,我们会及时处理和回复。

原文地址"马斯克 pi,马斯克走下神坛":http://www.ljycsb.cn/qukuailian/210543.html

微信扫描二维码投放广告
▲长按图片识别二维码