您好,欢迎您来到林间号!
官网首页 小额贷款 购车贷款 购房贷款 抵押贷款 贷款平台 贷款知识 手机租机

林间号 > 区块链 > aicgs,webrtc agc

aicgs,webrtc agc

区块链 岑岑 本站原创

2023年4月7日21:00,《断链播客》第四十六期拉开帷幕。在本次直播中,Block Chris先生、Mest创始人Ashu Chan和ChainFeeds联合创始人Max先生(Adaverse亚洲生态系统负责人)就“AIGC在Web3中的应用”进行了深入探讨。

ChainBreaker:聊聊AIGC 在 Web3的应用

内容摘要:

一棵树:

我们在Crypto Wallet行业工作了五六年,一直在为如何把链条上的数据表达给用户而苦恼。所以我们花了很多时间研究如何用自然语言等文本形式表达链上不同类型的数据。加密钱包可以在链上携带许多类型的数据,如DID、资产、NFT和DeFi。这些类型的数据很难在单个窗口中表达。所以我们一直在追求自然语言表达的解决方案。直到ChatGPT的出现,我们才觉得这个东西变得更加可行。MEST要解决的问题是如何用自然语言来表达链上的数据,ChatGPT是一个很好的结合点。但是早期Mest主要是做内容分发,ChatGPT还没有出现。

如果没有ChatGPT,我们可能会用更笨拙的方式来模拟自然语言的表达,但这种形式可能并不好,我们的工作,尤其是作为链上的数据产品,可以更专注于如何在链上产生有价值的数据。我们之前做了很多工具,比如Dashboard,但是现在完全转向了语言交互的形式,这是我们的试点。

在我们的理解中,两者是两种不同的类型。我们认为它们都有特定的应用场景。图形界面特别适合流动场景,比如换站。不适合自然语言表达。但是,一旦涉及到各类数据信息,自然语言是最适合的场景。最基本的例子就是,当你想看一些数据的时候,现有的电商数据产品只能用图表或者表格来表达,但是在一个很大的仪表盘中,很难识别任何信息。在一些组合产品中,你可能也会觉得复杂,因为它们要承载太多东西。但是,自然语言非常适合。所以对于我们来说,这种利用信息通讯技术的方法可能是不一样的。对于程序性的东西,我们通过图形界面解决;对于信息传输和数据传输,自然语言的优势非常明显。这非常适合区块链的情况。

区块链的特点是开放,数据摆在那里。真正的问题是如何应用这些数据,并重新整合它们以找到所需的答案。Dune Analytics在Defi Summer中变得非常有用,因为人们开始知道它在链中寻找什么数据。Dune在Defi之前就存在了,但是人们并没有使用Dune来获取一些自己想要的信息。现在你可以通过马克尔道的合约来解释马克尔道从2021年到现在的街区高度赚了多少钱的铸币费,然后你可以交叉对比它和流动性这种稳定的货币产生的铸币费的差额。用户可以用这些信息来证明他的一些猜测,验证他的一些投资的理由。但是这又有一个问题,就是一个门槛。用户可能有一些想法,但他可能不会编写MySQL,所以他不能创建自己的沙丘仪表板。ChatGPT出现后,很多人讨论了一个办法,甚至用ChatGPT写合同,甚至用ChatGPT玩Unity游戏,或者干脆生成一个HTML浏览器的游戏。

未来有没有可能通过自然语言查询一些数据,生成沙丘页面?有些工具正好满足这个需求,你可以用自然语言查询一个数据。但是有一个问题,就是这些高质量数据的表格是从哪里来的?必须有人从区块链杂乱无章、可能毫无价值的信息中提取有价值的数据,才能用自然语言生成有价值的指标。我认为这从长期来看是非常可行的,但在中短期内,数据服务商可以在中间建立一个系统,从这些区块链公共数据的海量数据中提取有价值的指标,供用户调度。这是目前比较可行的事情。我们现在将转到在线数据有价值的指标,

如果以后有朋友对这方面感兴趣,首先要解决的是你要有独特的内容。完成第一步之后,我们要对这些业务数据进行标注,因为只有当这些业务数据有了足够的语言信息描述,当用户输入自然语言的时候,我们才能知道如何找到这样一个数据进行整合并返回给他。这里会有一个概念叫嵌入,就是在GPT,它有一个概念叫向量,把文字的语言转换成高维的数字,然后进行匹配。目前所有主流的对话处理方案都是按照这个思路进行的。首先,我们给自己的数据贴了很多标签。这些标签或API需要标注很多问题,比如“我有多少个NFT?”这个指标可能需要我们写20或300个问题。我们也可以使用GPT来帮助我们生成100个类似的问题,并给它们贴上标签。只有这样,用户才能提出任何关于NFT的问题,我们才能大概率匹配出这样的数据。这是目前所有对话处理的中间阶段。

如果在后期,理想情况下,我们有数据和大量标记的内容,那么也许我们会想对现有的模型进行微调,例如,在开源模型或GPT模型上,这样它就可以成为一个专属的领域AI。我觉得可以按照这个思路分三个阶段来实施。第一阶段是有数据,第二阶段是标注数据,第三阶段是向量匹配,然后进行微调。

最后,我们也在思考未来的发展,包括阿里巴巴的大语言模式,未来会有更多这样的大语言模式。我们正在跟踪这些发展,包括脸书,它有一些开源语言模型。虽然他们和GPT在效果上还有差距,但是按照这种发展的速度和能力,他们也有机会和能力达到GPT3或者3.5的水平。

现在链上所有做数据产品的人面临的困境是,大家都是基于公开数据无摩擦的开发产品。所以我觉得你问这个问题的时候,它的复杂度和逻辑复杂度可能会慢慢增加,可能会包括七个条件和一些嵌套的逻辑。在这种情况下,即使是GPT4也无法准确地得到100%准确的结果,它可能需要进行一些调整,才能充分了解用户的身体问题。所以,在某些层面上,我们还有进步空。

现在只能做到六七十分的状态。我们需要考虑的是这些词的向量模型,比如Word2Vec。如何根据区块链场的特点进行调整?这可能也是Mest会遇到的问题之一。我实际上想谈谈单词嵌入,你如何表示与区块链相关的单词,以及如何在搜索中更好地表现它。

首先,我们肯定需要大量的人力投入来模拟用户可能提出的问题,然后帮我们生成一些问题,贴上标签,然后陆续投入生产,让用户在这个过程中互动,发现一些问题或者得到更多的数据,帮我们优化这个标签,让匹配度更高。

潘熊志:

我想分享一下我们使用ChatGPT的一些感受。我们已经调研了近两个月,尝试做一些基于ChatGPT的上层工具链或者应用。如果你把ChatGPT想象成一个有能力拓展写作的人,给他一些话题,他就能生成一些文章。这或许能为内容创作提供一些帮助。但对于新兴行业的深入研究或分析,由于缺乏信息基础,仍有很多不足。所以我们更多的使用ChatGPT来浓缩信息,需要赋予它足够的上下文、联系或者知识。当我们给它这些知识的时候,我们可以提出问题,或者从一些信息库中提取信息,它的效果是非常好的。我们目前使用两个相对流行的开源库:LlamaIndex。另外我们也在使用一个基于ChatGPT的平台,可以帮助我们建立自己的数据库,比如PDF等素材和数据。在与ChatGPT交谈时,我们可以对数据进行预分类和预筛选,以提高ChatGPT的效果。

我想举一个例子来说明,假设我们需要回答一个用户对一个特定问题的疑问,比如什么是ERC-4337。我们首先需要从数据库中找到相关的文章或内容,并对它们进行分段。例如,一篇文章可以分成2000或3000个令牌作为一个单元。用户提问时,我们需要匹配每个单元和问题的相关度,找到相关度较高的部分进行问答。然后将单位和问题进行匹配,得到准确率相对较高的部分。然后,我们用ChatGPT进行问答,总结答案。

这种方法适用于知识题。但是如果用户问的是类似Twitter的短内容,我们只能将问题与每条推文的嵌入结果进行匹配,根据与问题相关度高的推文进行问答,让ChatGPT进行总结。这样,我们就能得到答案。

目前大部分人工知识库和ChatGPT的大方向都是这样的方法。当然,这种方法也存在一些问题,比如同义词的处理。为了提高准确率,可以用向量表示法进行匹配和汇总。在我们的调试过程中,发现了很多这样的问题。例如,当一个问题涉及到ERC-4337,数字ERC-20和4337可能会出现在其他文章。这可能会导致搜索结果不准确,因为匹配的是错误的内容。

关于断链器

由@mrblocktw、@nake13、@momoxi17主持的ChainBreaker播客每周五晚八点直播。

ChainBreak播客主要和大家分享加密领域的热点话题,加密技术的发展,加密界的八卦。

来源:DeFi之路

温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信,我们会及时处理和回复。

原文地址"aicgs,webrtc agc":http://www.ljycsb.cn/qukuailian/226057.html

微信扫描二维码投放广告
▲长按图片识别二维码