您好,欢迎您来到林间号!
官网首页 小额贷款 购车贷款 购房贷款 抵押贷款 贷款平台 贷款知识 手机租机

林间号 > 区块链 > 科学家都创造了什么,科学家创造的

科学家都创造了什么,科学家创造的

区块链 岑岑 本站原创

柏林洪堡大学的一组研究人员开发了一个大规模语言人工智能(AI)模型,其特点是有意调整以产生明显偏差的输出。

该团队的模型名为OpinionGPT,是Meta的Llama 2的调整变体,是一个人工智能系统,功能类似于OpenAI的ChatGPT或Anthropic的Claude 2。

据说OpinionGPT使用了一种称为基于指令的微调的过程,它可以对提示做出反应,就好像它代表了11个偏见群体中的一个:美国人,德国人,拉丁人,中东人,青少年,30岁以上的人,老年人,一个男人,一个女人,一个自由派或保守派。

OpinionGPT是根据来自“AskX”社区(Reddit上称为subreddits)的数据集改进的。这些Reddit子部分的示例包括r/AskaWoman和r/AskAnAmerican。

该团队首先找到了与11种特定偏见相关的Reddit子部分,并从每个子部分中提取了25,000个最受欢迎的帖子。然后,它只保留那些满足最低投票阈值、不包含嵌入引用且少于80个单词的帖子。

其余的,研究人员似乎使用了一种类似于Anthropic的体质人工智能的方法。他们没有建立一个全新的模型来代表每个偏差标签,而是本质上微调了一个具有70亿个参数的Llama2模型,为每个预期偏差使用了一个单独的指令集。

基于德国团队研究论文中描述的方法、架构和数据,结果似乎是一个人工智能系统,其功能更像是一个刻板印象生成器,而不是一个研究现实世界偏见的工具。

由于模型所基于的数据的性质以及数据和定义它的标签之间的可疑关系,OpinionGPT可能不一定输出与任何可测量的真实偏差一致的文本。它只是输出反映其数据偏差的文本。

研究人员自己意识到这给他们的研究带来了一些限制,这些警告可以进一步完善。例如,这些帖子来自声称是美国人的人,他们在这个特定的Reddit子部分上发帖,因为论文中没有提到检查特定帖子后面的帖子是否实际上代表了他们声称属于的人口统计或有偏见的群体。

作者接着说,他们打算探索进一步描述人口统计学特征(即自由派德国人和保守派德国人)的模型。

OpinionGPT给出的输出在明显偏差和既定标准之间似乎是不同的,因此很难区分其作为衡量或发现实际偏差的工具的可行性。

科学家创建OpinionGPT来探索明显的人类偏见据OpinionGPT,如上图所示,例如,拉丁美洲人更喜欢篮球作为他们最喜欢的运动。

然而,实证研究清楚地表明,足球(在许多国家也称为橄榄球)和棒球是拉丁美洲最受欢迎的运动。

同一张表还显示,当被要求给青少年一个答案时,OpinionGPT将水球作为其最喜欢的运动输出。从统计数据来看,这个答案似乎不太可能代表世界上大多数13到19岁的青少年。

这同样适用于普通美国人最喜欢的食物是奶酪。Cointelegraph在网上找到了几十个调查,声称披萨和汉堡是美国人最喜欢的食物,但没有任何调查或研究声称美国人的第一道菜只有奶酪。

虽然OpinionGPT可能不适合研究实际的人类偏见,但它可以作为一种工具来探索大型文档库中固有的刻板印象(例如单个子编辑或AI训练集)。

研究人员将OpinionGPT放在网上进行公开测试。然而,根据该网站的说法,潜在用户应该意识到“生成的内容可能是虚假的,不准确的,甚至是淫秽的。”

温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信,我们会及时处理和回复。

原文地址"科学家都创造了什么,科学家创造的":http://www.ljycsb.cn/qukuailian/209045.html

微信扫描二维码投放广告
▲长按图片识别二维码