最近又迎来了苹果和华为两大重量级选手,端侧AI模式的新赛道,为智能终端(主要是手机)走出低迷提供了新的希望和动力。
苹果GPT是苹果基于其自主开发的Ajax框架开发的AI工具,目前正在苹果内部进行小范围测试。华为通过8月4日下午举行的HDC 2023开发者大会上发布的智能助手鸿蒙系统4的“小艺术”,展示了端侧AI大模型在应用层面的能力。
此前,Meta、OpenAI、高通、谷歌、腾讯、百度等。已经或即将推出支持端侧AI大模型的应用或技术框架,正在快速勾勒这一新方向的技术和市场前景。
鸿蒙系统4:什么是端侧AI大模型能力?8月4日,华为正式发布鸿蒙系统4。华为鸿蒙系统是面向万物互联的全场景分布式操作系统,支持手机、平板、智能穿戴、智能屏幕等多种终端设备的操作。
在华为著名的物联网操作系统第四版中,端侧AI大模型(即在手机端运行大模型)的能力成为关键核心。
“今天我们已经进入大模式时代,华为盘古模式将助力鸿蒙系统的生态。”华为董事总经理、终端BG CEO、智能汽车解决方案BU CEO余承东表示,“通过盘古底层能力的加持,华为将为用户带来智能终端交互、高水平生产力效率、个性化服务的全新AI体验变革。”
基于人工智能大模型的文本生成是鸿蒙系统4的一部分。随着大模式的发展,小I得到了全面升级,在交互、生产力和个性化服务方面的能力都得到了增强。
文字生成和总结能力,这是各家公司推出大型模型应用的标配能力,鸿蒙系统4也不例外。通过小美术,可以识别图片中的内容和文字,大声朗读文字,访问更多服务。
高通产品管理高级副总裁兼人工智能负责人Ziad Asghar认为,大模型将迅速重塑人机交互的方式。
鸿蒙系统4的交互变化看起来并不显著。在语音交互的基础上,扩展了文字、图片、文档等多种输入形式。比如,通过日常说话的方式与AI自然交流,小I就可以自动完成分配的任务。这已经通过Siri在iPhone上实现了。
但作为第一个具备AI大模型能力的智能助手,小I对自然语义的理解更加深入。
比如iPhone的AI助手Siri,需要C端用户输入清晰精准的语音命令,而鸿蒙系统4可以理解相对意义不太明显的语音命令,因此搭载鸿蒙系统4的智能手机可以更准确快速地完成任务。
此外,由于小I对大模型AI的泛化能力,以及手机智能助手与各种服务和特殊场景的连接,也可以比以前更快地获取服务。
比如收到一张活动海报的图片,C端用户给小I一个指令,AI就可以自动识别图片上的地址,给出导航按钮或者保存海报手机作为联系方式。
如果浏览一条几千字的英文新闻,小易可以直接快速阅读文章,翻译并完成摘要,还可以回答与新闻相关的问题。
鸿蒙系统4号也有能力产生。比如自动生成各种商业邮件内容或者生成图片;还可以使用终端保存的个性化照片,小I调用AI画图功能生成各种风格的图片。
随着C端用户与小I的不断沟通,小I将不断提升AI能力。这些交互数据将保留在终端,以保护用户的隐私。
个性化是智能手机应用的特点。小易的记忆能力会随着长期使用越来越熟悉“主人”,给出的建议也会更加贴心:比如出行时,出行前提供完整丰富的出行信息,落地后提供当地信息,根据用户习惯实现个性化推荐。
据华为透露,小I的这些新能力将于8月下旬开始公测体验。
这已经不是华为第一次尝试将AI大模型连接到移动端。今年3月,华为发布的P60手机自带智能地图搜索功能。该功能基于多模态大模型技术。通过手机端的模型小型化,实现手机端的大模型操作。
苹果的动作很慢,而高通的热情很高。不仅仅是华为,还有苹果。
苹果正在秘密开发的GPT软件被称为苹果GPT,它基于苹果开发的Ajax框架。
不过,目前苹果GPT缺乏更多细节,外界很难知道其技术或应用能力有哪些亮点。对此,苹果公司明确表示,苹果GPT公司的未来发展方向尚未决定。
此前,在第二财季财报电话会议上,苹果CEO库克承认,al潜力巨大,但如何利用AI技术仍需深入思考。库克表示,苹果已经将AI技术融入到产品和服务中,未来将继续这一进程。
全球首款面向消费市场、大规模落地、应用NLP技术的智能助手——iPhone Siri,今年已经12岁了。与华为小I、小米萧艾、百度小度等新升级的“年轻一代”相比,Siri不仅不智能,还有点“智障”。
外界认为苹果GPT能力的载体很可能是Siri,处于“隔年”状态,但这一点并未得到苹果的证实。
尽管如此,苹果即将到来的AI模式还是有很多迹象。例如,今年1月,苹果推出了一项新计划,在Apple Books中加入数字旁白功能,从书面文本中自动生成高质量的AI旁白音频;在iOS17的更新版本中,苹果使用了Transformer语言模型来改进输入法的预测和拼写纠正功能。
此外,新款AirPods Pro通过机器学习(ML)实现自适应音频模式,可以通过识别外界环境自动调节音量;IPadOS 17使用机器学习模型识别PDF字段;Vision Pro使用机器学习技术“编码器-解码器”神经网络为用户构建数字头像。
苹果如何布局AI赛道,这是一个系统性的问题,很难用几百字来解释。然而,Siri开发团队的技术工程师似乎缺乏真正的动力来改变Siri的“愚蠢”,这反映了“组织功能障碍和缺乏雄心”的现实,很可能会影响苹果在端侧落地AI模型的效率。
但苹果的低效并不能改变端侧AI模式在智能终端的部署规模,这是不争的事实。因为高通、Meta、OpenAI、Google、亚马逊、腾讯、百度都致力于实现AI大模型在移动终端的轻量级部署。
OpenAI团队在7月的第四周推出了覆盖iOS/ Android系统的移动ChatGPT应用;Meta将与高通合作。从2024年起,其开源模型Llama 2将能够在旗舰智能手机和个人电脑上运行。高通表示,它正在将更多的生成性人工智能用例迁移到边缘。目前超过10亿个参数的AI模型已经可以在手机上运行,性能和准确率都达到了类似云端的水平。
谷歌、腾讯、百度等。将模型压缩技术与移动模型部署框架/工具紧密集成。
其中,高通对此充满热情。高通首席执行官克里斯蒂亚诺·阿蒙(Cristiano Amon)在一份声明中强调,高通可以在手机上而不是云服务器上运行AI模型,这为高通实现“拐点”提供了机会,从而促进未来的增长。
“简而言之,我们处于一个独特的位置,可以帮助塑造和利用设备上即将到来的Gen AI机会。”阿蒙说。
智能手机市场的整体下滑何时停止还不确定;而端侧AI模式赛道迎来的B端参与者浪潮,则是重塑这个没落的消费电子品类的应用和市场格局的新希望。
温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信,我们会及时处理和回复。
原文地址"aida模型,ai模型设计":http://www.ljycsb.cn/qukuailian/209627.html。

微信扫描二维码投放广告
▲长按图片识别二维码