苹果研究人员称其设备端模型ReALM性能优于GPT-4可大幅提升Siri智能程度
IT之家 4 月 2 日消息,虽然目前 Siri 可以尝试描述信息中的图像,但效果并不稳定。不过,苹果公司并没有放弃人工智能领域的探索。在最近的一篇研究论文中,苹果的人工智能团队描述了一种可以显著提升 Siri 智能的模型,而且他们认为这个名为 ReALM 的模型在测试中优于 OpenAI 的知名语言模型 GPT-4.0。
IT之家注意到,ReALM 的特别之处在于,它可以同时理解用户屏幕上的内容和正在进行的操作。论文将信息分为以下三种类型:
对话实体:指的是与对话相关的内容。例如,用户说“打电话给妈妈”,那么妈妈的联系人信息就是对话实体。
背景实体:指的是与用户当下操作或屏幕显示内容可能并不直接相关的实体,比如正在播放的音乐或即将响起的闹铃。
“我们同时测试了 OpenAI 提供的 GPT-3.5 和 GPT-4.0 模型,并为它们提供了上下文信息,让它们预测一系列可能的实体。GPT-3.5 只接受文本输入,因此我们只提供了文字提示。而 GPT-4 能够理解图像信息,因此我们为它提供了屏幕截图,这显著提升了它的屏幕实体识别性能。”
“我们的模型在识别不同类型实体方面均取得了显著进步,即使是最小的模型,在屏幕实体识别上的准确率也比原有系统提升了 5% 以上。与 GPT-3.5 和 GPT-4.0 的对比中,我们最小的模型与 GPT-4.0 的性能相当,而更大的模型则明显优于它。”
论文的结论之一是,ReALM 即使拥有比 GPT-4 少得多的参数,也能在性能上与之匹敌,并且在处理特定领域的用户指令时表现更加出色,这使得 ReALM 成为一种可以在设备端运行的、实用高效的实体识别系统。
对于苹果而言,如何在不影响性能的情况下将这项技术应用于设备似乎是关键所在,随着 WWDC 2024 开发者大会即将于 6 月 10 日召开,外界普遍期待苹果将在 iOS 18 等新系统中展示更多的人工智能技术成果。
相关文章
- AI美式证件照:一键生成特效让你瞬间变美 ,智能的三大问题:何以、所以、可以
- 打开澳门免费网站资料 - 打开澳门免费网站资料下载手机版V31 ,试用SearchGPT后用户感觉离取代谷歌还很远
- 9100rom藏宝阁app - 9100rom藏宝阁app下载手机版V9 ,DIY硬件频道
- ChatGTP将进入车载系统_车家号_发现车生活_汽车之家 ,智能家居有哪些技术特征
- 建造房子的游戏有哪些 2024有意思的模拟建造手机游戏大全 ,智慧体育公园设施的智能化特点
- AI编程人工智能的第一个“杀手级应用”正在浮现(英特尔BigDL深挖大数据价值助力分布式人工智能广泛落地)
- OPPO ColorOS 15更新:实况照片互传与AI帮写功能不容错过(智慧供热系统:和晟测控引领高效能源管理解决方案)
- 国家电投河北公司 不负“热”爱 “温暖”过冬(建立智慧热网实现无人值守远程监控丨和晟测控)
- 大众图库jpg_大众图库jpgV5(Google推出Gemini Code助手企业版 提供企业级人工智能编程协助)
- AI 生成文章:创新与争议的双刃剑(OpenAI新上线网页版ChatGPT高端语音功能未来或增加视觉体验)