下载网

高新技术

苹果开发出新款AI:能"看懂"屏幕上内容并用语音回复

3DM游戏网 日期:

苹果公司的研究团队最近发表了一篇论文,宣布他们成功开发出了一款创新的人工智能系统。这个系统能够准确地理解屏幕上模糊的内容及其相关对话和背景环境,进而实现与语音助手更加自然的互动。

这个系统被命名为ReALM(Reference Resolution As Language Modeling,即以语言建模为基础的参考解析),它通过大语言模型的运用,将理解屏幕视觉元素指向的复杂任务转化为一个纯粹的语言问题。这一转换使得ReALM在性能上相较于现有技术有了显著的提升。

苹果研究团队强调:“让对话助手能够理解上下文,包括相关的内容指向,非常关键。能让用户根据他们所看到的屏幕内容进行提问,是确保真正实现语音操作体验的重要一步。”

增强对话助手的能力

ReALM的一大创新在于它能够重新构建屏幕内容,即通过分析屏幕上的信息及其位置信息来生成文本表示,这一点对捕捉视觉布局至关重要。研究人员展示了这种方法与专为内容指向调整的语言模型结合起来,能在执行相关任务时超越GPT-4的性能。

研究人员表示:“我们对现有系统进行了显著改进,在处理多种类型的内容指向时均展现出卓越性能。我们的最小模型就实现了超过5%的性能提升,而大型模型的表现则明显超过了GPT-4。”

实际应用与局限性

这项研究凸显了专注于语言模型在处理如内容指向解析等任务上的巨大潜力。由于响应时间或计算资源的限制,大型端到端模型往往难以实施。通过这项创新性研究,苹果展现了其持续投入,使Siri等产品在对话和理解上下文方面更加出色。

尽管如此,研究人员也指出,依靠自动化解析屏幕内容仍然面临挑战。在处理更复杂的视觉内容,比如区分多个相似图像时,可能需要结合计算机视觉和多模态技术。

努力缩小与AI竞争对手差距

虽然在人工智能领域苹果曾稍显落后,但它正在默默取得显著进展。从融合视觉与语言的多模态模型,到开发AI驱动的动画工具,再到构建高性能的专业AI技术,苹果的研究实验室持续实现技术突破。

面对谷歌、微软、亚马逊和OpenAI等公司的激烈竞争——这些公司已在搜索、办公软件、云服务等领域推出了先进的AI产品——作为一个以保密闻名的科技巨头,苹果正努力不落人后。

长期以来,苹果更多在创新领域扮演跟随者而不是领先者的角色,现在正面临着一个由人工智能快速改变的市场。在6月举办的全球开发者大会上,苹果预计将推出新的大语言模型框架、“Apple GPT”聊天机器人及其生态系统中的其他AI功能。

“我们很高兴今年晚些时候分享我们在人工智能方面的工作进展,”首席执行官蒂姆·库克(Tim Cook)最近在一次盈利电话会议上暗示。尽管苹果向来低调,但其在AI领域的广泛努力已经引起了业界的广泛关注。

然而,在日益激烈的人工智能领域竞争中,苹果的相对滞后使其处于不利地位。但凭借其雄厚的资金实力、品牌忠诚度、一流的工程师团队和紧密整合的产品线,苹果仍有机会扭转局面。

更新于:5个月前

相关资讯

  • 苹果在欧洲再遭集体诉讼:被指赚取2.59亿欧元不正当利润

    快科技9月19日消息,近日,欧洲消费者权益组织Euroconsumer在比利时、意大利、西班牙和葡萄牙联合发起了针对苹果公司的集体诉讼。诉讼的核心问题是苹果公司在其应用商店(App Store)中对非苹果音乐流媒体服务的高额收费,这被认为是抬高音乐流媒体服务订阅费用的主要原因。Euroco..
  • 《最终幻想 XVI》,《战神:诸神黄昏》等游戏发布并借助DLSS 3提升性能

    每周都有新游戏支持NVIDIA DLSS、NVIDIA Reflex和先进的光线追踪技术,为GeForce RTX玩家提供出色的游戏体验。《战神:诸神黄昏》(God of War Ragnarök)、《最终幻想 XVI》(FINAL FANTASY XVI)、《丧尸围城豪华重制版》(Dead Rising Deluxe Remaster)和《艾诺提亚:失落之歌》(Enotr..
  • iPhone 16电商平台已破发 起价降至5799元

    iPhone 16系列手机将于9月20日正式上市。目前,苹果官网显示iPhone 16、iPhone 16 Plus发货时间延迟至10月1日。iPhone 16 Pro Max最晚送达时间为10月17日。此外,iPhone 16 起售价5999元,但在电商平台上,起售价已降至5799元。..
  • Wi-Fi HaLow再次创下Wi-Fi连接距离记录 近16公里

    早在今年1月,无线科技公司Morse Micro使用Wi-Fi HaLow标准(802.11ah)的设备,创下了3公里的Wi-Fi连接距离新记录。HaLow标准发布于2016年初,不过到近期才开始加速。本次测试中,Morse Micro在远离Wi-Fi热点的情况下启动视频通话,连接速度从500米处的11 Mbps到3公里处的1 Mbps..
  • 联想将在印度生产AI服务器:预计年产能5万台

    9月18日消息,联想日前宣布,将在印度南部的工厂开始生产人工智能(AI)服务器,并在班加罗尔设立一个以AI服务器为重点的研发实验室。联想计划每年在印度普杜谢里的工厂生产5万台AI机架式服务器和2400台GPU服务器,这些服务器专为机器学习和深度学习等资源密集型任务设计。联想亚太..
  • 中国可重复使用运载火箭大突破 商业航天迎来万亿级市

    快科技9月18日消息,近日,朱雀三号VTVL-1可重复使用垂直起降回收试验箭,在中国酒泉卫星发射中心成功完成了十公里级的垂直起降返回飞行试验。这一成就标志着中国商业航天在可重复使用运载火箭技术上取得了重大突破,为未来实现大运力、低成本、高频次的航天发射奠定了坚实基础。..
  • 特斯拉第1亿颗4680电池下线 Optimus扮演“微小”助力

    特斯拉在降低电池生产成本方面迎来了新助力。特斯拉制造了大量电池。现在,它获得了一位新员工的意外帮助。周六,特斯拉(TSLA.O)在推特上宣布,其生产的4680电池单元已达1亿个。这些是特斯拉更大、更先进的电池,具有更高的能量、更长的续航里程和更低的生产成本。“4680”这个..
  • AMD与笔电OEM厂商关系紧张 沟通、供应和支持都很差

    AMD在COMPUTEX 2024上带来了全新的Zen 5系列架构,并发布了采用新架构的消费级处理器,包括面向移动端的Ryzen AI 300系列。不过直到现在,市场上能看到搭载新款处理器的笔记本电脑并不多,可选的品牌和型号数量都很少,这似乎不是偶然的现象。据ComputerBase报道,多份来自于OEM厂..
  • 苹果确认欧盟的iPad用户可通过第三方下载APP 9月16日起实行

    快科技9月16日消息,据媒体报道,苹果宣布将对欧盟地区的iOS系统、Safari浏览器和App Store进行更改,以遵循欧盟的《数字市场法案》(DMA)。此次调整涵盖了超过600项新增的应用程序接口(API),旨在增强App分析功能,引入支持替代浏览器引擎的能力,并提供更加灵活的App支付机制..
  • 百度联盟大会发布首个智能体联盟解决方案

    IT之家9月16日消息,9月12日,2024年百度联盟大会在深圳召开。百度向联盟伙伴展示了智能体在开发平台、分发场域以及变现解决方案等方面的全链路布局。除此之外,百度还对联盟生态进行了全面升级,发布智能体联盟变现解决方案以及“分发 + 变现”一体化解决方案,为联盟伙伴及智能..

我要评论

全部评论