【CNMO科技】有传言称苹果正秘密研发一款名为Apple GPT的聊天机器人,它基于苹果自家的AI模型,对标OpenAI的ChatGPT。随后几个月,生成式人工智能成了最时兴的投资风口。
在此期间,苹果给出的消息一直模棱两可,但态度却十分坚决。CEO蒂姆·库克告诉投资者,苹果的生成式人工智能将在今年下半年大放异彩,开启新的篇章。而要实现这一目标,苹果似乎很需要谷歌的助力,甚至不排除OpenAI的参与。
消息面上,苹果正在与谷歌谈判,希望获得Gemini AI模型的授权,用于iPhone。这与三星在Galaxy S24系列的策略相似,即在手机上运行谷歌的Gemini Nano模型,而云端则提供更强大的版本。
不过,目前双方尚未达成共识,谈判过程据说相当波折。还有消息称苹果也在与OpenAI进行接触。要知道,OpenAI的基础技术,如GPT-4模型和Dall-E,目前已在Microsoft的产品套件以及ChatGPT Plus等独立应用程序和服务中广泛应用。
“泰坦”陨落,主攻AI
这是苹果人工智能战略的重要一步,既令人期待又让人担忧,因为苹果人工智能可以说脱胎于“泰坦”计划。现在苹果汽车黄了,人工智能研发推进得似乎也很不顺,很难不让人怀疑苹果的研发能力。
2023年末,苹果在MLX集团下低调推出了一系列模型库和框架,以为其专有芯片提供支持。
今年年初,苹果研究部门发布了一篇关于生成式人工智能工具Keyframer的论文,该工具能让用户制作动画内容。虽然它基于OpenAI的GPT-4模型,但结合了处理静态图像的矢量图形技术,也算一项创新。
另外,苹果还发表了一篇研究论文,描述了一种可以通过简单口头指令实现图像编辑的人工智能工具。这一功能与高通最新骁龙芯片所宣传的语音辅助媒体编辑工具包颇为相似。
彭博社后续的一份报告指出,苹果一直在扩大专门负责生成式人工智能功能的团队规模,目标是在2024年让开发人员能够使用这些工具。
有传言称,苹果的首批生成式人工智能功能将在iOS 18上亮相,预计将于6月发布。
今年9月,The Information披露,苹果一直在开发增强Siri的“基础模型”。这一步也与Gemini推进Google Assistant的方式很相似。
那么,Gemini能为iPhone带来哪些功能呢?
当它在手机上运行时,即使手机处于离线状态,也能在录音机应用中汇总对话,就像谷歌的Pixel 8 Pro一样。对于使用Gboard键盘应用的用户来说,从WhatsApp等应用开始,Gemini Nano将智能回复带到了桌面端。它会读取对话内容,并根据上下文提供回复建议。此外,设备上的AI还增加了离线翻译功能,这一功能已在支持Gemini的三星Galaxy S24系列手机上实现。
安装Gemini应用后,用户可以与它进行自然语言对话,获得写作、提出想法等方面的帮助,就像使用Google Assistant或ChatGPT一样。激活Workspace扩展后,用户可以快速汇总电子邮件或文件中的信息,并以列表、图表和表格等形式呈现。用户还可以使用文本提示生成图像,就像使用OpenAI的Dall-E引擎一样。Gemini还能帮助用户以全新方式使用相机,只需将相机对准场景,并向AI询问关于画面中物体的信息。
此外,用户还可以通过“Hey Google”命令召唤Gemini来完成任务,如总结正在阅读的文章。用户还可以使用Google地图和Google航班来规划旅行,甚至创建自定义例程。
iPhone+Gemini,用户抓狂?
三星已经与谷歌紧密合作,让Gemini Nano AI模型在其旗舰手机上运行。但Gemini的应用并不限于旗舰机型。今年2月,联发科宣布其中端天玑8300芯片与旗舰天玑9300一起针对Google Gemini进行了优化。
对于苹果来说,实现类似的功能应该不是难事。如果设备上的许可协议谈不成,还可以考虑应用程序的途径。目前尚不清楚苹果将采取何种策略。
更大的问题是,Gemini的授权协议是否会改变用户与iPhone的互动方式。还有,Siri会因为Gemini而有所改变吗?坦白说,Siri在追赶Google Assistant方面还有很多功课要做。
不过,即便是谷歌自己,也没完全搞清楚Gemini的定位,或者它是否会完全取代Google Assistant。现在,在安卓手机上安装Gemini后,它会试图取代Google Assistant。
但你的手机仍然依赖Google Assistant来完成各种日常任务,比如拨打电话、设置闹钟、发送消息、控制智能家居设备以及创建日历条目。同样,在导航、Gboard和Android Auto中的语音输入方面,Google Assistant仍然是可靠的AI助手,而非Gemini。
此外,Google Assistant仍是Wear OS智能手表等设备的首选AI助手。考虑到苹果在整个硬件生态系统中将其软件紧密地整合在一起,特别是iPhone和Apple Watch之间,Gemini、Google Assistant和/或Siri之间的交错方式可能会给普通用户带来困惑。
或许,苹果可以与谷歌紧密合作,创建独家集成,将Gemini与苹果生态系统的功能(如Siri、邮件、便笺、Safari、日历、健康等)联系起来。但鉴于Gemini数据存储策略的现状,外界并不期待如此紧密的系统级集成。
与谷歌合作有风险
当然,苹果错过了智能手机上生成式AI的第一波浪潮,现在需要全力追赶。但Gemini的授权协议也可能意味着我们永远看不到苹果在“Ajax”项目上开发的生成式AI内容。或许,我们只会看到它的稀释版,而Gemini将成为iPhone上最重要的AI工具。
但Gemini并非完美无缺。相反,它比任何其他主流生成式AI工具都更容易出问题。几周前,Gemini用户发现它生成的图像非常不准确,特别是对肤色等处理不当。出现这个问题后,谷歌关掉了Gemini的文本到图像生成功能。
对于像苹果这样注重政府法规的公司来说,为全球数亿台设备授权Gemini确实是一个不小的风险,连谷歌自己都说“Gemini会犯错误”。