以下文章节选自丨钛媒体
在上周,苹果公司突然公布了一则大新闻——
北京时间4月25日凌晨,苹果在 Hugging Face 平台上发布一个“具有开源训练和推理框架的高效语言模型”,名为OpenELM。
据了解,OpenELM有四种尺寸:2.7亿、4.5亿、11亿和30亿个参数版本,定位于超小规模模型,而微软Phi-3模型为38亿。这种小模型运行成本更低,可在手机和笔记本电脑等设备上运行。
同时,在WWDC24开发者大会之前,苹果彻底开源了OpenELM模型权重和推理代码,数据集和训练日志等。而且,苹果还开源了神经网络库CoreNet。
早在今年2月,苹果公司CEO蒂姆·库克就表示,苹果生成式 AI 功能将于“今年晚些时候”推出,有消息称即将在6月发布iOS 18可能是苹果iOS史上“最大”的更新,而9月也将推出首款AI加持的iPhone设备。
如今,苹果似乎在新一轮AI浪潮快到尾声的时刻追赶上了行业脚步。
开源代码:https://github.com/apple/corenet
在线体验:https://huggingface.co/apple/OpenELM
论文研究:https://arxiv.org/abs/2404.14619
据了解,本次发布的苹果开源大模型OpenELM,预训练Tokens数量相比于此前开源社区发布的OLMo模型减少了一半,仅有11亿的数据集参数规模,但是苹果模型性能效果甚至比竞品更精准。
随着ChatGPT风靡全球,近几个月来,三星、谷歌、小米等手机厂商全面推进大语言模型在手机、平板等端侧上的使用,包括照片处理、文字处理增强等,并形成一大卖点。而苹果很少透露并极少有类似的自带功能,主要是用第三方工具做到类似效果。
今年2月财报会议上,库克首次公布生成式 AI 计划,并将在今年晚些时候将 AI 技术集成到其软件平台(iOS、iPadOS 和 macOS)中。
库克表示:
我只想说,我认为苹果在生成式 AI 和 AI 方面存在着巨大的机会,无需透露更多细节,也无需超出自己的预期。展望未来,我们将继续投资于这些和其他将塑造未来的技术。其中包括 AI,我们继续在 AI 领域花费大量时间和精力,我们很高兴能在今年晚些时候分享我们在该领域正在进行的工作的细节。我们对此非常兴奋。