Tech

微软希望将Windows打造成人工智能操作系统,推出Copilot+ PC

微软希望将生成式人工智能引入Windows和运行Windows的PC上。

在本周举行的年度Build开发者大会上,公司在两场主题演讲中推出了一系列称为Copilot+ PC的新Windows设备,以及生成式人工智能功能,如Recall,帮助用户找到他们过去查看过的应用程序、文件和其他内容。微软品牌的生成式人工智能Copilot将很快更深入地整合到Windows 11的体验中。并且新的微软Surface设备即将推出。

我们在这里总结了周一和周二的所有重要公告。

体积应用

微软正在将Windows体积应用(基本上是空间感知、互动的VR应用程序)带到Meta Quest头戴式显示设备上。通过与Meta的合作,微软表示将向Quest头戴式显示设备提供Windows 365和本地PC连接,使开发人员能够将他们的应用程序扩展到3D空间。

图片来源:微软

在周二的主题演讲中,微软展示了从Meta Quest 3头戴式显示器的视角展示的Xbox控制器的数字爆炸式3D视图,佩戴者可以用双手操纵数字对象。“我们正在加深与Meta的合作,使Windows在Quest设备上成为一流体验。”微软Windows和设备CVP Pavan Davuluri在演示中说。

开发人员可以注册预览版,获取微软的新体积API访问权限。

Copilot+ PC

图片来源:微软

Copilot+ PC是微软AI优先、旗舰级Windows硬件的愿景。所有设备均配备名为NPU的专用芯片,用于支持Recall等人工智能体验。并且它们配备至少16GB的RAM,配备SSD存储。

首批Copilot+ PC将搭载高通的Snapdragon X Elite和Plus芯片,微软声称可提供长达15小时的网页浏览和20小时的视频续航时间。芯片制造商英特尔和AMD还承诺与一系列制造商合作,包括宏碁、华硕、戴尔、惠普、联想和三星,为Copilot+设备构建处理器。

Copilot+ PC起售价为999美元,部分产品今天已可预订。

Surface Pro和Surface Laptop

微软新推出的Surface设备,Surface Laptop和Surface Pro,注重性能和电池续航。

图片来源:微软

最新的Surface Laptop — 提供13.8英寸或15英寸显示屏 — 经过重新设计,拥有“现代线条”和更薄的屏幕边框。它的续航时间长达22小时,比Surface Laptop 5快86%,还支持Wi-Fi 7,并带有触觉反馈触控板。

图片来源:微软

至于新版Surface Pro,微软表示它比上一代Surface Pro(Surface Pro 9)快90%,配备了新的OLED和HDR显示屏,Wi-Fi 7(可选5G)和升级的超广角前置摄像头。此外,其可拆卸键盘 — 已增加额外的碳纤维 — 现在具有触觉反馈。

Recall

Windows 11即将推出的Recall功能可以“记住”用户几周甚至几个月前在其PC上访问的应用程序和内容,例如帮助他们找到一个Discord聊天,讨论他们考虑购买的衣服。用户可以使用Recall的时间轴“滚动回”到最近的工作内容,并在文件中查找像PowerPoint演示文稿这样的信息,以发现可能与他们搜索相关的信息。

微软表示,Recall可以通过颜色、图像等创建关联,让用户以自然语言搜索他们PC上的几乎任何内容(类似于初创公司Rewind的技术);开发人员将能够通过向他们的应用程序添加上下文信息来改进Recall。微软声称,与Recall相关的所有用户数据都将保持私密性并存储在设备上,并且不会用于训练人工智能模型,这一点非常重要。

微软表示:“您的快照是您的;它们保存在本地PC上。您可以从任务栏中的系统托盘上的图标或在设置中删除单个快照,调整和删除时间范围,或在任何时候暂停。您还可以过滤不想被保存的应用程序和网站。”

图像编辑和实时翻译

现在,在Windows中有更多的人工智能,其中一些专门用于新款Copilot+ PC。

一项名为Super Resolution的新功能可以通过自动放大来恢复旧照片。而Copilot现在可以分析图像,为用户提供有关创意构图的想法。通过称为Cocreator的功能,用户可以生成图像,并要求AI模型跟随他们所绘制的来改变或重塑图像。

图片来源:微软

此外,带有实时翻译功能的Live Captions可将通过PC传输的任何音频 — 无论是来自YouTube还是本地文件 — 翻译成用户选择的语言。实时翻译将最初支持约40种语言,包括英语、西班牙语、普通话和俄语。

与此相关的另一项新功能在微软Edge中提供了在LinkedIn、YouTube、Coursera、路透社、CNBC、彭博社等网站上的实时视频翻译。该功能将很快推出,支持将西班牙语翻译成英语以及英语翻译成德语、印地语、意大利语、俄语和西班牙语 — 通过配音和即时字幕的方式翻译口语内容。

团队Copilot和扩展

Team Copilot是微软日益增长的Copilot套件生成式人工智能技术的最新扩展。它与Teams,公司的视频会议应用程序集成,以帮助管理会议议程和笔记,任何参加会议的人都可以共同撰写。它还延伸到Loop和Planner,微软的协作和规划平台,用于创建和分配任务、跟踪截止日期,并在需要团队成员提供输入时通知他们。

图片来源:GitHub / 微软

在与Copilot有关的另一个新闻中,微软已推出(私人预览版)Copilot扩展,允许开发人员使用第三方应用程序和技能扩展GitHub的代码生成工具GitHub Copilot。推出合作伙伴包括DataStax、Docker和LambdaTest;扩展将位于GitHub市场中,但开发人员也将能够创建自己的私人扩展,以与其内部系统和API集成。

Windows Copilot Runtime

图片来源:微软

支持Recall和Super Resolution等功能的是Windows Copilot Runtime,这是约40个生成式人工智能模型的集合,构成了微软所描述的“Windows新层”。与语义索引一起,这是一个基于矢量的系统,局限于个体Copilot+ PC,Windows Copilot Runtime允许生成式人工智能应用程序 — 包括第三方应用程序 — 在不一定需要互联网连接的情况下运行。

“[该运行时]由可用的AI API组成,如Studio Effects、Live Captions translations、OCR、与用户活动相关的Recall等,在6月份将提供给开发人员。”Davuluri在周二表示。

微软表示,抖音母公司字节跳动的知名视频编辑器CapCut将使用Windows Copilot Runtime和配套的新Windows Copilot库,一组API和AI开发工具,以加速其AI功能的速度。而Meta将向WhatsApp添加上述的Studio Effects,以提供背景模糊和视频通话中的眼神接触等功能。

升级的机器人构建工具

Azure AI Studio是微软Azure OpenAI服务中的工具集,使客户可以结合AI模型构建可以“推理”数据的应用程序。开发人员很快将能够使用按使用量计费的推理API创建应用程序 — 通过这些API,开发人员可以访问和调整托管在Azure基础架构上的生成式人工智能模型。微软称之为“模型即服务”,并且从Nixtla和Core42起步的模型将推出。

在相邻的Copilot Studio产品套件中,微软推出了Copilot agents,公司将这些描述为可以“独立协调针对特定角色和功能定制的任务”的人工智能机器人。(Copilot Studio提供工具,将在Excel和Word等应用程序中的AI助手“Copilot”连接到第三方数据。)利用内存和上下文的知识,Copilot agents可以驾驭各种类型的业务工作流程,从用户反馈中学习,并在遇到不知道如何处理的情况时寻求帮助。

骁龙Dev套件

图片来源:微软

高通针对为搭载Arm芯片的Copilot+ PC构建应用程序的开发人员推出了一款新的开发套件。

售价为899.99美元的Windows骁龙Dev套件 — 大约和苹果的Mac Mini一样宽、高和长 — 搭载有高通的Snapdragon X Elite芯片,配备32GB的RAM、512GB的存储和大量I/O。Dev套件支持Wi-Fi 7和蓝牙5.4,并且通过其各种USB-C和HDMI端口,可以同时驱动三台4K显示器。

Phi-3

微软宣布了其生成式人工智能模型系列Phi的新增成员Phi-3-vision,该模型可以进行通用的视觉分析和推理任务,例如回答有关图表和图像的问题。该模型可以读取文本和图像,而且高效到可以在移动设备上运行。

Phi-3-vision目前正在预览中,而之前宣布的文本模型Phi-3-mini、Phi-3-small和Phi-3-medium现在已经普遍可用。

与Khan Academy的合作

微软正在与Khan Academy合作,捐赠云计算基础设施访问权限,使Khan Academy可以向美国的教育工作者免费提供Khan Academy的人工智能工具。两家公司还将合作探索通过生成式人工智能改进数学辅导应用程序的机会,微软周二表示。

我们正在推出一个人工智能新闻简报!立即在此处注册,从6月5日开始在您的收件箱中收到。

Related Articles

Back to top button Back to top button