本文作者:李丹
来源:硬AI
微软本周二连出大招,个人人工智能(AI)助手Copilot迎来重磅升级,微软开始向所有Windows系统的用户推出一系列新的Copilot功能,包括可以理解并回应电脑屏幕问题的新工具。同时,微软网络搜索引擎必应(Bing)正式上线AI生成概括摘要功能,正面硬刚谷歌的同类生成式 AI搜索功能AI Overviews。
从美东时间10月1日周二,微软推出适用于苹果系统iOS、谷歌安卓系统、Windows和网页的Copilot新版App,称所有这些App的风格都更“独特”、更“暖心”。微软还将聊天机器人引入Meta旗下社交媒体WhatsApp,让用户通过直接消息(DM)与 Copilot 聊天,类似于在 Meta 的消息平台上使用其他机器人的体验。
Copilot Vision解读网站内容 对话后数据即刻删除
Copilot Vision 是Copilot拥有的最突出功能,顾名思义,它可以看到用户在个人电脑(PC)上查看的内容,具体来说,可以查看用户使用 微软AI浏览器Microsoft Edge 访问的网站。
Copilot Vision是一种全新 Copilot Pro 专属实验性可选功能。用户可以让它分析网页上的文本和图像,并回答有关这些网页内容的用户问题,例如用户可以问,怎么做图片显示的食物,让Copilot提供食谱。
用户可以通过在 Edge 的地址栏中输入“@copilot”调出,和谷歌在安卓系统和Chrome浏览器中提供的搜索技术类似。但微软表示,Copilot Vision 比过去的屏幕分析功能更强大,也更注重隐私。
微软称,Copilot Vision可以建议用户接下来要采取哪些步骤,回答用户的问题,帮助引导指向用户想要做的任何事,并协助完成任务,用户只需用自然语言与它交谈即可。比如用户想布置一个新公寓。Copilot Vision 可以帮助搜索家具,找到合适的调色板,考虑从地毯到毯子等所有选择,甚至建议如何布置用户正在看的物品。
隐私方面,微软强调,用户可以在同Copilot Vision对话后立即删除对话数据。该功能处理过的音频、图像或文本不会被存储或用于训练模型,至少在这个预览版本中不会。而且Copilot Vision 能够解析的网站类型也受到限制,只能分析解读预先批准的“热门”网站。目前,微软阻止该功能处理付费墙内的网站收费内容和“敏感”内容,不过并未透露哪些属于敏感内容。
Copilot Vision目前仅在美国上线。微软表示,该功能将尊重网站的“对AI的机器可读控制”,例如禁止机器人抓取用于 AI 训练的数据的规定。但该公司尚未明确说明 Vision 将尊重哪些控制;目前有几种控制正在使用。我们已要求微软澄清。
Copilot Daily提供语音时事摘要 微软向合作出版商付费
微软周二发布了名为Copilot Daily的新闻功能,为用户提供天气和时事的语音摘要。为支持该功能,微软将向出版商支付费用,购买出现在Copilot Daily中的内容。
亚马逊和谷歌的语音助手Alexa 和 Google Assistant早就在提供类似的每日简报。微软称,Copilot Daily“可以化解人们熟悉的信息过载感觉”,它“简洁、简单且易于理解,只会从授权内容来源中提取内容”,随着使用时间推移,该功能将提供提醒和自定义选项。
微软目前仅在美国和英国上线Copilot Daily功能。路透社、Axel Springer、Hearst Magazines、今日美国网络和《金融时报》同微软合作,提供该功能的信息来源。微软称,计划“很快”增加付费出版商,并将 Copilot Daily 扩展到更多国家。
Think Deeper推理复杂问题 或为OpenAI o1模型支持
与 Vision 一样,Copilot 的新功能 Think Deeper 旨在让微软的AI助手更加灵活。
微软表示,Think Deeper 让 Copilot 能够推理更复杂的问题,这要归功于“推理模型”,这累模型需要更多时间进行推理,然后给出分步骤的回答。微软并未透露具体哪些推理模型,只是说用的是“OpenAI 的最新模型,微软进行了微调”。媒体判断,应该是指OpenAI的o1模型定制版。
从本周二起,Think Deeper向澳大利亚、加拿大、新西兰、美国和英国的 Copilot Labs 限量的用户开放。
Copilot Voice类似ChatGPT高级语音模式
Copilot 的新功能是 Copilot Voice首先在新西兰、加拿大、澳大利亚、英国和美国推出英语版本,微软添加了四种合成的声音,让用户可以从中选择交谈的Copilot用哪种声音。
和OpenAI为 ChatGPT 提供的高级语音模式 Advanced Voice Mode一样,Copilot Voice 可以在对话过程中识别用户的语气,并做出相应的回应,用户还可以在 Copilot Voice 应答时随时插话,和与人类对话时一样。
不过,Copilot Voice 有使用时长方面的限制。微软称,Copilot Pro的订阅用户可以获得更多的Copilot Voice 对话时间,但具体时长是“可变的”,视需求而定。
个性化(Personalization)利用过往互动推荐Copilot用法
微软表示,启用新的个性化设置后,Copilot 很快将更加符合用户的偏好。它将利用用户过去的互动和历史记录,以及与其他微软应用和服务的互动,向用户推荐使用 Copilot 的方法。这样可以帮助用户使用Copilot入门,“既提供了 Copilot 实用功能的便捷指南,也提供了对话开场白。”
Copilot 的个性化功能可以在 Windows 的 Copilot 设置菜单中关闭,近期不会在英国和欧盟国家推出。
必应生成式搜索周二在美国上线
今年7月,微软推出了必应生成式搜索的试用版,本周二,该服务正式面向所有美国用户上线。调用它的最简单方法是在 必应上搜索“Bing generative search”。
微软称,将要推出一个选择,以便用户更轻松地触发 Bing 生成搜索以进行“信息查询”。
必应生成式搜索被视为微软正面对战谷歌AI搜索的产物。华尔街见闻5月曾介绍谷歌当月在2024 Google I/O开发者大会上推出的搜索模式三大革新,其中之首就是名为AI Overviews的AI生成摘要功能,它将生成的摘要展示在搜索结果顶部。
必应生成式搜索给予多种AI模型汇总来自互联网的信息,生成响应搜索查询的摘要内容。比如当用户搜索查看“什么是意大利式西部片?”这个问题时,必应生成式搜索将显示该类型片的历史和示例的摘要,以及来源链接。
微软认为,必应生成式搜索的功用不仅限于找答案。微软称它能理解搜索查询,审查数百万个信息源,动态匹配内容,并以新的 AI 生成布局生成搜索的结果,从而更有效地满足用户查询的意图。
本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里