微软必应聊天的GPT4集成为Windows 11带来了强大的图像识别功能

运维资讯 2023-07-09 法医手机阅读

图片提供：微软

微软必应聊天软件在桌面电脑上又有了一次重大更新，支持图像识别，或称OCR。该功能使用OpenAI的ChatGPT-4视觉模型来检测和理解图像中的对象，并通过现实生活中的例子对图像进行详细解释。

微软正在向全球范围内的精选用户推出必应聊天愿景功能。更新后，你会注意到语音图标旁边有一个新的选项，允许你直接将图片上传到聊天室，或者从互联网上粘贴图片并要求必应解释。

这项功能的官方名称是“图像识别”，只有一些用户告诉我们他们可以使用它，这表明这可能是一次随机的A/B测试。在一份声明中，微软官员证实，在经常使用必应聊天的人中，只有不到10%的人会使用必应愿景，这证实了我们的猜测，即这是一次随机的A/B测试。

根据微软的说法，你可以期待在接下来的几周里，必应愿景选项将出现在每个人面前。

重要的是要了解Windows Copilot中也包含该功能。你可以将图像从桌面或文件资源管理器拖放到Copilot上，然后要求人工智能解释图像或创建类似的东西。最后，您可以直接将图像复制到PowerPoint、Word或剪贴板。

必应聊天即将登陆Chrome和Safari。

微软在5月份对Safari和Chrome中的Bing聊天支持进行了简短的测试，我们预计很快就会有正式的声明确认这一扩展。虽然可以通过修改用户代理让Bing Chat在Chrome上运行，但这可能感觉没有必要，特别是因为Bard和其他聊天机器人很容易访问。

除了Chrome和Safari的支持外，微软还希望使用微软的AI来改进Bing Image Creator。

随着Bing插件的整合，这一功能可能会变得更好，官员们表示，微软正计划“大规模推出插件”，以扩展Bing聊天的功能。

该公司计划将每一项功能都变成一个插件，并创建不同的搜索方面。

微软已经对Bing Chat进行了几项重大改进，比如取消了对微软账户的支持。

此前，微软通过强制用户使用微软帐户登录来阻止用户。这一限制已经取消，因为微软现在正试图推动Bing AI的采用，而不是其他服务，如Microsoft Account或Edge。

微软悄然推出 Copilot Android 版应用