图片提供:微软
微软必应聊天软件在桌面电脑上又有了一次重大更新,支持图像识别,或称OCR。该功能使用OpenAI的ChatGPT-4视觉模型来检测和理解图像中的对象,并通过现实生活中的例子对图像进行详细解释。
微软正在向全球范围内的精选用户推出必应聊天愿景功能。更新后,你会注意到语音图标旁边有一个新的选项,允许你直接将图片上传到聊天室,或者从互联网上粘贴图片并要求必应解释。
这项功能的官方名称是“图像识别”,只有一些用户告诉我们他们可以使用它,这表明这可能是一次随机的A/B测试。在一份声明中,微软官员证实,在经常使用必应聊天的人中,只有不到10%的人会使用必应愿景,这证实了我们的猜测,即这是一次随机的A/B测试。
根据微软的说法,你可以期待在接下来的几周里,必应愿景选项将出现在每个人面前。
重要的是要了解Windows Copilot中也包含该功能。你可以将图像从桌面或文件资源管理器拖放到Copilot上,然后要求人工智能解释图像或创建类似的东西。最后,您可以直接将图像复制到PowerPoint、Word或剪贴板。
必应聊天即将登陆Chrome和Safari。
微软在5月份对Safari和Chrome中的Bing聊天支持进行了简短的测试,我们预计很快就会有正式的声明确认这一扩展。虽然可以通过修改用户代理让Bing Chat在Chrome上运行,但这可能感觉没有必要,特别是因为Bard和其他聊天机器人很容易访问。
除了Chrome和Safari的支持外,微软还希望使用微软的AI来改进Bing Image Creator。
随着Bing插件的整合,这一功能可能会变得更好,官员们表示,微软正计划“大规模推出插件”,以扩展Bing聊天的功能。
该公司计划将每一项功能都变成一个插件,并创建不同的搜索方面。
微软已经对Bing Chat进行了几项重大改进,比如取消了对微软账户的支持。
此前,微软通过强制用户使用微软帐户登录来阻止用户。这一限制已经取消,因为微软现在正试图推动Bing AI的采用,而不是其他服务,如Microsoft Account或Edge。