微软必应聊天的GPT4集成为Windows 11带来了强大的图像识别功能

2023年 7月 9日 41.0k 0

图片提供:微软

微软必应聊天软件在桌面电脑上又有了一次重大更新,支持图像识别,或称OCR。该功能使用OpenAI的ChatGPT-4视觉模型来检测和理解图像中的对象,并通过现实生活中的例子对图像进行详细解释。

微软正在向全球范围内的精选用户推出必应聊天愿景功能。更新后,你会注意到语音图标旁边有一个新的选项,允许你直接将图片上传到聊天室,或者从互联网上粘贴图片并要求必应解释。

这项功能的官方名称是“图像识别”,只有一些用户告诉我们他们可以使用它,这表明这可能是一次随机的A/B测试。在一份声明中,微软官员证实,在经常使用必应聊天的人中,只有不到10%的人会使用必应愿景,这证实了我们的猜测,即这是一次随机的A/B测试。

根据微软的说法,你可以期待在接下来的几周里,必应愿景选项将出现在每个人面前。

重要的是要了解Windows Copilot中也包含该功能。你可以将图像从桌面或文件资源管理器拖放到Copilot上,然后要求人工智能解释图像或创建类似的东西。最后,您可以直接将图像复制到PowerPoint、Word或剪贴板。

必应聊天即将登陆Chrome和Safari。

微软在5月份对Safari和Chrome中的Bing聊天支持进行了简短的测试,我们预计很快就会有正式的声明确认这一扩展。虽然可以通过修改用户代理让Bing Chat在Chrome上运行,但这可能感觉没有必要,特别是因为Bard和其他聊天机器人很容易访问。

除了Chrome和Safari的支持外,微软还希望使用微软的AI来改进Bing Image Creator。

随着Bing插件的整合,这一功能可能会变得更好,官员们表示,微软正计划“大规模推出插件”,以扩展Bing聊天的功能。

该公司计划将每一项功能都变成一个插件,并创建不同的搜索方面。

微软已经对Bing Chat进行了几项重大改进,比如取消了对微软账户的支持。

此前,微软通过强制用户使用微软帐户登录来阻止用户。这一限制已经取消,因为微软现在正试图推动Bing AI的采用,而不是其他服务,如Microsoft Account或Edge。

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论