分享好友 最新动态首页 最新动态分类 切换频道
Google深夜狙击OpenAI,Gemini 2.0登场!全面转向Agent,多模态输入输出,免费随便玩
2024-12-26 13:56

在OpenAI宣布连发12天更新后,Google选择12月11日深夜(在OpenAI发布更新之前),发布新模型Gemini 2.0。

图片来源:Google官网截图

在多次发布被OpenAI精准狙击后,Google扳回一局,发布了Gemini 2.0,直指Agent使用。Agent功能,也称为智能体功能,通常指的是AI能够感知环境、执行任务并在一定程度上独立做出决策的能力,也就是能更自动化完成任务的功能。

此次Google似乎赌对了。OpenAI凌晨两点的发布,主要宣布了和Apple Intelligence的合作,一个普遍被期待能与Agent能力强相关的合作。

Google,则一次性发布了四个Agent相关的功能:

Project Astra,能够在Gemini应用中直接调用Google Lens和地图功能帮用户解决问题;

Project Mariner(海员项目),Chrome浏览器的实验性功能,可以通过提示词直接帮用户浏览网页做任务;

Jules,可以嵌入GitHub的编程Agent,使用自然语言描述问题,就能直接生成可以合并到GitHub项目中的代码;

游戏Agent,能够实时解读屏幕画面,直接在你打游戏的时候通过和你语音交流,给你AI打法提示。

据悉,Gemini 2.0 Flash及API免费可用!可以通过Google AI Studio和Vertex AI中的Gemini API使用,基本不要钱,每分钟最多15个提问,每天最多1500个提问。明年初全面开放。

谷歌Gemini 2.0炸裂功能

Gemini 2.0 Flash是2.0家族第一个模型,主推原生多模态输入输出+Agent,速度比1.5 Pro快两倍,关键性能指标甚至超过了1.5 Pro!支持原生工具调用、以及实时音视频流输入等新功能。


速度更快,多模态、文本、代码、视频、空间理解和推理能力全面提升!新能力比如空间理解,视频理解等可以通过Googele AI Studio的Starter Apps来体验;

例如1,Gemini 2.0对空间的理解,利用Spatial Understanding,上传一张图片,Gemini快速进行图像中的物体检测和标注,并生成结构化的数据(JSON格式)。它的设计直观,用户可以通过简单的交互操作快速获得检测结果。这种工具可能用于机器学习训练数据准备、图像分析或计算机视觉研究等场景;

例如2,Gemini 2.0地图交互,利用Map explorer,show一下世界上最有意思的大城市;

全新输出模态:支持文本、音频和图像的集成响应,多语言原生音频输出,8种高品质语音,多种语言和口音!原生图像输出,还能进行多轮编辑迭代直到生成满意的图像;

原生工具使用:Gemini 2.0可以直接调用Google搜索、代码执行等工具,还能通过函数调用使用自定义的第三方函数!

多模态实时API:支持实时音视频流输入,还能进行语音活动检测,甚至可以集成多个工具完成复杂任务!现在通过Stream Realtime就可以体验;

例如,把电脑屏幕交给Gemini 2.0接管,它可以在你与模型实时交互的同时进行搜索和编码。

正在积极探索AI“代理”的应用,目标是打造能够自主理解、规划和执行任务的智能助手。他们已经推出了一系列Agent原型(目前仅供测试人员使用),展示了AI代理在不同领域的巨大潜力:

Jules,你的AI编程伙伴:想象一下,你的团队刚完成了一轮bug排查,一堆bug亟待修复。现在,你可以把Python和JavaScript的编码任务交给Jules。它与你的GitHub工作流无缝集成,可以异步处理bug修复和其他耗时的任务,让你专注于核心开发工作。Jules会创建全面的、多步骤的计划来解决问题,高效地修改多个文件,甚至能准备pull requests,直接将修复提交到GitHub!更重要的是,Jules赋予开发者更多自主权:你可以随时查看Jules创建的计划,提供反馈或要求调整,并轻松审查和合并Jules编写的代码。

Colab数据科学代理,你的AI分析师:繁琐的数据分析Colab数据科学代理帮你搞定!只需用自然语言描述你的分析目标,Colab就能自动生成一个完整的notebook,并在几分钟内提供洞察。所有分析都基于一个可运行的Colab notebook,保证结果的可靠性和可重复性。这将极大地加速你的研究和数据分析进程。

Project Mariner,重新定义人机交互:Project Mariner旨在探索人机交互的未来,从浏览器开始。它是一个实验性的Chrome扩展程序,可以让AI代理在你的浏览器中执行各种任务,例如查找信息、填写表格、甚至与网站进行交互。

Gemini Advance模式:谷歌在高级版中推出一项名为"深度研究"的新代理功能,这是一个研究助手,可以深入研究复杂的主题,并为你创建带有相关来源链接的报告,感觉这是直接写科研论文的节奏。

游戏和其他领域的AI代理:DeepMind在游戏AI领域积累了丰富的经验,现在他们将Gemini 2.0应用于游戏代理的开发。例如,一个AI伙伴陪你一起玩游戏,还能提供专业的指导,游戏体验将提升到一个全新的层次!更牛的是,这些代理还能连接到Google搜索,获取海量的游戏知识,成为你真正的游戏专家!目前,他们正与Supercell等游戏开发商合作,在“部落冲突”和“卡通农场”等游戏中测试这些代理。

谷歌推出突破性量子芯片

谷歌9日宣布推出最新量子芯片Willow。谷歌首席执行官孙达尔·皮柴称其为迈向打造实用量子计算机的重要一步。

谷歌在官方博客刊文说,Willow取得了两项重大成就:首先,使用更多量子比特进行扩展,可大幅度减少错误,解决了量子纠错领域近30年来一直试图攻克的关键难题。另外,在标准基准计算测试中,Willow展示了非常高的性能。

量子比特利用叠加态来进行计算,对环境扰动极其敏感。通常量子比特越多,发生的错误就越多,而新研究有助解决这一难题。这一已发布在《自然》杂志上的研究显示,在Willow芯片中使用的量子比特越多,系统的错误率越低,“取得了‘低于阈值’的历史性成就,即在增加量子比特数量的同时降低错误率”。

谷歌量子人工智能实验室创始人和领导者哈特穆特·内文说,作为第一个低于阈值的系统,这是迄今为止最可信的可扩展逻辑量子比特原型。Willow芯片的推出让量子计算向商业应用方向迈进了一大步。下一步挑战是展示量子芯片超越经典计算机,又能解决现实问题的能力。

内文还表示,谷歌首创的随机电路采样(RCS)基准,已被广泛用于量子计算领域,是当今量子计算机可完成的难度最高的经典基准。Willow基于该基准取得了惊人表现,在不到五分钟的时间完成了当今领先的需要10的25次方年才能完成的计算,“这一令人难以置信的数字超出了物理学中已知的时间尺度,远远超过了宇宙年龄”。

内文说,和量子计算将被证明是当代最具变革性的两项技术,先进的人工智能将从量子计算中受益匪浅。这也是他将实验室命名为量子人工智能的原因。

最新文章
英飞凌科技股份公司宣布已收购位于斯德哥尔摩的初创企业Imagimob有限公司,这是一家领先的平台提供商,致力于为边缘设备上的机器学习(ML)解决方案开发提供助力。通过此次收购,英飞凌进一步加强了其提供
TDK株式会社针对USB-C端口和其他高速接口的ESD保护应用推出一款超紧凑型TVS二极管。对于USB-C等符合USB4(第1版)规范且传输速度高达40 Gbit/s的高速接口 (Tx / Rx),ESD保护应用特别需要具有超低寄生电容和低钳位电压的TVS二极管。新的B74
自考靠谱的机构有哪些特点?
自考靠谱的机构有哪些特点?社会飞速发展,面临升职就业等压力,提升自我优势是必不可少的,拥有一个高学历或好文凭是关键,可以让就业的范围更广升职的机会更多。学历是判断个人素质的重要条件之一,企业也重视高学历的员工。下面本小编为
神马关键词推广_做神马关键词优化软件(神马关键词排名快速优化首页价格)
这个要具体看关键词的啊,差别的词是不一样的, 近来佛山市神马互联网科技有限公司推出关键词按天扣费很火,没有恶性点击,关键词24小时在线, 盼望可以帮到你;环境如下第一种,比方你是推广的北京地区假如你在上海,但是你账户启用了搜刮
阿里巴巴:今年营收 5000 亿,明年GMV要再增一万亿
疫情带来冲击和机遇,阿里稳健前行寻找向上新空间。5 月 22 日,阿里巴巴发布截至 3 月 31 日的 2020 年第四季度财报及全年财报。财报显示,2020 财年,阿里巴巴集团收入为人民币 5097.11 亿元,同比增长 35
Python爬虫教程——7个爬虫小案例(附源码)_爬虫实例
本文介绍了7个Python爬虫小案例,包括爬取豆瓣电影Top250、猫眼电影Top100、全国高校名单、中国天气网、当当网图书、糗事百科段子和新浪微博信息,帮助读者理解并实践Python爬虫基础知识。包含编程资料、学习路线图、源代码、
运动会活动策划书
~  时间一溜烟儿的走了,工作已经告一段落了,前方等待着我们的是新工作目标和挑战,想必现在的你有必要写一写策划书了。是不是无从下笔、没有头绪?下面是我收集整理的运动会活动策划书,仅供参考,欢迎大家阅读。    一、活动前言:
比漫熊漫画,比漫熊漫画安卓最新版,比漫熊漫画下载
比漫熊漫画是一款非常好用的小说漫画软件,比漫熊漫画功能丰富,确实在多个方面为漫画爱好者们提供了优质的阅读体验,用户可以根据类型地区作者等多种方式进行筛选,比漫熊漫画允许用户根据自己的需求切换各种漫画资源源,轻松找到自己喜欢
跨境电商独立站建站平台解析,独立站如何运营?独立站优势
越来越多的人涌入跨境电商这行业,无论是大平台还是独立站,蜂拥而至的小白,新手,各种开车,各种上路,但是大家真的了解独立站这个行业麽?或者说,怎么找到未来自己的第一块根据地呢?那么咱就说说,你只要干独立站,就怎么都绕不开的这
虚拟微博热搜生成器
虚拟微博热搜生成器是一款可以让用户随时登上热门排行榜的APP,当然这是虚假的,微博是不少用户喜欢使用的一款软件,这款APP的界面与微博非常的相似,可以说一模一样,将自己喜欢的内容填充进去就可以打造一个热门排行榜,恶搞一下好友是非
问道加盟
  【市场优势】  1、媒体,网络等多方面的品牌宣传;  2、全国各地设置分支机构及战略合作伙伴,统一的品牌及企业文化导入;  3、全国各地定期举办线下交流会;  4、成为福建游龙网络科技有限公司的战略合作伙伴,共享旗下产品资
相关文章
推荐文章
发表评论
0评