请在Chrome、Firefox等现代浏览器浏览本站。另外提供付费解决DEDE主题修改定制等技术服务,如果需要请 点击 加我 QQ 说你的需求。

Gemini 3的意义:AI已经超越了“幻想阶段”,正在接近人类。 “人机协作”将从“人类

教练技术 bet356在线官方网站 评论

谷歌新发布的Gemini 3模型标志着人工智能领域的重大转折。 ET 此前曾指出华尔街的观点

谷歌新发布的Gemini 3模型标志着人工智能领域的重大转折。 《华尔街日报》此前注意到,美国东部时间 18 日周二,谷歌正式发布了人们期待已久的 Gemini 3,这是该公司迄今为止最强大的人工智能(AI)模型。它在发布第一天就立即在 Google 搜索、Gemini 应用程序和许多开发者平台上上线,并已在许多盈利产品中使用。谷歌高管在发布会上强调,Gemini 3 在衡量人工智能模型性能的几个热门行业排名中名列前茅。谷歌人工智能研究实验室DeepMind首席执行官Demis Hassabis表示,Gemini 3是“世界上最好的多模态理解模型”,也是该公司迄今为止生成和生成代码最强大的模型。根据沃顿商学院教授 Ethan Mollick 的深入分析,Gemini 3 的发布以及支持的工具“反重力”展现出惊人的“代理”能力。与三年前的 GPT-3 模型相比,AI 不再只是生成文本,而是可以编写代码、构建交互式应用程序以及执行多步骤任务。莫利克指出,这种从“描述”到“行动”的飞跃意味着人工智能正在从对话伙伴演变为可以连接计算机并完成实际任务的通用工具。莫里克的结论是,我们正在从“聊天机器人时代”转向“数字同事时代”。虽然双子座3号并非完美无缺,但它所犯的错误已不再是无中生有的“幻觉”,而是更接近于人类对欲望的判断或理解的偏差。这表明人机协作的模式正在发生变化。人类所做的不再是纠正低水平的人工智能,而是为其提供高水平的战略指导和方向。这可能是ChATGPT发布以来AI领域最大的变化。以下为Ethan全文Mollick 评测文章:三年,从 GPT-3 到 Gemini 3,从 Chatbot 到 Agent Ethan Mollick 2025 年 11 月 19 日我测试了 Google 新发布的 Gemini 3 模型。它非常出色。但不要列出基准数字,而是让人工智能显示我们在三年内会取得多远——这就是我所做的。 ChatGPT 发布已经快三年了。我在 OpenAi 的前身 GPT-3 出现之前就在这个子策略中写了第一篇文章。然后Chatgpt出来了,我立即写了另一篇文章:“我通常对技术预测持谨慎态度,但这一次它将比我们预期更快、更大地改变我们的世界。它不再是自动化重复和危险的工作。AI带回的第一批工作可能是更具分析性、创造性、写作和沟通的职位。”现在看来,我是对的。我把上面的截图扔到了 Gemini 3 上,只写了一句话:我:“做点事情让大家看看 AI 在这方面进步了多少”三年了。” 双子座:“当然。你的推文来自 2022 年 11 月——现代人工智能繁荣的前夕。当时最大的“哇点”是我可以写一篇流畅的文字,或者为你写一首关于“逃离那些ortter太空飞船模拟器”这样愚蠢的话题的诗。 2022年,AI只能描述引擎; 2025年,AI可以编写引擎、绘制界面,让你自己驾驶飞船飞行。” 这实际上是一个迷你游戏:我必须使用糖果能量来逃离水獭狩猎,一路上穿插着一首小诗和各种有趣的更新。读过这篇博客的人可能知道AI可以编写代码,但更有趣的是,当你不再将Gemini 3视为“聊天框”而是将其视为“其他东西”时,Gemini 3还能做什么。能写代码的工具,不仅仅是“能写代码的工具”有Gemini 3,谷歌还发布了反重力。程序员会明白这一点:它类似于 Claude Code 和 OpenAI Codex。它使您可以访问计算机并可以mawrite 在指导下独立编程。如果你不是程序员,你可以忽略它——我认为这是一个错误。 “编写代码的能力”并不意味着“成为一名程序员”,而是“完成任何可以在计算机上完成的任务的能力”。结果,这些工具的性质被彻底改写。双子座3非常擅长编写代码,即使您不认为自己是“程序员”,这也是相关的。 AI世界的一个底层观点是:你在计算机上所做的一切最终都是代码;只要AI会写代码,就可以构建仪表板、抓取网站、创建PPT、读取文件……这使得“会写代码的智能代理”成为一种通用工具。反重力使这个想法富有成效:给我一个“收件箱”,我将任务分配给代理,他们让我知道他们何时需要批准或帮助。 。他们使用代码为我工作。双子座3善于计划,知道该做什么,什么时候该请示。例如,我把所有的新闻通讯都放在过去几年的手稿放在一个文件夹里,然后有人告诉我:“给我做一个漂亮的网页,总结我所有关于人工智能的预测,然后上网搜索看看哪些是正确的,哪些是错误的。”它读取了所有文件,运行了代码,并首先给了我一个可编辑的计划——这是他第一次问我,我对他理解的准确性感到惊讶。我做了一些小的修改并发布了它。 然后它搜索网页,建立网站,接收结果浏览器验证,并将成品打包给我。我像对人类同事一样建议进行更改,结果它继续缩小。 它并不完美——代理还没有到位。我没有看到任何幻觉,但确实有需要纠正的地方,但这些错误更像是“人类同事经历的判断偏见或误解”,而不是传统人工智能的过度幻觉。重要的是,我感觉自己可以控制人工智能的决策,因为人工智能监管定期检查并确认其工作,我可以清楚地看到我在做什么。这更像是管理队友,而不是通过聊天界面与人工智能交谈。博士级智力?反重力并不是唯一的惊喜。另一个令人震惊的是,它表现出了真正的“判断力”。我经常抱怨:AI基准测试被合并成一锅粥。 Gemini 3 在大部分列表中处于领先地位(可能不会击败 200 美元的 GPT-5 Pro,但这可能会在 Gemini 3 的“深度思考”版本问世时发生)。业界喜欢用一句广告语:“博士级智力”。我决定真正尝试一下。我将十年前的众筹研究中的一堆旧文件放入其中 - 文件名称类似于“project_final_seriously_done.xls”,并且仍然是古代 Stata 格式。命令只有一句话:“自己理解数据结构,为新的分析做好准备”。它居然恢复了损坏的数据,理解了复杂的环境 博士二年级。论文”,没有任何提示:“很好,现在用这些数据写一篇原创论文。深入研究领域,把题目提升到创业或者战略理论的层面,做严谨的统计,写成期刊格式。”选题、提出假设、跑统计、做图表、格式化论文——它在严谨性中走的是最难的“平衡与实施选题”。我明确说了“充实和提高”,最后写了一篇14页的论文。 。自己写代码,自己验证结果。 那么,这算是“博士级别”吗?如果您的意思是“可以在顶尖大学担任合格研究生的工作”,部分答案是“是”。但它也存在着教训中常见的问题:统计方法有缺陷、理论飞跃太大、证据链不够严谨……我们已经过了“幻觉”阶段,进入了一个更微妙、更“人性化”的缺陷领域。有趣的是,当我像学生一样给出开放的建议(“阅读更多众筹文献来建立方法”)时,它进步了很多——也许通过更多的指导,我可以接近“博士学位”。双子座3是什么?它是一个伟大的“思考+行动”合作伙伴,可供全球数十亿人使用;它也是一面镜子,折射出不减速的AI、智能代理的崛起、人们需要懂得如何管理“智能AI”等诸多趋势。三年前,我们惊叹“机器能写水獭诗”;不到 1000 天后,我与一位建立了自己的研究环境的代理人讨论了统计方法。聊天机器人的时代正在让位于“数字同事”的时代。是的,Gemini 3仍然不完美,需要能够指导和验证的“人类管理者”。但“循环中的人”正在从“擦AI屁股的人”演变为“引导AI工作的人”——这可能是自ChatGPT发布以来最大的范式转变。复活节彩蛋:我一个Gemini 要求“使用代码为我制作一张封面图像,然后先检查尺寸。”它先是在网上搜索规格,然后只依靠数学来画图,一步到位。 ** 强制警告:** 允许人工智能代理访问计算机是危险的 - 它可以在不询问的情况下移动/删除文件,甚至泄露文件。如果该工具是针对非程序员的,那就更好了;现在要小心。 特别声明:本文由网易自媒体平台“网易号”作者上传发布,仅代表作者观点。网易仅提供信息发布平台。 注:以上内容(包括图片和视频,如有)由网易HAO用户上传发布,网易HAO为社交媒体平台,仅提供信息存储服务。
喜欢 (0) or 分享 (0)
发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论