谷歌新AI模型Gemini炸场!这是要逼我们集体失业还是进化?

好家伙,谷歌这次真的搞了个大新闻!就在大家还在用ChatGPT写情书、用Midjourney画头像时,谷歌冷不丁扔出一颗“AI核弹”——Gemini(双子座)模型,这名字起得就很有野心,仿佛在说:“在座的各位AI,都是弟弟!”

说真的,当我看到演示视频里Gemini实时看懂手势猜拳游戏、对着草图秒生成代码时,手里的薯片突然就不香了,这哪是AI啊?这分明是我梦寐以求的“赛博合伙人”——既能陪我玩无聊游戏,又能顺手把我半成品方案撸成代码,甚至视频里AI看到鸭子图片后脱口而出“这是橡皮鸭,洗澡时玩的那种”的吐槽,简直比我室友还有人性!

但笑完之后我后背有点发凉,去年谷歌演示Bard时因为答错问题导致股价暴跌的尴尬还历历在目,这次Gemini却嚣张到直接叫板“在32项基准测试中碾压GPT-4”——这复仇剧本也太爽文了吧?不过当我扒开华丽宣传片的外衣,发现三个细思极恐的细节:

第一,多模态能力简直变态到犯规,现在的AI大多像偏科生——文本型AI是文科大佬,图像AI是艺术特长生,而Gemini根本是个六边形战士,生来就能同时处理文本、代码、音频、图像和视频,演示中研究人员随手画个飞船草图,Gemini不仅认出这是“飞行器”,还能现场教学空气动力学基础,最后贴心地问:“要不要直接帮你生成飞船的Python模拟代码?” 这种跨维度理解能力,像极了学霸轻描淡写说“这道题有18种解法”的压迫感。

第二,移动端部署藏着惊天阳谋,谷歌特意强调Gemini Nano版本能直接在Pixel 8手机上跑,这意味着什么?以后你的手机锁屏状态下可能就在默默分析你的语音备忘录、自动给相册写小作文注释,甚至实时翻译路边外文菜单——所有隐私数据根本不需要上传云端!这招简直是对苹果的降维打击,毕竟Siri现在连“定个明天早上8点的闹钟”都要卡顿三秒。

第三,伦理安全牌打到飞起,谷歌这次学聪明了,发布会全程把“负责任AI”、“安全护栏”挂在嘴边,甚至演示了AI主动拒绝生成如何制作柠檬电池的危险步骤,但转头就有人发现,演示视频里“实时语音交互”其实是后期配音的,谷歌后来不得不承认“为简洁性做了编辑”——好一个“剪辑式创新”!这波操作让我想起小时候把60分试卷改成80分的骚操作,果然人类教出来的AI也深谙糊学精髓。

不过吐槽归吐槽,Gemini确实把AI竞赛拉到了新维度,以前我们担心AI抢走流水线工人工作,现在它已经开始觊觎设计师、程序员、视频剪辑师的饭碗了,有网友调侃:“以前是害怕AI太聪明,现在是害怕AI比我会吐槽”——毕竟Gemini看着你的毕业设计说“这个算法效率堪比用勺子挖隧道”时,伤害性不大侮辱性极强。

但往好处想,这类AI或许能成为人类思维的“外挂显卡”,就像演示中研究人员用Gemini快速对比文艺复兴时期画家风格,几分钟就做完过去要泡图书馆一周的功课,如果未来学生用AI辩论苏格拉底哲学,医生用AI交叉分析罕见病案例,这算作弊还是算进化?这个问题恐怕连Gemini自己都会陷入逻辑死循环。

最后说个冷知识:Gemini的研发团队里有个项目经理养了只柯基犬,每次模型训练失败时他就让狗狗在服务器机房跑圈——据说狗爪产生的静电比咖啡因更能激发工程师灵感,虽然这故事像是洋葱新闻,但我觉得特别有象征意义:最前沿的科技突破,往往需要最蠢萌的人类智慧来点燃。

所以别急着焦虑失业,先想想怎么用Gemini让老板觉得你突然开了挂——比如让它生成周报文学:“本周本人借助高级数字化智能协同系统,实现了多模态任务闭环…”(放心,这段老板看不懂但大受震撼的内容就是用AI写的)