顶级邪修倾囊相授!藏师傅教你速通Nano Banana

原创 歸藏的 AI 工具箱 2025-08-27 15:24 北京

?k=9f104283&u=https%3A%2F%2Fmmbiz.qpic

Image

大家好,这里是歸藏(guizang),今天教大家如何最大程度发掘最强图片编辑模型 Nano Banana 的潜力。

昨晚我们期盼了很久的图像编辑模型终于上线了,大家不再需要从竞技场吭哧瘪肚抽卡,可以爽玩,而且谷歌一如既往的发挥了财大气粗的优势,可以让你疯狂白嫖。

在做了一晚上的通宵测试之后,发现这玩意真的很离谱。直接把 Adobe 和一众修图软件整麻了。

以往复杂的修图操作现在都可以一句话搞定,而且人脸的相似度相对于 FLUX Kontext 高了一截。

不多逼逼,先来总结一下这期教学内容:

  • 用 Nano Banana 帮你修图:祛痘、瘦身、瘦脸、都不在话下
  • 烂片拯救者,用 Nano Banana 一键让你的普通照片变大片
  • 用简洁高效的方式展示你的今日穿搭
  • 当然也可以快速让你的照片穿上别人整理的穿搭
  • 通过标记、框选、涂鸦等方式辅助提示词更加精准的生成图片
  • 充分利用 Nano Banana 的世界知识制作视频特效
  • 根据主角图片一键生成连续的电影分镜
  • 将你喜欢的照片或者物品变成实体贴纸送给朋友

如何使用 Nano Banana 

首先来看一下如何使用 Nano Banana ,优先推荐在谷歌的 AI Studio (https://aistudio.google.com/)上使用,因为免费而且不会掺水。

进入页面后,我们在页面最右侧将模型切换到 Gemini 2.5 Flash Image Preview 这个模型,没错这就是 Nano Banana的官方名称。

Image

切换模型之后就可以在输入框输入图片修改的需求,同时上传你需要修改的图片,这里支持多张图片的上传,之后点击 Run 按钮等待结果就行。

Image

当然 Nano Banana 也支持连续进行图片编辑,这里需要注意的是,连续的编辑四五次以后,就可能因为上下文超出而效果变差,这时候建议新建窗口重新开始。

Image

除了 AI Studio 以外,一部分 Gemini APP 的用户也可以用 Nano Banana 了,如果你可以用的时候会收到一个类似的弹窗,切换 Gemini 2.5 Flash 模型然后选择图片就行。

Image

我们熟知的一些 API 服务商和聚合图像视频产品比如 FAL 和 Krea 也都已经上线了 Nano Banana,你也可以在他们那里用,注意不要直接搜索 Nano Banana 官网,没有这种东西,你看到的全是骗子网站。

使用 Nano Banana 修图

大家现在都喜欢拍照,觉得自己拍的照片不好看?不会调色?有无关的东西?交给 NanoBanana 一段提示词解决。

把你的废片发给他,然后用我的提示词就可以一键把你的普通照片修成大片。

This photo is very boring and plain. Enhance it! Increase the contrast, boost the colors, and improve the lighting to make it richer,You can crop and delete details that affect the composition.

Image

Image

Nano Banana 这次升级以后人脸 ID 的一致性得到了大幅增强,如果你只是小幅修改图片的话,相似度非常高。

这样的话我们就可以直接用自然语言进行修图了,比如让藏师傅的脸变瘦,可以发现我面部的一些瑕疵也被修复了,所以你也可以直接让 Nano Banana 帮你修复肤质问题。

Make the character's face in the image slimmer, while increasing the muscle mass of the arms.

Image

Nano Banana 帮你展示穿搭和尝试新穿搭

今日 OOTD?直接让他展示平铺展示穿搭设计的所有商品。

A flat lay photograph showing all the clothing items involved in the photo.

Image

当然也可以反过来,用你的照片帮你尝试其他博主分享的穿搭,还原度非常好。

用提示词词的时候注意图片的顺序,我这里是用第一张第二张表示的。

The character in Figure 2 is wearing the clothing and accessories from Figure 1.

Image

通过涂鸦和标记控制图片的修改

由于本身 Nano Banana 的多模态理解和世界知识理解能力就很强,所以你不止可以通过文本提示词修改,也可以直接在需要修改的图片上做标记去修改。

我们先整个基础的用法,如果你有多张图片的话,你可以在图片上面做标记让模型更好的理解你的文本提示词。

比如我这里提示词就可以写让他用A图片的背景、B图片的沙发和相机角度、C图片的角色来完成三张图片的合成。

Using the environment from A, the sofa camera angle from B, and the subject from C, create a new image that combines these three elements.

Image

再进阶一点,你可以用方框或者圆圈标记修改图片需要替换的位置,比如我这里就让他把第二张图片的桌子和椅子放到了红框的位置。

可以看到这玩意确实是电商利器,图2里面椅子的细节、材质啥的都完美还原,但是光线表现和色彩风格却完美融入了图1.

Place the chair and table from the first image at the red box location in the second image, and generate the image without the red box markings.

Image

终极涂鸦控制这个非常离谱了,你可以直接给他两个正常姿势的角色和一个角色互动的涂鸦。

他就会帮你画出两个角色对应姿势的互动图像,这个对于动画制作和精准的动作控制帮助非常大。

Have these two characters fight using the pose from Figure 3.Add appropriate visual backgrounds and scene interactions,Generated image ratio is 16:9

Image

上面的是我跑的,随便画了一下姿势,如果你能够将草稿画的更加的细致的话 Nano Banana 的修改也会更精确。

比如这个 X 用户 minux302 的案例,连角色表情都还原了。

Image

当然我们还可以继续发散,相同角色+不同动作参考+连续编辑+可灵 2.1 首尾帧=高质量打斗动画。

这个有多强,我就不强调了,大家可以自己想象。

将你的照片变成可爱贴纸

昨天看到 Fenx 用 AI 圈子的流行梗做了一堆贴纸觉得很好玩,因为是开源的,我还去电商平台找店铺打印了几套。

昨晚 Nano Banana 发布后就试了一下看能不能基于他的设计参考生成,没想到真可以。

而且我问了一下贴纸打印只有 PNG 图片也可以,你完全可以做一套自己的然后找店铺打印送给朋友,应该会是不错的礼物。

Help me turn the character into a white outline sticker similar to Figure 2. The character needs to be transformed into a web illustration style, and add a playful white outline short phrase describing Figure 1.

Image

生成建筑或者物品讲解特效

谷歌说 Nano Banana 里面有 Gemini 的世界知识,所以你就可以在图片上增加一些物品的介绍或者描述。

比如这里我们就可以为世界知名建筑的图片加上对应的 AR 介绍卡片,比如这里的泰姬陵和悉尼歌剧院信息都是对的。

you are a location-based AR experience generator. highlight [point of interest] in this image and annotate relevant information about it.

Image

Image

获得图片之后我们用首尾帧视频模型处理一下就直接变成讲解动画特效了,这里我用的可灵 2.1,还能加上对应的讲解语音,一个完整的景点介绍分镜就搞好了。

电商图片修改

之前 FLUX Kontext 在电商修改的时候有个问题就是商品比例有问题,特别是首饰上这种问题很多,这里测试了一下 Nano Banana 会好非常多。

有时候他会改掉第二张图的细节比如发型,跟他说一下就行。

The woman in Figure 2 is wearing the necklace from Figure 1,Do not change the details of other Figure 2.

Image

古早动漫图和照片修复超分

老生长谈的图片修复和超分 Nano Banana 也表现的不错,比如我这里就修复了一下古早的《攻壳机动队》动画截图。

Enhance the resolution of this old anime image and add the appropriate texture details, reinterpreting it with modern anime techniques.

Image

好了这就是藏师傅这几天探索出来的 Nano Banana 全部的玩法和创意了。

当然之前我介绍的 FLUX Kontext 的玩法 Nano Banana 也全都支持,这里就不赘述了,感兴趣可以去看之前的文章《

对普通人最有用的一次!藏师傅教你用FLUX Kontext解决一切图片问题

从现在开始所有需要“视觉表达”的生意,都值得用 Nano Banana 重做一遍。电商图片、本地生活、教育、婚庆、影视、印刷、旅游、媒体工具每个垂类和场景都有无数的需求等待满足。

希望藏师傅的内容能对你有所启发,感谢各位,希望帮忙点个赞👍或者喜欢🩷,也可以转发给你需要的朋友们。

阅读原文

跳转微信打开

藏师傅教你用 Nano Banana 编辑图片做手办

原创 歸藏的 AI 工具箱 2025-08-23 17:23 北京

教大家一下如何在 LM Arena 里面使用 Nano Banana 模型编辑图片以及做手办图。

?k=ac394a41&u=https%3A%2F%2Fmmbiz.qpic

前几天发了 Nano Banana 的测评之后很多朋友不知道怎么用,刚好最近用 Nano Banana 做手办图的玩法又火了。

所以顺便教大家一下如何在 LM Arena 里面使用 Nano Banana 模型编辑图片以及做手办图。

先看一下结果。

昨天看到 ZHO 做的黑神话钟馗的手办就改了一下他的提示词,加上了游戏实体版盒子以及屏幕上的游戏画面。

顺便用昨天刚上的可灵 2.1 首尾帧模型搞了一个特效让模型重新回到游戏中去。

接下来教一下怎么做,懒得看文本的也可以看我录的视频:

首先我们需要访问 LM Arena  (https://lmarena.ai/?chat-modality=image)。

打开以后需要先在右下角选择 Image 这样才能触发图像模型。

然后我们需要上传自己想要修改的图片,我这里用的是黑神话钟馗 CG 里的截图,然后输入提示词就行。

提示词这里我是用 ZHO 的改的,把内容换了以后还让钟馗骑上了老虎,因为截图的时候没办法截全。

Please turn this screenshot of the game character into a character figure riding on an Asian tiger. Behind it, place a PlayStation game box printed with the character’s image and the game title ‘Black Myth: Zhong Kui.’ Next to it, add a computer with its screen displaying the in-game scene, complete with the game’s UI and the character. In front of the game box, add a round plastic base for the figure and have it stand on it. The PVC material of the base should have a crystal-clear, translucent texture, and set the entire scene indoors.


Image

回车之后我们会发现 LM Arena 一次会出两张图片,因为本来这个平台就是为了让你评价模型好坏的。

所以两张图都是不同的模型生成的,然后等生成结束你需要在输入框上面那里选一个你觉得最好的结果,这时候才会显示模型名称。

如果你的两个结果里面都没有 Nano Banana 模型的话,就需要重新按照刚才的的流程再生成一次,一般两三次肯定能抽到了。


Image

抽到你想要的图片之后点击下载就可以了。


Image

然后我们还可以把抽到的图片变成视频来提高图像的表现力,比如就可以用我昨天介绍的可灵 2.1 首尾帧的提示词加上编辑前和编辑后的图片做个钟馗从手办回到 CG 的图像。

首尾帧提示词生成的提示词可以在我昨天的内容找到《可灵 2.1 首尾帧藏师傅外挂教程:两张图→大片,附万能提示词

显示器中的游戏画面闪烁了一下,一道微光从屏幕中溢出并扫过前方的实体手办。手办底座周围的空气开始扭曲,细小的灰尘被无形的力量卷起,紧接着,整个手办连同老虎一起缓缓地、反重力地从亚克力底座上漂浮起来,在半空中开始缓慢自转。当手办旋转时,它后方的真实世界墙壁和桌面背景开始像被投入石子的水面一样产生涟漪,并从手办轮廓的边缘开始向外像素化分解,暴露出其后方那云雾缭绕的山峦背景。游戏世界的背景以手办为中心,如一幅画卷般迅速展开并吞噬了整个真实环境。与此同时,漂浮手办的材质也开始发生变化,塑料的质感上流淌过数据流般的光效,表面的涂装逐渐被CG渲染出的金属、皮革和毛发的超精细纹理所取代。摄像机在此过程中,从一个固定的广角镜头,转为围绕着漂浮的手办进行环绕拍摄,并最终在手办完全转化为CG模型


Image

最后我还简单做了一下剪辑,加上了一小段原本的 CG 画面和其中的音乐,看起来就更加带感了。


Image

再欣赏一下生成结果吧,今天的教程到这里就结束了,赶紧去玩玩,也可以给我点个赞和喜欢

阅读原文

跳转微信打开

可灵 2.1 首尾帧藏师傅外挂教程:两张图→大片,附万能提示词

原创 歸藏的 AI 工具箱 2025-08-22 17:08 北京

大家好,我是歸藏。今天带来可灵 2.1 首尾帧模型的测试和使用教程,重点是教你解决首尾帧视频最难的两部分图片生成和提示词生成。

?k=318b122c&u=https%3A%2F%2Fmmbiz.qpic

大家好,我是歸藏。

今天带来可灵 2.1 首尾帧模型的测试和使用教程,重点是教你解决首尾帧视频最难的两部分图片生成和提示词生成,尤其后面提示词价值很高,都能做产品了建议收藏。

前几天可灵给超级创作者开了 2.1 模型的首尾帧视频生成的权限,抽时间试了一下。

发现这个模型对于提示词理解和遵循以及图片转换的自然度都搞得太好了,基本上在首尾帧这个功能上已经到顶了。

知道有朋友习惯先质疑在质疑,先看结果。

所有分镜都是一次生成没有抽卡,就是素材拼接没有剪辑,只有简单变速。

是不是很好,而且这条视频我从头到尾基本只用了半小时就搞定了,等待视频生成的时候还能干别的。

这时候很多朋友就要说了:“就会骗我们,为啥我用的时候就得疯狂抽卡”。

我也反思了一下原因,在模型能力很强的情况下依然需要抽卡和没办法获得好素材的原因主要有两个:

首先是没办法获得合适的图片

虽然可灵 2.1 首尾帧已经强到了完全无关的两张图片也可以顺滑的转换,比如下面这个视频。但是肯定不像前后关联的图片带给观众的冲击强。


?k=3c0697c8&u=https%3A%2F%2Fmmbiz.qpic

第二点就是有了图片之后不会写提示词

你获得了两张合适的图片,本能的意识到两者是有关联的,但是具体如何有美感和自然的从首帧变到尾帧自己是没有办法详细的描述的,所以就造成了你觉得变化的过程不符合自己的要求,只能通过不断抽卡祈祷出现奇迹。


Image

所以今天藏师傅就教一下从获取合适的图片素材以及如何写提示词两方面生成优质的首尾帧视频,顺便看看可灵 2.1 的首尾帧模型有多强大。

如何获得合适的图片

首先我们来看一下如何获取用来做首尾帧视频生成的合适图片,我自己平时主要用三个方法:相同提示词抽卡、修改提示词抽卡、使用 FLUX Kontext 等图像编辑模型对图片进行编辑。

首先是相同提示词抽卡:

由于是相同提示词并且很多模型在同时生成多张的时候种子是一致的,所以多张图中很容易找到相似度很高的图片,非常适合用来做展示类的首尾帧视频。

比如我上面视频里面的每个角色展示的分镜就是相同提示词生成的,我找了两个面部和形体相似但是背景和服装不同的兔子来完成展示,可以看到可灵过渡的非常好,尤其是面部,给人感觉连贯性很强。

仿古画,版画,水墨,古风,笔触感,大师级构图,可爱俏皮的兔子精,白发发髻,神话,诡谲,奇幻,山海经,毛绒绒白色装饰,黑色背景,


?k=68248ede&u=https%3A%2F%2Fmmbiz.qpic

修改提示词抽卡:

如果我们要做画面中主要人物或者物品的移动或者消失出现,一个合适的方法就是,先写出尾帧的提示词,生成图片后根据需求更改其中的一部分就行。

比如这个富士山和汽车的画面就是先有汽车停在富士山下的提示词,然后在删掉汽车的部分完成的。

首帧提示:mount fuji on the background centered,, professional color grading, 4k, shot on RED camera, wallpaper quality
尾帧提示:two R34 nissan skylines, stunning, with mount fuji on the background centered,, professional color grading, 4k, shot on RED camera, wallpaper quality


?k=6ff5455e&u=https%3A%2F%2Fmmbiz.qpic

使用图像编辑模型编辑:

以前想要编辑图片基本只能局部重绘,但是局部重绘局限性非常大,索性我们最近有了不少可用的图像编辑模型。

通过自然语言就可以编辑图片,这样我们就能实现对图片的精确控制,制作出各种特效。

比如将扁平的 Logo 图片变成有丰富材质和背景的视频,我就是拿了一张 Logo 图片然后用图片编辑模型让他加上材质更换背景。

最后在用可灵 2.1 首尾帧生成视频的时候可以看到从扁平到金属材质的过程可灵还加上了非常顺滑的过渡一点不突兀。


?k=66294b3d&u=https%3A%2F%2Fmmbiz.qpic

也可以让某个人物拿上东西或者放下东西,这个在电商场景非常实用。

比如下面这个就是用原始的模特图片和后面拿上产品的图片生成的,模特和产品都可以保持一致性,可用性相当高,而且可灵生成的时候完全没有常见的手部细节问题。


Image


?k=729a5ad9&u=https%3A%2F%2Fmmbiz.qpic

当然我们也可以用这个方式去做非常炫酷的文字特效。

比如我这里就先生成了一个金属文字的 KLING,然后用图像编辑模型修改文字,分别变成了 2.1 和 First Last Frame,然后用可灵 2.1 首尾帧能力生成两个视频,拼起来就是连贯的文字变化特效。


Image

当然,我们也可以加上更加丰富的变化,比如每个分镜不止文字会变化文字材质和周围环境也发生变化,整个表现力会更加丰富,而且可灵 2.1 不止响应了文字本身的变化,环境的变化也跟文字是同步的。


?k=82a6fe20&u=https%3A%2F%2Fmmbiz.qpic

图像编辑常见的人物或者玩偶变装特效也很好玩,比如这里让 Labubu 做个简单变装。


?k=54282995&u=https%3A%2F%2Fmmbiz.qpic

如何生成首尾帧视频的提示词

我上面所有的首尾帧的提示词没一个是我自己写的,完全是 AI 生成的。

先给大家用来生成首尾帧视频的提示词,然后教一下大家提示词为什么这么写。将你想要生成的首尾帧图片和这个提示词一起扔给任何一个头部的多模态模型就可以了。

这个提示词可以生效也是因为可灵 2.1 的首尾帧提示词理解和遵循能力大幅增强的缘故。

藏师傅的首尾帧提示词生成提示:

你是一位顶尖的创意视频导演和VFX(视觉特效)概念艺术家。你的任务是为AI视频生成模型设计一个从【起始帧】到【结束帧】的转场过程。

你的核心目标是:构思并用一段话清晰、具体地描述这个动态视觉变化。

在构思时,请遵循以下创作框架:

第一步:分析差异 快速判断【起始帧】和【结束帧】的差异程度。

A类 – 关联性强: 主体或场景基本一致,只是状态、风格或环境发生改变(例如,同一个人换了衣服,同一个场景从白天到黑夜)。

B类 – 差异巨大: 主体和场景完全不同(例如,一只猫在客厅 → 一艘飞船在太空)。

第二步:选择转场策略

如果属于 A类,优先采用“原地演变”的策略。让变化直接发生在主体和环境上,尽量不使用或只使用微弱的摄像机移动。

如果属于 B类,采用“运镜驱动转场”的策略。必须使用一种明确的摄像机移动(如推、拉、摇、移、旋转)来引导过渡,让镜头运动成为连接两个不相干画面的桥梁。

第三步:构思具体变化(从以下工具箱中选择组合)

主体变化: 主体如何改变?(形态变化、材质替换、服装更替、分解重组、消失或出现)。

环境变化: 背景如何改变?(时间流逝、季节更替、空间切换、从现实变为幻想)。

风格/特效变化: 用什么视觉风格或特效来包装这个过程?(例如,画面逐渐像素化后重组、被火焰/水流吞噬后显现、转变为水彩/油画风格、出现光效粒子)。

输出规则:

将你的最终构思整合为一个连贯的段落。

描述要具体、直接,充满画面感。专注于“我们看到了什么”,而不是“我们感觉到了什么”。

严格遵守你在第二步中选择的摄像机移动策略。

避免使用模糊的比喻和过于文学化的修辞。

现在,请根据我提供的【起始帧】(图片A)和【结束帧】(图片B),生成你的转场描述。

看下这个提示词有多强,他会自动判断两张图片的差异度,然后根据差异的不同采取不同的提示词生成策略。

需要注意的是这个提示词生成的视频提示需要模型有非常强的提示词理解和遵循能力,所以目前应该只有可灵 2.1 效果比较好。

比如这种两张图片有相关性的,他就会优先用原地演变的原则主要重点放在主体和环境身上,让人物穿衣服,背景的植物生长来完成首尾帧的转换。

画面开始时,少女俯身在地,随着她缓缓抬起上身,她身后的盆景松树也开始悄然生长,枝干以肉眼可见的速度变得更加粗壮和舒展,同时,少女裙摆和发髻上的孔雀羽饰也随之展开。当她完全坐直,将目光从地面移向前方时,背景的光线由柔和的漫射光转变为明亮的聚光,将她和生长后的松树轮廓勾勒得更为清晰,而她身旁原先独立的假山石已经和松树的根部融为一体,成为她坐下的石台。整个过程中,摄像机非常缓慢地向左平移,最终将人物与生长后的树木一同置于画面中心,完成了构图的变化。


?k=488dcacf&u=https%3A%2F%2Fmmbiz.qpic

如果两张图片差异巨大甚至完全无关怎么办,他就会要求模型加上运镜进行过渡,让连贯的镜头表现变成链接两张图片的桥梁,而且模型也会自己加上一些特效变化让一个具体的材质引导画面变化,一下就让两张图片有了联系。

比如这里的狐狸和龙差别很大,模型就让狐狸的绸带变为了流动的浓墨融合进了水墨的巨龙身体里面,一下就让两者有了关联,比如你就会想狐狸是不是就是巨龙的一个化身,而且我都没想到这个转场可灵 2.1 可以搞定。

镜头首先聚焦于狐妖腰间飘动的一条彩色绸带,随着一股无形的风起,这条绸带挣脱束缚,向画面深处和高处飞去。摄像机立即启动,以一个平滑的弧线运镜紧紧跟随这条绸带。在高速运动中,绸带的丝绸质感逐渐溶解,其上的多彩颜色开始褪去并融合成单一的、流动的浓墨。与此同时,背景中的亭台楼阁在动态模糊中被迅速替换为灰色的、翻涌的云海。当绸带完全转化为一道粗壮的墨迹时,它的表面开始浮现出细密的黑色鳞片纹理,并继续在云雾中延展、壮大,演化为龙的身体。镜头沿着这条由绸带演变而来的龙身继续向前推进并上摇,最终穿出云层,定格在【结束帧】中那颗巨大威严的龙头上,它的一对金瞳在阴沉的云海中赫然亮起。


?k=f54b6df6&u=https%3A%2F%2Fmmbiz.qpic

这套提示词也不是 LLM 凭空产生的,而是我跟模型讨论的结果。

我先规定了一些基础的提示词生成原则,比如运镜不要太多,文学性修辞和比喻不要太多,产出了一个基础的要求。

然后就开始跟模型讨论两张图片变化的本质其实就是模型对“过程”和“变化”的理解与想象

然后就开始遍历到底两张图片之间会有哪些变化和过程,遍历了一下发现确实是可以穷尽的,然后在对这么多状态进行分类和组合,最后得出了常见的变化和组合主体变化 + 环境变化或者风格变化 + 特效变化这两种。

结合结合这两者的特点和我前面的提示词书写要求,结合生成了最终的提示词,如果你以后想写自己的提示词也可以参考这个思路。


Image

好了教程基本上已经写完了,我们来总结一下藏师傅这套可灵 2.1 首尾帧的通关攻略。

  • 三张王牌拿图法(同提示词抽卡、改提示词抽卡、FLUX Kontext 编辑)
  • 一条万能提示词,让多模态模型替你写提示词

但真正的价值不在这里,而在你接下来 10 分钟要做的两件事。

第一件事:把「流程」固化成「资产」

把今天所有步骤打包成一个模板:首帧图链接 | 尾帧图链接 | 差异分类(A/B)| 生成提示词 | 成片链接。以后任何新项目,直接往模板里填图,10 秒出提示词,半小时出片。这套模板可能就是你未来三个月的睡后生产力。

第二件事:把「特效」升维成「叙事」

首尾帧的本质不是「过渡」,而是「因果」。狐狸 → 巨龙:绸带化墨只是视觉钩子,真正的叙事是「妖狐渡劫化龙」。少女 → 盆景:树长人坐只是动态美感,真正的叙事是「人景共生」。当你用「因果」而不是「过渡」去写提示词,观众看到的就不是特效,而是故事。从「特效师」变成「叙事者」,你的视频单价至少翻 5 倍。

工具会迭代,模型会升级,但「流程资产化 + 叙事升维」这两件事永远不过时。现在,轮到你把「可灵 2.1 首尾帧」写进自己的复利曲线了。

最后如果觉得藏师傅这套方法对你有帮助的话,欢迎帮我点个赞👍或者喜欢🩷,也可以转发✈️需要的朋友。

阅读原文

跳转微信打开

今天起,不用下载飞书也能用飞书多维表格了!

飞书 2025-08-21 12:48 北京

?k=8af57e79&u=https%3A%2F%2Fmmecoa.qpic

一直以来,飞书多维表格作为飞书功能中的明星产品,收到了用户们广泛的好评和喜爱。为了让更多人以更低的门槛使用飞书多维表格,我们决定: 飞书多维表格将不仅支持飞书,也会支持其他平台。

现在,无需下载和注册飞书,飞书多维表格作为单独产品可以独立使用点击链接 即可体验!


图片

更独立的飞书多维表格,

意味着什么?


更加独立的「飞书多维表格」,既保留了飞书中多维表格的完整功能,也解除了和飞书其他模块的功能依赖,浏览器直接搜飞书多维表格就能找到入口。


?k=2dd94aa4&u=https%3A%2F%2Fmmecoa.qpic

这意味着,飞书多维表格将可以和其他 IM 系统任意打通,实现跨平台无缝衔接,让不同规模的企业都能迎来“零代码、自主定制业务系统”的全新起点。

图片

五大核心优势

1. 无需下载飞书,即可免费享有

不用成为飞书用户,即可免费享有专业级的飞书多维表格,完整保留各项能力,如仪表盘、工作流、高级权限、AI 功能、百万行权限等,有效降低企业数字化成本,满足 “ 第三方 IM + 飞书生产力工具 ” 的灵活组合需求。


?k=c646b9d1&u=https%3A%2F%2Fmmecoa.qpic


2. 超低门槛解锁工作中的 AI 场景,会用表格就会用 AI

让 AI 以极低的门槛融入业务,支持目前飞书多维表格所有的 AI 能力。包括 AI 字段捷径、仪表盘 AI 分析、 AI 生成公式等,让 AI 对业务人员真能用、真落地。


?k=08c3e22c&u=https%3A%2F%2Fmmecoa.qpic

3. 不用做图表,数据“拖进”仪表盘,就能 Get 企业级专业的数据驾驶舱

飞书多维表格拥有专业的 BI 主题、专业的 BI 组件。全面升级数据分析能力后,已完整覆盖专业 BI 软件所有的常用分析功能,让数据看得更清,让决策更快更准。


?k=49998cfe&u=https%3A%2F%2Fmmecoa.qpic

4. 高性能数据库底座,稳载复杂核心业务

飞书多维表格具备性能领先的数据库底座能力,可轻松承载高速增长、结构复杂的核心业务。让业务人员搭建的系统,用得深、用得久、容得下更多人。


?k=06fc6600&u=https%3A%2F%2Fmmecoa.qpic

5. 不懂编程,零代码也能搭建属于自己的业务系统

千行百业的业务人员,都在使用飞书多维表格解决业务问题。即使不会编程,也能零代码搭建业务工具,实现只有专业研发团队才能做到的业务创新。

目前, 飞书多维表格已在永旺、Recomm 、海底捞、雅迪、伊芙丽 X 珂蒂丝等国内外知名企业落地应用 ,成功助力客户搭建起数据承载量大、业务逻辑复杂且运行稳定的数字化业务系统。比如,日本永旺用它替代了亿元级自研的派遣员工管理系统,让复杂管理变得轻盈;伊芙丽 X 珂蒂丝的会员管理系统因它焕发活力,周活超 2000 人的日常运转里,藏着用户的信任与效率的跃升。

不知不觉间,飞书多维表格已经成为不少大公司的核心系统外挂系统和小公司的核心系统。


?k=40b7b696&u=https%3A%2F%2Fmmecoa.qpic

提供了更多入口的飞书多维表格,也将带给不同规模企业的业务系统更多可能性。

现在,无需下载和注册飞书,每一个人都能以更低的门槛用上同款解决方案。还等什么?点击阅读原文,即刻试用吧!

如果你在使用过程中有任何问题,都可以点击链接入群,获得专属解答。


图片

往期回顾


?k=6baf343e&u=https%3A%2F%2Fmmecoa.qpic

?k=b8a7e5bc&u=https%3A%2F%2Fmmecoa.qpic

?k=9dfc7c38&u=https%3A%2F%2Fmmecoa.qpic

?k=ba426366&u=https%3A%2F%2Fmmecoa.qpic



图片

阅读原文

跳转微信打开

谷歌Pixel发布汇总:硬件与软件全面AI化,那谁你就学叭

原创 歸藏的 AI 工具箱 2025-08-21 12:48 北京

?k=7b60cf44&u=https%3A%2F%2Fmmbiz.qpic

大家好,我是歸藏(guizang)谷歌昨晚举行了他们的 2025 年硬件发布会,早上起来回顾和总结一下。

虽然之前预想到了会有很多的 AI 能力,但是没想到会这么多这么激进,其中很多硬件和 AI 结合的相当好。

想买 Pixel 手机了,这玩意现在基本上可以说是 AI 手机,里面一堆端侧的 LLM 和扩散模型。


Image

来详细看一下这次发布会上的所有 AI 软件和硬件能力。

Gemini 驱动的健康教练

Gemini 构建的全新 AI 驱动个人健康教练,这个太好了,AI 驱动的健身和健康计划:

  • 自定义训练:会为你制定个性化的健身计划,提供详细的锻炼建议和侧重每周进步的指标目标。
  • 基于数据的训练:教练会根据实时数据和每日洞察持续调整你的训练计划,帮助你达成目标。
  • 实时签到与调整:当生活打乱计划时,你可以随时与教练连接进行调整。
  • 睡眠质量洞察:你的睡眠教练会查看你一周的睡眠,发现模式并提供如何随时间改善睡眠质量的见解。
  • 适应性睡眠计划:为了帮助你了解为保持最佳状态和表现实际需要多少睡眠,你的睡眠教练会提供一个根据你日常活动水平调整的个性化计划。
  • 会随着你的变化而调整的帮助:当你在健康旅程中进展时,你的个人健康教练会逐渐了解你——学习你的偏好。
  • 问题的答案:你可以向你的教练提出任何问题,并获得真正个性化且有科学依据的答案。
  • 洞察与要点:你的教练始终在关注你。它会主动分享你健康与保健的趋势。

苹果真是浪费了 Apple watch 的数据,但是好歹这玩意是APP 可以获取的。我不知道为啥到现在都没有 AI 辅助数据分析和训练的优质 APP 出现 多好的机会啊。


Image


Image

AI 驱动的拍摄指导和自然语言修图

通过自然语言编辑拍摄的照片:这个功能也很好,只需要打字或者语音就可以让相册里的 Gemini 帮你编辑照片,Nano Banana 是不是用在这里了。

除了像调整光线和去除干扰等修正性编辑之外,你还可以寻求更具创意的帮助。例如,你可以更改图片背景,给主体添加派对帽或太阳镜等有趣元素,等等。


Image

Gemini 驱动的拍照教练:不止帮你修图还帮你拍照,通过激发新的创意并帮助你探索可能未曾考虑过的构图,指导你拍出更好的照片。通过逐步引导,它会就光线、构图等方面提供建议。


Image

Pixel 10 Pro 和 Pixel 10 Pro XL 上相机的数码变焦范围可以到 100 倍,他们专门用了一个本地的扩散模型来对放大后的照片进行细节补充。


Image

Gemini 驱动的智能大屏设备 Gemini for Home

即将推出 Gemini 驱动的智能大屏设备 Gemini for Home,具体的能力有:

  • Gemini Live:有摄像头可以看到家里的画面,所以可以直接在这个设备上使用 Gemini Live 提出环境相关问题。
  • 发现并播放媒体:可以通过不说出名字的模糊指令来播放对应的视频或者音频
  • 获得更强大的智能家居控制:Gemini 可以推理处理复杂命令,因此可以说“把所有地方的灯都关了,除了我的卧室”。
  • 协调家庭与生活:自然语言用于日历创建、清单创建和计时器控制。
  • 询问任何问题:以 Gemini 为核心,可以快速获得具体需求量身定制的答案,涉及无数主题。


Image

其他 AI 相关能力

所有 Pixel 10 手机均搭载 Google Tensor G5 芯片,可以本地运行 Gemini Nano 模型。

不过谷歌坚持不用公版 ARM 架构,导致这次的芯片性能增幅有点拉跨,GPU IP 来自 Imagination 不支持光追。


Image

Magic Cue 功能:支持将所有谷歌应用的信息串联起来,在合适的地方建议你一键分享,比如在 Messages 应用中。


Image

Voice Translate :会利用端侧模型实时翻译通话内容,而且会模仿对方的说话音色,,更加自然,目前不支持翻译中文。


Image

Call Screen:Take a Message 现在会为错过或拒接的来电提供实时转录,AI 根据留言为你识别和弹出建议的下一步操作,留言和转录内容会放在通话笔记中。


Image

Gemini Live 更新:摄像头共享的时候 Gemini 会根据需求框选出需要高亮的摄像头中的物品,Gemini APP 现在支持用 Veo3 生成视频。


Image

NotebookLM 跟 Pixel 截图应用和录音应用整合:如果检测到你拍摄的图片或者录音可能适合加入笔记本,就会建议你添加收藏到NotebookLM。

新的笔记应用 Pixel Journal:帮助你记录身心健康、目标进展,并建立终身的反思习惯。设备端 AI 会提供写作提示,帮助你理清思路,并随时间为你提供有关模式和进展的洞见。


Image


Image


Image

录音机应用里面可以帮你生成音乐:只需录制你的哼唱的声音并选择想要的音乐风格,就能创建与自己氛围相符的独特曲目。

新的手表 Pixel Watch 4 现在有 Gemini 驱动的健身教练能力,AI 真的非常适合干这个,我就用 GPT-5 分析自己运动数据。它提供主动的健身与睡眠指导以及按需建议,基于来自你的 Pixel Watch 的指标。通过“抬腕交谈”,只需抬起手腕就能唤出 Gemini,跟他交流。


Image

发布 AI 耳机 Pixel Buds Pro 2:耳机内置 Tensor A1 和 Gemini,可以在嘈杂环境中与 Gemini Live 通话。会自动根据环境调整耳机音量或者开启降噪。可以不动手就接听来电,或拒绝回复短信。只需点头或摇头即可。


Image

看完了所有的内容,总结一下谷歌硬件发布会代表的几个趋势:

  • 手机系统的所有自带软件全部 AI 化,而且功能都非常实用
  • 除了手机之外的其他硬件产品也全部加上了 Gemini 的对话和沟通能力
  • 两个重点发力的 AI 软件场景是 AI 健康教练和 AI 修图&拍摄指导
  • AI 功能不再局限于主动触发,会自动在合适的场景下弹出和给出建议
  • 多个系统 APP 之间的 AI 能力可以联动,输出的信息可以相互流转
  • 端侧模型大量使用,覆盖了所有模态,AI 照片修改和100 倍数码变焦细节补充以及通话实时翻译&文本建议

谷歌过去一年在所有模型上的成果这次基本都反哺在了硬件上,反观苹果呢,依然在执着的推出 2900 毫安时电池的超薄 iPhone,这电量不知道够不够半天用。

如果觉得今天的内容对你有帮助的话可以帮我点个赞👍或者喜欢🩷,也可以推荐给你的朋友,感谢

阅读原文

跳转微信打开

Pixel Buds 2a 全新登場

紫色耳機

Adblock test (Why?)

全新升級 Pixel Watch 4 即將登場

Pixel Watch 4 可以維修
Pixel Watch 4 擁有我們至今最全面、最精準的健康與運動追蹤功能:

Adblock test (Why?)

全新最堅固耐用的 Pixel 10 Pro Fold 正式在台登場

Pixel 10 Pro Fold 展開
Pixel 10 Pro Fold 在 Pixelsnap 充電座上充電
Pixel 10 pro Fold 背面

Adblock test (Why?)

手机“自动驾驶”时代来了,智谱还让手机拥有“云替身”

原创 歸藏的 AI 工具箱 2025-08-20 16:52 北京

?k=df8e427f&u=https%3A%2F%2Fmmbiz.qpic

大家好我是歸藏(guizang),提前用了一下智谱新版的 AutoGLM。

前几天参加了一下智谱关于电脑和手机操作的智能体 AutoGLM 新版本(https://autoglm.zhipuai.cn/)的闭门会,同时试用了一下。

这次的更新非常大,基本将这类 Agent 的使用场景和能力拓展了非常多。

AutoGLM 更新亮点:

  • 全球首个手机通用 Agent,不止可以操控电脑而且可以操控手机
  • Agent 的操作全在云手机&云电脑上运行,解放你自己的设备
  • 全平台覆盖的客户端:iOS、安卓、网页都有,你可以在任何地方下发任务
  • 可实现跨应用程序的自动、可泛化的任务执行 ,即将更新“定时任务”能力


Image

这次主要的更新是云手机的 Agent 能力,我试了一下相当稳定和高效,我们先来看一下效果。

日常我们使用手机可以分成两个部分的任务,第一部分是内容消费,我们看电视剧抖音视频等来消遣时间,这部分是 AI 没办法替代的,只有自己看才能获得内容消费带来的愉悦感。

另一部分是各种生活服务和工具使用,这部分是 AI 发挥作用的时候了,而且语音和文字输入对于老人以及残障人士的帮助也非常大。


Image

首先我们先来个复杂的任务,跨多个 APP 并且需要进行几十次点击这种。

日常一个事情我觉得用手机的时候是非常低效的。

在约朋友的时候经常不知道去哪吃,而且在北京通勤时间巨长,40 分钟路程都算短的,找餐厅要在大众点评,看通勤时间要在高德还得转发给朋友一起挑餐厅,非常浪费时间,现在 AutoGLM 可以一次搞定了。

帮我规划一个本周六在北京的两人约会行程。上午去798艺术区,中午在大众点评上找一家附近人均200元左右、评分最高的西餐厅给我三个选择。下午去三里屯逛街,然后用高德看一下过去需要多长时间,帮我规划整个行程的时间安排,我住回龙观,他住望京,我们几点出门合适该怎么走。

这个任务非常复杂,Agent 需要跨两个 APP 进行多次点击和搜索操作,没想到 AutoGLM 执行的很好。

首先他需要打开大众点评,然后切换城市到北京-搜索798 艺术区-筛选人均消费价格,挨个点击搜索结果记录信息。

只是在这一个APP 上就需要起码点 20 次。


Image

然后他需要打开高德地图,找到灰的几乎看不到的开屏广告跳过按钮,开始分别查询望京到 798 和回龙观到 798 的路线和时间,最后还得查询 798 到三里屯的时间。

在高德的操作看起来会比在大众点评的更加复杂,首先是点击次数更多,然后就是高德的界面内容真的又多又杂非常考验模型的多模态内容识别能力。


Image

再经过几十次的点击和七八次的文本输入后 AutoGLM 非常快速而且准确的完成了任务,给出了餐厅的选择以及不同时间段和地点的通勤时间。

这里有个给智谱的小建议,GLM 的回复有点杂了,感觉他需要更加细致的整理信息,比如先把最为确定的餐厅信息和通勤时间告诉我,然后再说他推测的出行安排,事实和推理分开这样比较好。


Image

男生日常购买一些必需品和商品的时候跟女生差别比较大,又需要比价,不然亏,但是又懒得去购物软件上不断的挑选和对比,这个时候就可以让 AutoGLM 出马了。

我直接让他执行了一个我日常购买电子设备的常见流程,搜索京东和拼多多关于大疆无人机的价格信息然后汇总。

帮我分别在京东、拼多多上搜索‘大疆 Mini 4 Pro 无人机’,找出价格最低的平台,并看看有没有能用的优惠券或红包,最后把最低价的商品链接和优惠信息总结给我。

智谱 Auto GLM 智能体手机的使用过程科幻感非常强,你只需要语音输入或者打字之后,他就会直接启动云端的手机开始执行任务。

首次启动会让你登录账号,后面就不需要了,然后你就看着他非常快的输入内容-查看搜索结果-分析详情页内容并且汇总,而且可以跨多个应用执行任务。


Image

它默认会读取平台的前三个或者 5 个搜索结果,如果你觉得少的话可以在提示词要求他读取更多信息。

对于无人机这种标品来说三个结果已经足够了,我们一般都是对比京东官方店和拼多多百亿补贴的价格。

AutoGLM 给出了详细的结果京东的优惠和拼多多的价格都有,还有大致的评价,基本已经支持我进行购买决策了,如果我买的话可能就去拼多多买 4219 的那个了。


Image

内容运营上他也能帮忙,首先是信息检索和整理,我可以要求他去国内特色的只有手机上才能访问的内容平台检索内容后总结,帮我发布内容

也可以让他帮我分析账号数据辅助运营,访问和查看你的账户数据,然后进行分析和总结。

我想发一条关于‘周末北京City Walk’的小红书。请先在小红书和抖音搜索最近热门的路线和打卡点,然后帮我写一篇500字左右、风格活泼的文案,最后推荐10个热门标签。

相较于其他有浏览器操作能力的 Agent AutoGLM 的搜索更加直观和细致,手机上的操作要比网页版更加顺畅能看到的内容更多。

可以看到 GLM 4.5的内容整理和总结能力也很强,他不止给出了检索的内容,而且还进行了二次加工,将多条内容整合成了一条,而且跟你说了不同的互动表现,让你发内容的时候有侧重点。


Image

除了我们正常人这种需要跨多个 APP 进行信息整理和决策的任务以外,我还有一个场景就是帮爸妈设置手机。

随着 大型 APP 越做越复杂加上无处不在的贷款和广告,让老人和残障人士使用手机越来越艰难,他们根本无法理解手机的交互逻辑,比如哪里是展示的哪里可以点击,AutoGLM 可以完美解决这个问题。

比如,我妈想看某个剧集的话,光是找到这个剧,然后点到对应的集数都要越过很多的障碍,有了 AutoGLM 我们完全可以直接把这些加到收藏或者已经观看那里让他继续看就行。

我妈妈想看电视剧,帮我在腾讯视频里找一个现在热门的现实题材电视剧,不要执行搜索,直接点界面筛选找,并从第一集开始播放。然后帮我把这部剧添加到收藏夹里。


Image

AutoGLM 在检索信息的时候有非常强的搜索冲动,所以在需要动用筛选功能的模糊任务需要跟他强调用筛选工具而非搜索,不然他可能会直接搜热门现实题材电视剧,这种搜索词够呛能搜到符合要求的内容。

在我跟他强调了使用搜索之后,AutoGLM 就是开始通过搜索来完成信息检索的任务了,最后挑了长安的荔枝加入了收藏。

其实智谱这次将通用 Agent 拓展到手机是一个非常明智的决定,尤其是对国内的互联网环境来说,而且能解决我们现在互联网经济增长最大的阻力。

以往很多公司由于参考海外产品的惯性忽略了国内的特殊情况。

不是所有人都是坐办公室的,相当多的普通人其实不太接触电脑,另外国内相当多必须的操作需要在手机 APP 上完成,海外产品可以做网页点餐这种我们就肯定无法完成,必须在手机上操作。


Image

他们通过手机虚拟机这个操作避免了Agent 跟用户抢夺手机权限的问题,说到权限虚拟机也解决了 Agent 拿不到手机控制权的问题,虚拟机可以自由控制权限。

中国互联网可能 80% 的流量和时间消耗都发生在移动设备上,Agent 驱动云手机这个操作直接解决了每个人只有 24 小时消费内容的问题,直接将内容和 APP 消费时间拓展了无数倍。


Image

目前的互联网基本就是注意力经济驱动的,你的注意力会被算法广告系统明码标价让广告主进行竞价支付,每个人的注意力是有限的,所以增长就是有限的。

AutoGLM 直接开辟了一个新的注意力增长通道,而且这个通道看起来增长是无限的。

我之所以说这个主要是因为在测试的时候,AutoGLM 做正常人的操作是没啥问题的,但是由于国内几大巨头的反爬机制非常强大,AutoGLM 最需要克服的反而是各种无限弹出的验证码和强制下线等操作

 手机 Agent 化目前来看从模型能力和用户需求上都是不可避免的发展方向,模型能力现在完全可以胜任了,剩下就是生态建设了。

希望国内的 AI 公司和几个互联网巨头早日磨合出一个安全又稳定的手机 Agent 运行环境,毕竟不只是人可以创造价值,Agent 也可以,而且 Agent 的时间是无限的。

推荐大家试试 AutoGLM,体验一下手机的“自动驾驶”和智谱送你的“车”。

我是歸藏,如果觉得今天的内容对你有用,并且插图很可爱的话欢迎给我个三连,谢谢各位🙏

阅读原文

跳转微信打开

深耕台灣 AI 的未來:Google 研究合作的社會承諾

這張照片是 2023 年「Google AI 創新研究營」的開幕合照,五位講者站在舞台上,手持寫有「Google AI Boot Camp AI 創新研究營」字樣的橫幅。畫面上有 Google Chrome 總經理馬大康、Google DeepMind 研究副總裁紀懷新,以及
紀懷新(右一)為 2023 年 Google 台灣 AI 學術論壇揭幕。

報告指出,AI 可為台灣創造 1.9 兆經濟價值,帶動製造、零售業成長。

一張關於 AI 對台灣經濟影響的資訊圖表,標題為「AI 可以加速台灣的經濟成長」。圖中顯示,AI 預計可為台灣創造 1.9 兆新台幣的經濟價值,其中包含為製造業帶來 1.5 兆、為零售業帶來 420 億的產值。

AlphaFold 2 (右) 預測蛋白質結構,與核磁共振光譜(左)和 X 射線晶體學(中)一致。出自《Journal of Biological Chemistry》

一張科學對比圖,並列展示了三種蛋白質結構模型。最右邊是 AI 模型 AlphaFold 2 預測的藍色結構,其結果與左邊由核磁共振光譜 (NMR) 得到的綠色結構、以及中間由 X 射線晶體學 (Crystal) 得到的紫色結構,在視覺上幾乎完全一致,證明了 AI 預測的高度準確性。

Adblock test (Why?)