
数据能告诉你这个按钮被点了多少次,永远不会告诉你它该不该出现在那儿。微软给 Office 强推浮动 Copilot 按钮,参与度真涨了 —— 可它自己早写过那句话:智能没在对的时候出现,就不是帮手,是打扰。它做的,正是自己定义的那个打扰
微软给 Word、Excel、PowerPoint 强推了半年的浮动 Copilot 按钮,前阵子自己承认是个错误,撤了。耐人寻味的不是它认错,是它认错的同一句话里还得补一刀:这玩意儿的参与度其实涨了。
先说发生了什么。从去年 12 月起,微软在 Office 里推一个叫 Copilot Dynamic Action Button 的东西,默认浮在右下角,压在你的内容上面,不是老老实实待在工具栏里。Excel 用户被坑得最惨 —— 它盖住单元格、压住滚动条,挡着数据,连张干净的截图都截不出来。有人形容它「像一只停在我肩膀上的鹦鹉,我干活的时候它一直在尖叫『让我帮你!』」,还有人直接问微软「这是 Copilot 自己设计的、没经过任何真人审核吧?」。骂了几个月,5 月微软松口,让你右键把它移回工具栏、贴到边上,或者干脆关掉。而它在认错的官方说法里,原话是这么写的:「这次更新让 Copilot 的参与度上升了,但我们也听到用户需要对它的出现方式有更多控制权。」
这事值得写,不是因为微软又翻了个车 —— 大公司翻车天天有。值得写,是因为它把一个问题逼到了台面上:当数据说一个设计「赢了」,它到底证明了什么?
数据涨了,不代表这事做对了

参与度涨了,只能证明这个按钮难以被忽略,证明不了它好。 一只停在你肩膀上、一直尖叫的鹦鹉,「参与度」也很高 —— 你没法不理它。可没人会管那叫好设计。
这里其实藏着一个我们早聊过的判断:你不能拿一个产品的失败,去否定它的设计 —— 那是偷换概念。一个东西没做成,可能是能力不够、生不逢时,未必是设计错了。但这把尺反过来用同样成立:你也不能拿一个指标的上升,去证明设计是对的。 参与度涨,证明的是这按钮够碍眼、够难绕开,不是它好用。把下游那个数字 —— 不管是跌还是涨 —— 当成设计本身对错的判据,方向相反,错得一样。
更别扭的是,换个角度看,这按钮还真「高效」—— 它高效地把更多人推去点了 Copilot。问题恰恰出在这个目标本身。
数据只会优化你给它的目标,选哪个目标,它替不了你

数据是个好用的仆人,但它只干一件事:把你交给它的那个指标,往上顶。它不会回头问你,这个指标该不该是这个。 微软交给它的指标是「参与度」,它就忠实地把参与度顶了上去,干得漂亮。错不在数据,错在有个人替用户选了「让更多人点 Copilot」当目标 —— 而坐在那儿的用户,目标只有一个:把手上这张表填完。
你要是去问用户想要什么,得到的多半是一匹更快的马。数据能把这匹马优化到极致 —— 跑得更快、更省料、毛色更亮;它永远不会告诉你,那个人真正要的是「更快地到地方」,而答案是一辆汽车。从「更快的马」跳到「汽车」,是判断,不是数据能算出来的那一步。
Google 当年把这件事演到过极端。它的首席视觉设计师 Douglas Bowman 离开时写过一段很有名的话:两种蓝色定不下来,团队就测了 41 种中间色,看哪种点击率高;他为了一条边框该是 3 像素、4 像素还是 5 像素跟人争,还被要求「拿数据证明」。他说,我没法在这种环境里工作。这不是说数据没用,是说 当你把每一个判断都外包给数据,你就顺手把设计师身上最值钱的那样东西 —— 判断 —— 给关掉了。
而数据驱动一旦走到这步,还会悄悄把事情做反。好设计本来的活,是把麻烦从用户身上接过来、自己消化掉,再还给用户一个干净的结果。浮动按钮反着来 —— 它把麻烦重新堆回用户眼前(糊住表格、吞掉半屏),就为了让那个数字好看一点。这已经不是帮用户了,是替一个指标,征用他的注意力。
这只浮动按钮,是装了大模型的 Clippy

微软最不该犯这个错,因为它 25 年前亲手干过一模一样的事,还为收拾它办过一场庆功。 那只大头钉叫 Clippy,1997 年随 Office 出场,没人请它就跳出来「看起来你在写信,需要帮忙吗?」。当年它挨骂的罪名,跟今天这只按钮一字不差 —— 打断用户。Smithsonian 把它列进「计算史上最糟的软件设计失误」。微软 2001 年把它默认关掉,2007 年彻底删干净,删的时候还专门做营销庆祝,做了个小游戏让用户拿订书机砸它。浮动 Copilot 按钮,就是装了个大模型的 Clippy。 这话不是我刻薄 —— 连 Tom’s Hardware 的标题都写:Clippy 退役 25 年,它那股烦人的劲儿,如今活在 100 多个 Copilot 里。
这里有个机制得说清楚,它是设计判断问题,不是道德问题。一个界面好不好,要看它端出来的时间尺度,跟用户真正在意的时间尺度对不对得上。浮动按钮优化的是「此刻这一秒」—— 让你这一下更可能伸手去点;可用户活在的,是「这两个钟头把这张表做完」的尺度。指标盯着的那一秒,和用户真正在过的那两小时,错位了。这种错位,就是「打扰」最准确的定义。
那微软为什么明知故犯?因为它先对着资本市场许下了一个故事 —— AI 无处不在、Copilot 全线铺开。故事许出去,就得有个数字回来兑现,于是「参与度」被选中,因为它几乎注定会涨。数据在这儿不是用来找答案的,是用来给那个早就许下的故事开脱的 —— 调研和数据在公司里,常常就是这个用法:拿来给决定兜底,不是拿来找路。顺带说一句,几乎同一时间,微软还在退另一个东西 —— Windows 11 那个物理 Copilot 键,2024 年硬塞进键盘、占了右 Ctrl 的位,把靠快捷键和读屏软件干活的人坑得不轻,现在也得让大家改回去。同一个剧本,演了两遍。
难的不是知道对错,是在数据奖励错事的时候守住判断

这件事最扎心的地方,是微软其实全知道。 它自己白纸黑字写过那句话:智能要是没在对的时机、对的地方出现,它就不是伙伴,是打扰。这话说得比我准。它不是不懂,是懂了之后,被数据推着做了相反的事。所以真正难的那一步,从来不是「知道什么是对的」;是当仪表盘上的数字正在奖励那件错的事时,你还能不能把手,从那个按钮上挪开。
设计的对错,不归当天的仪表盘管,归时间管。 去年 12 月那版上线时,数据是一路绿的;不到半年,它成了「一个错误」。仪表盘上那个「赢」,扛不过用户用脚投的这半年票。还有个细节出卖了它:微软最后的修法,不是把按钮重新做得更好,是把选择权还给用户 —— 浮着、贴边、回工具栏,你自己挑,不要还能关掉。原来那个错,错在「替用户决定,还不许商量」;退回到「你自己挑」,本身就是一份认罪书。
说到底,这事落在一个很老的选择上:是做那件短期有效、却是错的事,还是做那件长期、又难、但对的事。 数据驱动最大的诱惑,就是它让前一件事看上去特别有底气 —— 数字都涨了,你还有什么好争的。可那个数字只回答了「它被点了多少次」,没回答「它到底该不该在那儿」。后面这个问题,得有个人站出来,从用户的长远体验出发,自己扛着判断去答。这一步又难又不讨好,数据替不了你 —— 它也从来没打算替你。
微软这次的事,往小了说真不大,就是 Office 角落里多了个又撤掉的按钮。但小事里有真东西。一项新技术加进来,到底是在解决问题,还是在制造问题 —— 浮动 Copilot 按钮给了个挺清楚的答案:当你拿数据替了判断、拿参与度替了体验,你很可能正在制造一个问题,然后用一条上扬的曲线,说服自己那是在解决问题。
数据能告诉你按钮被点了多少次,永远不会告诉你它该不该存在。后面这一步,是设计师的活,不是仪表盘的活。
姊妹篇《从 Luce 的内饰争议,聊聊设计师应该如何看待这件事》讲的是反过来的一次 —— 车厂追了多年的全触屏,数据和潮流都说它高级,最后还是被「开车多看两秒、出事概率翻倍」这本长期的账,硬逼了回来。一个被指标推着往前冲,一个被现实拽着往回走,较的是同一道题:短期那个好看的数字,扛不扛得过长期的对错。