2026.05.31

数据涨了，但微软还是撤掉了那个浮动 Copilot 按钮

数据能告诉你这个按钮被点了多少次，永远不会告诉你它该不该出现在那儿。微软给 Office 强推浮动 Copilot 按钮，参与度真涨了 —— 可它自己早写过那句话:智能没在对的时候出现，就不是帮手，是打扰。它做的，正是自己定义的那个打扰

数据能告诉你这个按钮被点了多少次，永远不会告诉你它该不该出现在那儿。微软给 Office 强推浮动 Copilot 按钮，参与度真涨了 —— 可它自己早写过那句话：智能没在对的时候出现，就不是帮手，是打扰。它做的，正是自己定义的那个打扰

微软给 Word、Excel、PowerPoint 强推了半年的浮动 Copilot 按钮，前阵子自己承认是个错误，撤了。耐人寻味的不是它认错，是它认错的同一句话里还得补一刀：这玩意儿的参与度其实涨了。

先说发生了什么。从去年 12 月起，微软在 Office 里推一个叫 Copilot Dynamic Action Button 的东西，默认浮在右下角，压在你的内容上面，不是老老实实待在工具栏里。Excel 用户被坑得最惨 —— 它盖住单元格、压住滚动条，挡着数据，连张干净的截图都截不出来。有人形容它「像一只停在我肩膀上的鹦鹉，我干活的时候它一直在尖叫『让我帮你！』」，还有人直接问微软「这是 Copilot 自己设计的、没经过任何真人审核吧？」。骂了几个月，5 月微软松口，让你右键把它移回工具栏、贴到边上，或者干脆关掉。而它在认错的官方说法里，原话是这么写的：「这次更新让 Copilot 的参与度上升了，但我们也听到用户需要对它的出现方式有更多控制权。」

这事值得写，不是因为微软又翻了个车 —— 大公司翻车天天有。值得写，是因为它把一个问题逼到了台面上：当数据说一个设计「赢了」，它到底证明了什么？

数据涨了，不代表这事做对了

参与度涨了，只能证明这个按钮难以被忽略，证明不了它好。 一只停在你肩膀上、一直尖叫的鹦鹉，「参与度」也很高 —— 你没法不理它。可没人会管那叫好设计。

这里其实藏着一个我们早聊过的判断：你不能拿一个产品的失败，去否定它的设计 —— 那是偷换概念。一个东西没做成，可能是能力不够、生不逢时，未必是设计错了。但这把尺反过来用同样成立：你也不能拿一个指标的上升，去证明设计是对的。 参与度涨，证明的是这按钮够碍眼、够难绕开，不是它好用。把下游那个数字 —— 不管是跌还是涨 —— 当成设计本身对错的判据，方向相反，错得一样。

更别扭的是，换个角度看，这按钮还真「高效」—— 它高效地把更多人推去点了 Copilot。问题恰恰出在这个目标本身。

数据只会优化你给它的目标，选哪个目标，它替不了你

数据是个好用的仆人，但它只干一件事：把你交给它的那个指标，往上顶。它不会回头问你，这个指标该不该是这个。 微软交给它的指标是「参与度」，它就忠实地把参与度顶了上去，干得漂亮。错不在数据，错在有个人替用户选了「让更多人点 Copilot」当目标 —— 而坐在那儿的用户，目标只有一个：把手上这张表填完。

你要是去问用户想要什么，得到的多半是一匹更快的马。数据能把这匹马优化到极致 —— 跑得更快、更省料、毛色更亮；它永远不会告诉你，那个人真正要的是「更快地到地方」，而答案是一辆汽车。从「更快的马」跳到「汽车」，是判断，不是数据能算出来的那一步。

Google 当年把这件事演到过极端。它的首席视觉设计师 Douglas Bowman 离开时写过一段很有名的话：两种蓝色定不下来，团队就测了 41 种中间色，看哪种点击率高；他为了一条边框该是 3 像素、4 像素还是 5 像素跟人争，还被要求「拿数据证明」。他说，我没法在这种环境里工作。这不是说数据没用，是说 当你把每一个判断都外包给数据，你就顺手把设计师身上最值钱的那样东西 —— 判断 —— 给关掉了。

而数据驱动一旦走到这步，还会悄悄把事情做反。好设计本来的活，是把麻烦从用户身上接过来、自己消化掉，再还给用户一个干净的结果。浮动按钮反着来 —— 它把麻烦重新堆回用户眼前（糊住表格、吞掉半屏），就为了让那个数字好看一点。这已经不是帮用户了，是替一个指标，征用他的注意力。

这只浮动按钮，是装了大模型的 Clippy

微软最不该犯这个错，因为它 25 年前亲手干过一模一样的事，还为收拾它办过一场庆功。 那只大头钉叫 Clippy，1997 年随 Office 出场，没人请它就跳出来「看起来你在写信，需要帮忙吗？」。当年它挨骂的罪名，跟今天这只按钮一字不差 —— 打断用户。Smithsonian 把它列进「计算史上最糟的软件设计失误」。微软 2001 年把它默认关掉，2007 年彻底删干净，删的时候还专门做营销庆祝，做了个小游戏让用户拿订书机砸它。浮动 Copilot 按钮，就是装了个大模型的 Clippy。 这话不是我刻薄 —— 连 Tom’s Hardware 的标题都写：Clippy 退役 25 年，它那股烦人的劲儿，如今活在 100 多个 Copilot 里。

这里有个机制得说清楚，它是设计判断问题，不是道德问题。一个界面好不好，要看它端出来的时间尺度，跟用户真正在意的时间尺度对不对得上。浮动按钮优化的是「此刻这一秒」—— 让你这一下更可能伸手去点；可用户活在的，是「这两个钟头把这张表做完」的尺度。指标盯着的那一秒，和用户真正在过的那两小时，错位了。这种错位，就是「打扰」最准确的定义。

那微软为什么明知故犯？因为它先对着资本市场许下了一个故事 —— AI 无处不在、Copilot 全线铺开。故事许出去，就得有个数字回来兑现，于是「参与度」被选中，因为它几乎注定会涨。数据在这儿不是用来找答案的，是用来给那个早就许下的故事开脱的 —— 调研和数据在公司里，常常就是这个用法：拿来给决定兜底，不是拿来找路。顺带说一句，几乎同一时间，微软还在退另一个东西 —— Windows 11 那个物理 Copilot 键，2024 年硬塞进键盘、占了右 Ctrl 的位，把靠快捷键和读屏软件干活的人坑得不轻，现在也得让大家改回去。同一个剧本，演了两遍。

难的不是知道对错，是在数据奖励错事的时候守住判断

这件事最扎心的地方，是微软其实全知道。 它自己白纸黑字写过那句话：智能要是没在对的时机、对的地方出现，它就不是伙伴，是打扰。这话说得比我准。它不是不懂，是懂了之后，被数据推着做了相反的事。所以真正难的那一步，从来不是「知道什么是对的」；是当仪表盘上的数字正在奖励那件错的事时，你还能不能把手，从那个按钮上挪开。

设计的对错，不归当天的仪表盘管，归时间管。 去年 12 月那版上线时，数据是一路绿的；不到半年，它成了「一个错误」。仪表盘上那个「赢」，扛不过用户用脚投的这半年票。还有个细节出卖了它：微软最后的修法，不是把按钮重新做得更好，是把选择权还给用户 —— 浮着、贴边、回工具栏，你自己挑，不要还能关掉。原来那个错，错在「替用户决定，还不许商量」；退回到「你自己挑」，本身就是一份认罪书。

说到底，这事落在一个很老的选择上：是做那件短期有效、却是错的事，还是做那件长期、又难、但对的事。 数据驱动最大的诱惑，就是它让前一件事看上去特别有底气 —— 数字都涨了，你还有什么好争的。可那个数字只回答了「它被点了多少次」，没回答「它到底该不该在那儿」。后面这个问题，得有个人站出来，从用户的长远体验出发，自己扛着判断去答。这一步又难又不讨好，数据替不了你 —— 它也从来没打算替你。

微软这次的事，往小了说真不大，就是 Office 角落里多了个又撤掉的按钮。但小事里有真东西。一项新技术加进来，到底是在解决问题，还是在制造问题 —— 浮动 Copilot 按钮给了个挺清楚的答案：当你拿数据替了判断、拿参与度替了体验，你很可能正在制造一个问题，然后用一条上扬的曲线，说服自己那是在解决问题。

数据能告诉你按钮被点了多少次，永远不会告诉你它该不该存在。后面这一步，是设计师的活，不是仪表盘的活。

姊妹篇《从 Luce 的内饰争议，聊聊设计师应该如何看待这件事》讲的是反过来的一次 —— 车厂追了多年的全触屏，数据和潮流都说它高级，最后还是被「开车多看两秒、出事概率翻倍」这本长期的账，硬逼了回来。一个被指标推着往前冲，一个被现实拽着往回走，较的是同一道题：短期那个好看的数字，扛不扛得过长期的对错。