即刻App年轻人的同好社区
下载
App内打开
梅里Marina
429关注1k被关注2夸夸
经济学博士|CPA持证
主业👉出海🚢战略/副业👉用AI敲代码🤖
Think ahead,Move with the crowd
梅里Marina
2天前
# Agent 越多越聪明?Google 的 180 次实验告诉我们:有时候反而更蠢

🧠 今天读了一篇论文,对我最大的提醒是:

Multi-Agent 系统不能跟风。必须做任务匹配与预算验证。

这篇是 Google × MIT 的研究,名字叫:

Towards a Science of Scaling Agent Systems

他们测了 180 种架构组合、跑了 14,000 多次实验,结论之一就是:

“在大多数任务中,加 Agent 不升反降,性能最多掉了 70%。”

听起来很反直觉,但越读越觉得合理,特别是这几点挺提醒我的:

1️⃣ multi-agent 系统不能想当然。
我以前也觉得“多个 Agent 分工协作”一定比单 agent 更强,但实验结果却反过来:
很多任务里,加了 agent 后反而性能暴跌(PlanCraft 这个 benchmark 最多掉了 70%)。

2️⃣ 推理链长 / 工具复杂的任务,多个 agent 会碎片化信息。
每个 agent 只能看到局部,还得花 token 去彼此解释自己在干嘛,token 没花在思考上,花在了沟通上。

3️⃣ 如果单 agent 表现已经很好,再加人基本是浪费协调成本。
论文提到一个“45% 性能饱和点”——超出这个准确率之后,多 agent 反而是负收益。

4️⃣ 不要把 agent 系统类比成人类组织结构。
人类可以靠语言和习惯形成默契,Agent 没这功能。它更像是一台“认知机器”的模块组装,要考虑的是:token 怎么分、信息流怎么控、怎么避免彼此干扰。

🧠 总的来说,它提醒了我一件事:

multi-agent 架构不是“默认选项”,而是“匹配结果”。

以后再遇到任务链拆解/工具调用问题,我会先问清楚:

这个任务更适合多个 agent 分头做,
还是一个 agent 反复推理、单兵作战?

原文链接:arxiv.org
02
梅里Marina
3天前
很多团队觉得中东“机会大、门槛低”,但朋友提醒我一句:
看着热闹,进去做的时候才知道成本不低。

最近在拆阿联酋的消费者数据,越看越觉得他说得对。

UAE 真的不是“有钱好做”的那种市场。
它年轻、数字化极高,但同时又很务实,很多消费逻辑甚至和中国完全反着走。

我简单把几个关键点放下来,给做阿联酋的人做个参考👇

1. 心态是“想升级” + “算得很清楚”

虽然普遍收入不低,但买东西的方式其实挺务实的。
一半以上的人把“成功”当成人生第一目标
但同时,全国最关注的问题居然是通胀

所以你会看到很奇怪的场景:

愿意买更好的,但不愿意花冤枉钱。

很多品牌在这里的高端化,一定要配“价值证明”。

2. 社交媒体真的不是娱乐,是“信息系统”

这个数据我第一次看到也愣了一下:
83% 的新闻从社交媒体来
59% 搜产品直接在社交媒体搜,比搜索引擎还高

你会发现它的角色分工很清晰:
Facebook 看新闻
Instagram 找灵感
TikTok 发现新品
YouTube 做决策
WhatsApp 处理客服

说句实话:
如果社交媒体没有打通,中东市场基本没法动。

3. 买东西是典型的:线上查 线下摸 Amazon/Noon 下单

路径非常固定:

先网上查 看评论 线下看看 回去 Amazon 下单

线下店更多是用来建立信任,成交通常不在店里发生。

这会带来一个很现实的问题:

线下做得越好,可能越容易把用户“送”给 Amazon/Noon。

所以闭环要自己做得足够紧。

4. 食品行业看起来机会特别大(健康 + 方便)

两个数字很有意思:
64% 想吃得更健康
50% 又要求食物必须“快”

这不是矛盾,是生活方式决定的。

这里特别适合跑出来的品类:
ready-to-eat
健康轻食
meal kit
低卡 / 新鲜 / 天然

中国品牌在这条线上目前其实供给不足。

5. 它的“特别”,不是几个点,而是一整个结构

UAE 有一些很少市场同时具备的特征:
社交渗透接近 100%
AI 接受度意外地高
电商是 Amazon + Noon 的双中心
私家车占 92%,影响到广告、配送、店铺模型
对加密货币高度开放
新闻也从社交媒体看
年轻、男性多、移民多
你会感觉它的消费逻辑不是“东南亚版中国”那种,
而是一个独立的消费体系。

用《盗梦空间 Inception》里 Eames 的那句台词来形容阿联酋市场,其实刚刚好:
“You mustn’t be afraid to dream a little bigger, darling.”
对所有认真考虑阿联酋的团队来说,也是一样。

Ps:notebooklm的ppt做的真棒啊🌝
00
梅里Marina
4天前
深夜读书time🎵

梁宁老师这段写的太好了

人生很长,长过大多数产品、公司、产业的寿命。
这样长的周期里,人需要家人。
一家人各尽所能,各取所需,所有好的要与对方分享。也要在最坏的情况下去给对方兜底。
家人不但是尽其所能给你资源的人,更是为你兜底的人。
……
只想摘取一个人的好,而不想接纳这个人的弱,这不是长期关系的开端。
……
——《真需求》
00
梅里Marina
4天前
今天看 Statista 的《Japan Consumer Insights 2025》,有 4 张图强烈推荐所有做日本市场的人看。

1️⃣ 日本消费信心长期疲弱
能花但不敢花,价值感比品牌感强得多。

2️⃣ 日本数字化高度集中
LINE 是唯一入口,CRM/售后/触达必须 LINE 优先。

3️⃣ 线上强、线下更强
40% 买东西要“到店看看”,纯线上打法很难成功。

4️⃣ 日本消费者重“稳定、安心、无压力”
卖点不要喊创新,要强调“更简单、更安心、更轻松”。

4 个底层结构,几乎决定了一个品牌能不能在日本活下来。
00
梅里Marina
6天前
这辈子都忘不了比亚迪🫠

一个让我第一次加班到半夜的甲方🫠🫠
00
梅里Marina
11天前
最近喝水超开心的🌝🌝🥳🥳
00
梅里Marina
11天前
最近从我领导身上发现一个特别有意思的点:
她能平等地得罪任何人。

后来仔细想了一下,我意识到原因不是态度,也不是恶意,
而是她在管理沟通上呈现出一种非常典型的 P 型倾向:

关注感受多于目的,
表达顺序以当下想到什么为主,
而不是先想清楚逻辑和结构。

结果就是:她说的很多话,基本都只说了“前半截”。

两个真实例子(都来自这位领导的原话)

例子 1:想夸新领导 听上去像在贬旧领导

在例会上,她说:

“和之前的××领导相比,新领导给我很多支持。
以前的××领导下班后不会处理我的事,新领导晚上7点都会发我消息,我能感受到很大的支持。”

她真实想传达的是:

新领导很愿意投入
大家可以更大胆沟通
与领导沟通要提前准备

但她只说了“事实 + 感受”,完全没有说目的。

于是听上去变成:

在比较领导
在否定旧领导
在暗含评价团队氛围

现场每个人都“微妙一下”。

本来想传达正能量,
结果变成“无差别攻击”。

例子 2:想讲项目复杂 说成否定同事能力

一个平时躺平的同事这次主动承担了一个紧急项目,还说“住公司也要做完”。

按道理这应该被鼓励。

但她直接一句:

“不,他做不完。”

空气瞬间凝固。

而她真正想表达的是:

这个项目是链条式、分多环节的
不是写个报告就能完成
有什么是这位同事(是个i人)做不了的其他人可以承担的

但她只丢下一个“否定”,
没有解释、没有结构、没有行动指引。

于是现场所有人都懵住,私下认为她这么说真是“有毛病”🤷。

本质:这类沟通模式的大脑在“前半截”就结束任务了

这类沟通模式的表达路径是:

感受 事实 →(后半句缺失)

但团队真正需要的却是:

目的 背景 判断 分工 行动

两条路径天然对不上。

为什么这种沟通方式“无意中平等地得罪所有人”?

因为当目的缺席时:
任何事实都像“影射”
任何判断都像“否定人”
任何提醒都像“泼冷水”
任何比较都像“批评团队”

不是她坏,
而是她的表达本身就充满“未完成的判断”。

而听者往往只能靠脑补。
脑补 = 误伤来源。

我从她身上学到的沟通底层逻辑

为了避免自己也变成“只说前半截的人”,
我给自己定了一个超级简单但很有用的习惯:

表达前问自己三句:
1. 我想让对方理解什么?
2. 我希望对方下一步怎么行动?
3. 我为什么要现在说?(目的是什么?)

只要目的清楚了:
•结构自然出来
•表达不会误伤
•协作更顺
•别人也更愿意跟随你的节奏

尤其在管理和跨部门场景里,这个差别巨大。

最让我震惊的,是这种沟通方式的“实际代价”

她亲手提拔的助理,背地里天天说她坏话。
她关系很好的下属朋友,会在例会上当众反驳她。
而我之前的领导,围绕在她身边的团队……
我从没听过他们说她一句坏话。

那一刻我意识到:
沟通不是软技能,它直接决定你身边站着谁、远离你的人是谁。
02
梅里Marina
23天前
🙂准备建个出海群,为什么建?有什么用?请继续看下面👇

IMF NBER 做了一个全球不确定性指数。
2025 年前三季度,这个指数明显抬升。

但与此同时——
2024 年中国非金融对外直接投资(ODI)流量达到 1924 亿美元,同比增长 8.4%。

世界不确定性在增强,但中国企业走出去的步伐也在加快🌝

过去 6-7 年我一直在做中国企业出海咨询,主要服务政府、央企。
上周三受邀给一批出海的决策层 / 风控负责人做分享,我也是从这个数据讲起。

讲完当天有 28 个人加我微信,还有几家机构约下一场。
以前一场通常只有 3-5 人加我,这次是个明显的“数据异常”。

我复盘了一下,企业问的问题变了:

以前问的是:
“东南亚机会大吗?”
“我们该不该出海?”

现在问的是:
“为什么我们国内跑得很好,到海外就跑不动了?”
“同行做成了,我们为什么不行?”
“怎么判断一个市场是否适合我们?”

从“要不要做” “为什么没做成”。
说明很多企业已经出去了,但卡住了。

🧭 所以我想建一个小圈子

不大、不喧闹,面向真正做事、愿意思考的人。

适合这样的人加入👇
正在做 / 准备做出海(企业、团队、一人公司都可)
在看海外市场、消费者行为、竞争格局
用数据判断问题(Statista、海关数据、Google Trends 等)
想长期交流,而不是一次性提问

主要聊:
各国市场
消费者行为
政策环境 / 营商风险
数据源交流
案例拆解

📌 入群方式(⚠️)

私信我:你的出海方向 + 目前卡住的一个具体问题

例:
“印尼电商,想验证支付漏斗问题”
“美国 SaaS,增长卡在 activation”
“中东跨境,想搞清楚内容与付费比例”

越具体越能看出你是不是在认真做事。

目标 1-2 个月做到 50 人左右——
密度够、讨论不断层、又不会乱。

🌍 市场范围

主要是 SEA / MENA / LatAm / Africa / South Asia。
也欢迎做欧美日韩——
但希望你告诉我:你在研究哪些能迁移到新兴市场的洞察。

比如:
“Shein 在美国学到的内容打法,如何拿去巴西。”

如果你也在摸索出海路,欢迎一起来走一段。
20
梅里Marina
25天前
我有点悟了,女生假胯宽怎么调整力线能慢慢消失😂

最近刷脂在爬楼梯,n个人跟我说爬楼梯刷脂很好用,但容易膝盖疼、或者balabala,直到最近我有点悟了。

我普拉提教练最近在纠正我的一个发力,我刚开始不懂,只一味的照做,像个复健的病人一样在老师的搀扶下做动作🌝终于第三节课以后,我有点悟了!

那个发力的感觉我描述一下,就大腿根部外旋,会感到臀部上侧的两块肌肉有发力感,大腿内侧以及脚内缘会用力踩向地面,整个下肢会有挺拔的感觉🌝爬楼梯也记住这个感觉,基本上整条腿的发力感会有减弱,大腿上侧不容易很酸,其实也会用力,只是大腿内侧根部的酸感会超过大腿上侧的感觉,大腿后侧的膕绳肌也会有发力感。
12
梅里Marina
29天前
谷哥大善人🥹🥹
00