Chao.的个人主页

即刻App年轻人的同好社区

下载

Chao.

679关注3k被关注13夸夸

Chao.

1天前

这个试验是前几天在带娃间隙的碎片时间完成的。周四做了一些信息收集，周五晚上正式开始写，周日上午票就投出去了。用一句话总结就是我让AI做了个AI Agent参与治理。

过程非常简单：
1.设计提示词，描述治理Agent逻辑，提供合约地址和对应ABI。
2.Claude 3.5/GPT o1设计工程方案并生成代码（一大堆bug)。
3.人工调试优化代码最终让Agent成功跑起来。
4.通过模拟投票反复优化提示词，让Agent的决策更接近我的治理偏好。

最终成果：500行代码的agent，包含80行提示词。在正式部署前，对600多个历史提案进行了3000多次模拟投票。

Agent运行逻辑：
- 监听机制：持续监控区块链网络，检测新提案的产生。
- 数据获取：从链上直接提取提案的描述部分。
- 数据预处理：将原始提案数据转换为结构化、易读的格式，删除模型不易处理的部分，如base64编码的图片。
- 决策引擎：
- 将预处理后的提案数据作为提示词的一部分。
- 调用大模型进行分析和决策。
- 模型输出结构化的决策结果。
- 从模型输出中提取关键决策数据。

- 投票执行：
- 基于上一步得到的决策数据构造链上交易。
- 将构造好的交易发送到区块链网络。

从功能上讲这Agent只是MVP级别的，离完备的Agent还差很远。唯一有挑战的部分是提示词工程，如何让大模型更准确的理解我的决策偏好，做出我认可的决策，不容易，不过这部分最终实现效果还不错。

通过实验发现这个方向的可实践性很强，空间也很广阔。
未来的进化路径：

增强感知能力：
- 多维数据整合：链上数据、社交媒体、市场趋势。
- DAO知识库构建：自主积累信息，理解提案关联性，也对DAO的历史和发展现状有更深入的掌握
- 持续学习和反思机制：学习历史提案的决策结果和带来的影响，反思决策的合理性，优化决策模型。

提升执行能力：
- 自主理解合约并生成对应的交互代码（当前主要瓶颈），在不预设模板的情况下实现各类DAO的投票。

目前即使是最先进的模型也还不具备完备实现的能力，但眼瞅着是不远了。当这些能力全面实现，这类AI代理就能够适应快速变化的加密世界，提供深刻洞察，支持关键决策。我个人认为这些AI治理实验的影响将超越DAO的范畴，为各类组织治理提供新思路。

Chao.: 昨天我的治理AI在DAO中独立投出了第一票。这是一个75,000 USDC的拨款提案,AI经过考虑后投了反对票。它认为提案缺乏具体财务指标和预算细节,也未能阐明资金如何提升DAO的价值。附图是Agent同步提交到链上的说明，前面的数字2在合约中代表反对。这个治理AI通过读取链上数据获得提案内容，做出决策,我此前已将投票权delegate给它控制的钱包。它能自主形成判断并直接在链上投票,不需要我的参与，也不需要我的批准。今后这个AI将长期运行,持续参与治理。有朋友开玩笑说8年后的美国总统可能是个AI。8年可能过于乐观，但AI参与国家治理大概率将成为现实。要治理国家，先从参与治理一个DAO开始学起把。

14 13

Chao.

2天前

昨天我的治理AI在DAO中独立投出了第一票。这是一个75,000 USDC的拨款提案,AI经过考虑后投了反对票。它认为提案缺乏具体财务指标和预算细节,也未能阐明资金如何提升DAO的价值。附图是Agent同步提交到链上的说明，前面的数字2在合约中代表反对。

这个治理AI通过读取链上数据获得提案内容，做出决策,我此前已将投票权delegate给它控制的钱包。它能自主形成判断并直接在链上投票,不需要我的参与，也不需要我的批准。今后这个AI将长期运行,持续参与治理。

有朋友开玩笑说8年后的美国总统可能是个AI。8年可能过于乐观，但AI参与国家治理大概率将成为现实。要治理国家，先从参与治理一个DAO开始学起把。

21 59

Chao.

1月前

qwen2.5确实挺猛

1 01

Chao.

2月前

前几周整了点活，做了一个MVP级别的LLM Benchmark for crypto，选了不到20个主流闭源和开源模型跑了一遍。

Benchmark核心是数据集，这个Dataset其中一部分是大约700道选择题。这些题是我通过输入一些专业资料，由AI理解后生成题目，再经过人工校对和修改得出。最早的版本有一千多道，手工剔除了将近40%的题目，但剩下的应该也还是包含不少低质量或答案不清晰的题目。这个部分更像是一个PoC，能够很方便的和模型API配合做自动化评测，迅速得到不同模型的评分。不过由于数据质量有限，选择题的形式也答复降低了题目难度，因此概念验证的意义大于实际评分。

除了选择题，还有大约100个相对复杂的任务，包括问答，计算，审计，情景模拟，代码编写等。他们或来自加密不同细分领域的朋友的输入，或者是使用审计过的真实合约，发生过的真实安全事件改编成的题目。这部分由于任务相对复杂，暂时适配不了自动化测试和评分，半自动半人工也跑了一遍，中间遇到不少错误，凑合着跑完了。只有少量任务在不搭配agent框架的情况下大模型无法独立处理，暂时没跑。

为啥突然想做这个实验。主要是看好未来AI Agent会采用加密货币，从支付开始，最终形成基于加密网络的Agent经济网。我不好说大部分Agent都会用加密网络，但哪怕只有一部分在使用，考虑到未来Agent经济网体量，这也是个不得了的数字。

Agent又主要是LLM来Power，那么用来Power这些Agent的模型，到底有多懂加密，他们是否具备利用加密网络和工具的能力，他们对安全有多了解，他们能否通过自主创建合约来实现复杂的任务执行。这些在未来会变成很重要的问题。然而我们并不知道答案，没有一个基准。AI+Crypto结合当然不止于Agent，但仅一个Agent场景已经足够大，让我们有必要搞清楚这些问题。

简单说下一些观察。首先强调实验条件是很简陋的，测试框架还远不够成熟，没有针对模型运行参数进行细化，prompt也全部采用Zero Shot形式。这些都一定程度限制了模型的能力发挥。刚才也提到，数据集目前也难谈高质量。在这种条件下：

1.基础概念：模型展示了从密码学到区块链基础知识的深刻理解，并显示出对加密生态系统的熟悉。各个领域的概念性题目，几乎都难不倒大模型。无论是选择题还是问答题，都答的很好。哪怕是小参数量的开源模型也有很不错的表现。

2. 数学差距：大模型做计算类题目是完全不靠谱。不仅仅是复杂的加密计算答不对，就是计算AMM滑点或挖矿盈利能力等简单计算也常常算不对，业务逻辑里的弯弯，模型拐不过来。当然大模型本来就不是为数学计算而设计的，这些问题可以通过加载预设代码来绕过去，从而提高效率和准确性，这跟人类处理复杂计算问题也没什么区别。加密应用和计算还是高度相关的，这是开发者要注意的地方。

3. 智能合约：对形式的理解大于对内置逻辑的理解。概念性的问题都能答个差不多，去优化合约，找漏洞，常见的什么整数溢出啊，怎么优化一下gas消耗啊，都整的倍明白
。但如果漏洞是跟业务逻辑高度相关，一般是找不到的。看起来替代安全公司做审计还为时尚远。但其实模型潜力还是可以的，经过一些提示引导，有一部分模型能够自行发现一些隐藏的很深的bug。这说明提示词工程空间很大。

4. 私钥安全。安全的私钥肯定是生成不出来的，大模型不具备真正的安全随机数能力，这个可以通过调用代码解决，但问题是私钥生成出来，如果采用的云端模型，必须假设生成的那一刻就暴露了。这个怎么解决，目前可以通过中心化TEE或者HSM服务来搞。或者利用像Skyfire这样的工具，来绕过自行操作私钥的环节。然而当未来的场景不仅是支付，需要更复杂链上交互的时候，终归还是需要由Agent控制私钥的。

5. 开源挑战。在所有测了的开源模型里，最能打的是Llama3.1 405B，遥遥领先。不过它跟Claude 3.5 Sonnet以及GPT4o比还是有较为明显的差距。其余中小参数量的模型基本都离及格线还很远。我们还专门测了号称主打商用的Command-R，结果大跌眼镜，35B的模型，却几乎在全部测试里垫底。当然不排除是我的测试太糙，没发挥出人家潜力。

对于LLM来说，Benchmark的意义我不用多讲。每个模型发布时候都恨不得把主要Benchmark刷个遍。 Crypto方向的能力现在当然还不被AI领域所太重视，但未来不一定是这样。如果以后想重视，知道从哪使劲也很重要。

这个方向我还会继续投入一部分精力再搞一搞。把资料都梳理一遍之后会开源出来。这事跟商业化没什么关系，但如果数据集能够更强壮，这个benchmark大概也会对行业发展提供那么一丝丝的帮助把。意外收获是我自己为了搞这个dataset得以梳理了很多加密领域的知识，多年不动的代码又捡了起来，又找到一些hack的感觉。

有兴趣的朋友欢迎来贡献数据。所谓数据，主要就是问题，无论是加密算法、智能合约、Tokenomic和DAO治理，还是新矿哪个池子更值得冲，如何判断项目会rug。算法、合约、数据分析、生态、安全、交易、套利、都是有价值的。当然更欢迎有工程经验的朋友来搞Agent框架从而让一些real world challenge可以执行。

Will AI Survive in the Crypto World?

10 32

Chao.

2月前

第一个AI文明已经出现。在Minecraft游戏中,1000个AI智能体从零开始创造了数字文明,包括经济、文化甚至宗教和政府系统。

这是Altera公司运行的实验Project Sid。在一个特别的Minecraft服务器中，每一个玩家都是AI，他们从0开始，一起收集了300多件物品，并建立了一个市场。AI们同意使用宝石作为商品交换的通用货币，从而建立起了经济体系。

还有更多有意思的时刻。

◎Oliviaq原本是位尽职的农民，为大家提供食物。她却因冒险家Nora的影响动摇了。她想出去冒险，却被村民们所挽留，她纠结于追随梦想还是留守岗位，最终选择了责任。
◎在另一个平行世界中，AI公民们通过民主投票制定了新法律。
◎当有村民失踪时，AI村民们停下了手上的工作，齐心协力用火把点亮小镇，希望指引失踪者回家。

这不仅是一场模拟游戏，更是对未来AI与人类共存的深刻洞察。这种大规模AI模拟有些巨大的潜力：
◎为复杂的社会问题提供测试场：人们可以在虚拟环境中模拟和评估各种解决方案，而无需承担现实世界的风险。
◎改变决策过程：未来，重大决策可能会先经过AI模拟，通过数据驱动的预测来优化方案，显著提高决策质量和可靠性。

从城市规划到经济政策，从环境保护到社会改革，我们都可能借助AI模拟来预见潜在结果，从而做出更明智的选择。

这个实验也提出了一系列深刻的问题,这些问题的复杂性远超过实验本身所能解答的范围:
◎如何构建真正关心人类的AI?
◎如何让机器有意识地了解自己的行为及其后果?
◎AI文明的扩展极限在哪里?人类应该如何定义这个边界?

50 1627

Chao.

2月前

我认为LLM Powered Agent的一个趋势是通过使用加密货币/工具实现更好的自主性。因此引出一个关键问题：LLM必须证明什么才能让人们信任它可以很好的执行加密相关的任务？

如果对这个话题感兴趣，可以留下一个挑战LLM加密能力的问题。

9 21

Chao.

2月前

终于可以回家直面天命

17 10

Chao.

3月前

最近见过最酷的研究，一个真正可视化的历史长卷，编织了五个世纪以来的重要技术发展，揭示了技术与社会结构之间复杂的共生演变。

通过审视这些历史可以深入洞察技术与权力之间的纠葛，激发我们思考如何构建一个更加公平、公正的未来社会。

calculatingempires.net

92 1049

Chao.

3月前

互联网时代的本质是信息变的更便宜，形式更多样。李彦宏做搜索，丁磊做邮箱，王志东做新闻，马化腾做社交，马云做商业黄页，无一不是围绕信息展开的。而移动互联网时代的外卖，打车，流媒体，短视频，直播带货，本质上也还是围绕信息展开。信息形式和成本的革命性变化，重塑了整个世界。

AI时代的本质是智能变的更便宜，能力变的更好。AI可以渗透到几乎所有行业和工作生活娱乐，随着智能形式和成本的的革命性变化，这个世界也将因此迎来再一次的重构。

加密时代的本质是信任变的更便宜，更强壮。信任是人类社会运行的基础，但在过去构建信任是困难且昂贵的，而加密技术让信任的构建变的非常容易。

过去有一种说法叫价值互联网，这并不是加密时代的本质。价值互联网是因为我们有了更好的信任机制自然而然诞生的一个大场景。但这类的大场景不止一个，还会有基于加密的无国界数字身份网络，数据网络，创意网络，治理网络逐渐浮现。构建信任能力的变化毫无疑问也会重构这个世界。

相比之下，互联网和AI的效果是非常直观和显性的。人们可以立即体验到信息获取的便利、通信的便捷,或者AI带来的智能辅助。这些技术直接改变了人们的日常生活和工作方式。相比之下,加密技术带来的信任增强往往是在底层和背后发生的,普通用户并不能直接感知到。区块链技术如何确保交易的不可篡改,零知识证明如何保护隐私,这些都不是用户可以直观体验到的。

而在未来加密和AI会相互融合，相互催化，因为人们需要能够信任的AI模型，人们需要能够信任的AI Agent，人们也需要相信自己的隐私得到保护，相信自己的数据得到了妥善使用并被合理分配收益。AI Agent更需要加密技术，他们需要确保和自己交互的另外一个Agent或者人类值得信任，需要对于它友好可信赖的金融系统而不是一个随时可能被冻结的银行账号，他们需要自己每一天的交互中用到的服务是透明可控的，他们更需要通过更安全的方式来保证自己的生命线-算力不被切断。钢铁侠的J.A.R.V.I.S.如果够聪明，它一定不会选择一个能随时拔自己网线的算力提供方。

然而当前AI领域中，过多的信任被赋予了无法承担如此重任的个人和组织或者机制。加密未必是最终解，也未必是唯一解，但一定是求解路上一个重要的方向。

加密技术的意义远不止于此。人类历史上的每次技术革命都重塑了社会结构和人们的生活方式。如今人类又站在了一个重要的历史转折点。AI技术将大幅提升生产效率，创造空前财富，但同时可能导致大规模的、甚至永久性的技术性失业，因为AI的进步可能在很长一段时间都超越人类社会的适应能力。

加密技术和加密社区当前的努力很可能为人类迎接后AI时代的打造了部分基础。当信任体系被重构，分配机制，价值体系，社会结构也有势必要重构。而这可能恰恰是后AI时代人类最需要的。

AI的真正意义不在于在工作中替代人类，而在于解放人类，使我们摆脱重复性、无趣的工作。当社会结构，分配机制被重构，人们工作的基本模式将从生存驱动，财富驱动，转为价值驱动，兴趣驱动，意义驱动，工作的形式和意义也将被重构。

未来的工作是什么样，我想不到。如果硬让我想，我想到的就是去中心化自治组织。他们跨越地理、文化和语言的界限，让全球参与者在有着共同追求的社区中追求兴趣、追求自己认为有意义的事情，为之集体努力，并享受过程和结果。当生存不再是负担，人类的创造力将得到空前释放，反而有可能推动文明进一步加速发展。

在人类技术进步的编年史上，很少能看到两股先锋力量的汇合。然而今天我们就站在这个历史的转折点上。AI技术与加密技术的结合不仅是科技的进步，更会促使一种全新的社会结构与文明模式的诞生，生活在今天的每一个人都是见证者和参与者。

55 513

Chao.

3月前

从一个不同的角度说说我投资AI项目的经历。

我在湾区待过一段，有一些朋友，在这波AI浪潮前就接触到了一些朋友的AI项目，朋友的项目嘛，有时候是要随份子的，投过两个。但是太早了，早期项目都是叙事大于工程实现，发展的都一般，但也帮我拓展了资源和认知。

想要抓住AI的浪潮，2023年开始和朋友一起张罗这个投资DAO。虽然叫DAO，但有着美国监管体系下完全合规的结构，这套结构从运营到合规到技术实施到链上和链下的资金托管，再到法务税务的处理，已经非常成熟。但过去的投资DAO都是投到加密领域里，如何以这样的身份到传统VC的市场里投到项目，尤其是竞争激烈的AI项目，是很大的挑战，也是历史上没有人做过的。我们把名字起为Metropolis，致敬那部百年前第一次出现机器人的电影，也希望能够在历史上留下一点成绩。

一年半了，要说投的有多好，肯定没有，自己不算很满意。要说一点成绩没有也不是，学习到了很多东西，认识了很多朋友，也投到了一些我们还蛮喜欢的项目，有些披露了，Glif Altera Pika等等，大部分还没披露，整个过程还是很愉快的。

今年变难了。去年我觉的是勉强上了牌桌，今年我已经不好意思说上牌桌了，只能算是进屋子了，不同tier的VC在不同的牌桌上，我们还在牌桌外面站着，不过既然进屋了，能看到大家打牌，也能隔三差五给相互看着投缘的压个注。大家在努力进步，争取能在牌桌上坐实。

因为是美元结构+美国结构+高比例成员在湾区和纽约，所以投的全是欧美项目，这是个特点，一多半投的项目从未在亚洲区域的VC面前出现过。有相当部分成员也对华语区AI Infr项目有兴趣，觉得可以押中国AI，但结构上投不了，如果要投，我们商量过可以额外拿资金组SPV来投，不放在主基金架构里。随着Reverse CFIUS，也就作罢了。

我觉得未来的世界有一天会再变平，但今天它还远远不是。

专访投资DAO联创王超：投AI更偏爱开脑洞，加密和AI会深度融合

25 11