即刻App年轻人的同好社区
下载
App内打开
Simon的白日梦
87关注2k被关注3夸夸
🧐躺平AI艺术家,在读博士,跨领域研究者
‍💼UCL🇬🇧 | 中国美院🇨🇳 | UIBK🇦🇹 外聘导师
置顶
Simon的白日梦
2年前
✨大家好~ 我是Simon阿蒙,我现在的身份有:不知道啥时候能毕业的PhD / 佛系自媒体人 / 菜鸟独立开发者 / 断更艺术创作者 / 半个数字游民 / 初创公司打杂人员🐶
👉个人独立站:shengyu.me

✨想成为理解AI,但AI无法取代之人

📑我分享过的有用资源📑:

- 🌟科普教程:
- 我上 AI 顶会啦!CVPR AI Art Gallery 作品极简创作教程 (2024.06): mp.weixin.qq.com
- OpenAI Sora视频生成模型技术报告中英全文+总结+影响分析 (2024.02): mp.weixin.qq.com
- 送立体动态新年红包+最好用的SD客户端+开源视频生成模型 (2024.02): mp.weixin.qq.com
- AI时代抗焦虑指北 —— 被AI包围之后,人类“完蛋”了吗?(2023.12):mp.weixin.qq.com
- AI生成3D问题的简化和解决,以及随之而来的新问题(2023.11):mp.weixin.qq.com
- 如何制造大语言模型的意识幻觉?斯坦福AI小镇论文精读 (2023.09):mp.weixin.qq.com
- ChatGPT基本原理(告诉你为啥它啥都懂)(2023.04):mp.weixin.qq.com
- 从用手建模到用嘴建模:一文说透最新用文字生成三维模型的人工智能算法原理 (2022.10):mp.weixin.qq.com
- 5分钟上手人工智能设计:借AI之力用文字生成图片(无软硬件+前置知识要求,2021.08):mp.weixin.qq.com

- 🌟工具合集:
- 关于声音生成的一切(2024.01):mp.weixin.qq.com
- 关于4D 生成的一切(2024.01):mp.weixin.qq.com
- 关于 chatGPT 的一切(实用工具篇,2023.05):mp.weixin.qq.com
- 关于 ControlNet 的一切(2023.04):mp.weixin.qq.com
- 关于3D 内容人工智能 (AI) 生成的一切(2023.01):mp.weixin.qq.com
- 关于人工智能内容生成(AIGC)的一切(2022.10):mp.weixin.qq.com

😶‍🌫️
💽AIGC代表作💽:

- 🌟代码开发:
- 我攒了一扇 AI 平行时空传送门——3D gaussian 复杂大场景迁移(2024.04 已暂停):mp.weixin.qq.com
- 我,编程菜鸟,攒了一个用文字生成三维模型的AI工具(Dreamfields-3D,已开源,2022.09):mp.weixin.qq.com

- 🌟艺术商业案例:
- 我如何用AI为小米国际限量版手机做宣传片(2023.03):mp.weixin.qq.com
- AI创作的正确打开方式:雪佛兰×全屏本是×Simon的白日梦 | AIGC商业落地案例复盘 (2023.02):mp.weixin.qq.com
- 国家地理中文网:“守护海洋原住民”系列数字藏品创作(2022.05):mp.weixin.qq.com

- 🌟 AI视频作品:
- ✨微观宇宙:一木一浮生,一空一有无, 一念一无限 (2024.08): b23.tv
- 云端画意 —“古董”AI模型生成复古国风山水动画(2023.07):www.bilibili.com
- 硅基生物图鉴-硅藻云戏者(2023.06):www.bilibili.com
- 量子场-无AI生成艺术(2023.04):www.bilibili.com
- 微观世界极限深潜(2022.10):www.bilibili.com
- 幻时之砂(2021.12):www.bilibili.com
- 超级文明已经组队迁往二次元元宇宙了,而你还没有拿到船票?(2021.12):www.bilibili.com

🎖️AIGC经历🎖️:
- 做过课程或讲座的地方:英国伦敦大学学院 / 奥地利因斯布鲁克大学 / 中央美院 / 小米 / 深圳市插画协会 / 集智俱乐部 / 国际人机交互大会 / 艾厂 / 中国科普作家协会
- 合作过的厂商:小米 / 雪佛兰 / 现代 / 周大福 Tmark / 国家地理中文网
- 参展过的地方:上海设计周 / 上海喜马拉雅美术馆 / 威尼斯元宇宙艺术年展 / 北京Tong画廊 / 郑州海汇美术馆 / 北京-城市建筑双年展 / 伦敦 Zero to One Space / 奥地利-蒂罗尔建筑中心

📻我的社媒📻:
- 公众号 / 视频号 / B站 / 小红书 / 微博:Simon的白日梦
- 我的 AI 自动化创作替身 - CyberGenix:weibo.com
- 知识星球(核心社群):AI白日梦想家 (向我提问,72小时无条件退款,领券:t.zsxq.com

🥰写在最后🥰:
感谢你读到这里,其实我是一个佛系+拖延的人,能做那么多事情或许真的是因为一直以来大家给我的正反馈,所以我后续会一直在这里更新有用的资源(你可以收藏或者转发这个帖子)。如果你有问题或者希望找我合作,可以私信我也可以发到 📧simondaydream@163.com。如果我48小时后还没有回复,可以再提醒我一次。最后,希望世界和平,愿你身心自在🤗。
821
Simon的白日梦
4天前
推荐一个或许是最适合新手入门vibe coding的工具🥹
智谱发布了一款原生整合 Claude Code、Gemini CLI、CodeX 等CLI工具的图形编程客户端,不用再单独安装各种cli工具,也不用再配置api接口(会自己读取你系统上已经登录的能调用的模型套餐,也可以用智谱的套餐或者自己配置),甚至还预装了很多常用claude skill和MCP!编程结果会马上在左侧显示,感觉很适合给新手入门vibe coding(下次我开课就用这个🐶)。

▶️链接:zcode-ai.com
212
Simon的白日梦
4天前
前几天我就在想有没有什么工具可以统一管理所有AI chat网页的历史,搜了一下果然有人做了,一泽老师做了一个chrome插件,可以自动同步/导出/总结你和各个AI的对话,大家可以试一下🥰

Chat Memo 网页设计与功能解析

一、整体结构与核心定位
Chat Memo 网页是一款面向 AI 对话管理的工具展示页面,采用现代化单页应用设计,通过模块化组件(如导航栏、功能区块、模态框)实现流畅交互。页面核心目标是推广 Chrome 扩展插件,帮助用户统一管理多平台 AI 对话(如 ChatGPT、Gemini、Claude 等),并强调隐私安全与本地存储特性。

二、关键功能区块
AI 平台整合
展示主流 AI 工具图标(ChatGPT、Gemini、Claude、DeepSeek 等),支持多平台对话聚合,解决用户在不同标签页间切换的痛点。
设计特点:图标悬停时透明度提升,增强交互感。
四大核心功能
统一对话管理:自动同步多平台对话,支持一键归档与分类。
智能搜索历史:通过关键词快速检索对话内容,重现关键信息。
隐私本地存储:所有数据 100% 存储于本地设备,无云端数据访问风险。
实时更新与静默同步:后台自动增量保存对话,不干扰用户与 AI 的交互过程。
每个功能区块配视频/图片演示,视频采用懒加载(IntersectionObserver),进入视口后自动播放,离开时暂停以节省资源。
价值发现与使用场景
提供三种“AI 互动配方”:生成周报、提炼主题洞察、自我认知探索。
点击配方卡片弹出模态框,展示操作步骤与提示词(如“生成周报”的详细步骤和 AI 提示词),支持一键复制功能。
开发者愿景
创始人(一泽Eze)介绍产品理念:Chat Memo 不仅是工具,更是个人 AI 记忆中枢,致力于沉淀可积累的智慧资产。
31
Simon的白日梦
4天前
让claude code自己PUA自己直到完成任务?🫨 这个插件我一定要试了!(大家试之前请先确保自己的token余额🥹)
{Claude Plugins Official - ralph-wiggum}

🧐 Anthropic开发的Ralph Wiggum插件是Claude Code的迭代式AI开发工具,通过拦截退出尝试构建自引用循环,支持任务持续优化直到完成,命名源自《辛普森一家》角色象征韧性迭代。

➡️链接:
github.com

✨重点
●🔄【核心机制】使用Stop hook拦截AI退出指令,通过/ralph-loop命令启动自迭代循环,自动重复任务直到满足--completion-promise条件
●📝【命令系统】支持/ralph-loop(带任务描述+迭代参数)和/cancel-ralph(终止循环),示例中用50次迭代完成REST API开发
●🛠️【技术设计】基于Claude Code的prompt拦截机制,允许任务在自我修正中逐步完善,需明确定义成功条件防止无限循环
●📌【最佳实践】需明确完成标准(如"Output COMPLETE"),分解任务到小阶段,搭配TDD测试驱动开发
●💡【哲学理念】强调"迭代>完美",失败数据用于优化prompt,用户需具备良好指令设计能力,工具自动处理重试逻辑
●🚀【应用场景】适合代码生成、API开发等可量化任务,已验证能在3个月内构建完整编程语言,成本仅$297
●🔄【安全设计】强制--max-iterations参数防止无限循环,依赖明确完成标记确保终止条件可预测
●📚【扩展资源】关联Ralph原始技术文档与Ralph Orchestrator工具,支持Claude Code内直接调用/help获取详细命令
00
Simon的白日梦
4天前
最近才开始摆弄MCP,看到这个艾逗笔老师做的mcp聚合站不错,分享一下~🥹
{Model Context Protocol Marketplace - MCP.so}

🧐mcp.so是一个聚合了17,286个第三方MCP服务器的社区平台,作为AI应用的中央目录,帮助用户发现、分享和学习各类MCP服务器,MCP(Model Context Protocol)是Anthropic开发的开源协议,用于AI系统安全连接外部数据源与工具。

➡️链接:
mcp.so

✨重点
●📡【MCP服务器列表】包含EdgeOne Pages MCP(HTML部署)、AlphaVantage(企业级股票数据)、Zhipu Web Search(多搜索引擎切换)、MiniMax MCP(TTS/图像/视频生成)等18类服务器,覆盖搜索、工具调用、数据检索等场景。
●💻【MCP客户端生态】提供HyperChat(多LLM聊天)、Y Gui(网页AI交互界面)、DeepChat(桌面AI助手)、Cursor(AI代码编辑器)等11种客户端,适配不同使用场景。
●❓【核心问题解答】明确MCP是AI系统连接外部数据的通用标准,服务器通过1:1安全连接提供资源共享、工具调用和提示模板,Claude等AI可通过MCP访问实时信息,且无需向LLM提供商共享API密钥。
●🔗【平台功能】MCP Advisor帮助选服务器,Howtocook Mcp提供食谱推荐,Context7提供LLM代码文档,Serper MCP Server等专注搜索与数据获取。
●🔧【技术细节】支持Playwright Mcp(网页自动化)、Firecrawl Mcp(网页抓取)、Perplexity Ask MCP(Perplexity API集成)等工具,覆盖自动化、搜索、数据库等技术需求。
●📝【提交机制】用户可通过GitHub提交新MCP服务器,需提供名称、功能描述、连接信息等,平台采用开源社区模式持续扩展服务器目录。
00
Simon的白日梦
4天前
非常推荐大家阅读的一篇文章——从大模型训练的成功范式种学习如何进化自己的人生(要知道大模型的训练范式是当今世界上最聪明的一波人的思想结晶🥹)
{像大模型一样进化 / 像大模型一样进化}

🧐作者刘嘉教授以大模型进化规律为核心,提出人类认知可通过「目标函数设定」「随机梯度下降式行动」「注意力分配优化」三大机制实现跃迁,将AI训练逻辑与人生成长路径深度耦合。

➡️链接:
mp.weixin.qq.com

✨重点
●📊【目标函数】人生需构建「AGI级野心」:如OpenAI以AGI为目标函数,人类应突破「局部最优陷阱」,设定特立独行的个人知识体系(如构建跨学科认知网络)
●🔄【随机梯度下降】人生优化公式:错误=成长信号,通过「粗糙开始→空中加油→持续迭代」实现突破,如奥尔特曼创业初期的「空窗期探索」
●👁️【注意力分配】三大法则:
质量优先:精选权威数据(如维基百科/经典书籍)而非碎片化信息
实例驱动:用「归纳式学习」替代「规则灌输」,如布鲁纳范例教学法
主动遗忘:「先加法后减法」优化认知,如设计师迪特·拉姆斯的「少即是多」
●🧠【核心类比】大模型训练=人生修炼:
预训练阶段→基础教育(知识体系构建)
微调阶段→实践试错(修正认知偏差)
强化学习→持续成长(突破局部最优)
●🌌【终极启示】人生目标函数应超越「线性成功」,追求「非线性跃迁」:
用「兰叶春葳蕤」的自然生长隐喻,实现「奔放人生」而非「枯萎人生」,呼应马斯洛「自我实现」理论
●🚀【行动指南】四步进化法:
定义宏大目标(如构建AGI级个人知识体系)
用SGD式行动迭代(允许试错,快速调整)
分配高质量注意力(精选领域权威与经典)
选择性遗忘冗余信息(聚焦核心认知路径)

▶️以下是精彩片段摘录:

人工神经网络宏大的目标函数的背后是规模化法则:参数规模越大,优化空间越广,最终实现目标的可能性越大。
人类学习也遵循同样的道理,如果我们把目标函数设定为短期、狭隘的目标,如考取某个证书、通过某次考试,那么这个目标函数的确容易实现。但是,我们得到的只是一个线性模型,目标只要稍微复杂一点、稍微变化一点,这个线性模型就再无用武之地。这在机器学习中也被称为“局部最优”陷阱。当一个模型陷入局部最优的舒适区,就不再演化,最终错过了更广阔、更深远的优化空间以抵达“全局最优”。同样,人生的发展也会出现局部最优——在人生某个阶段取得了看似不错的成就,实际上却限制了后续的发展空间。所以,短期看是目标达成,长期看则是机会丧失。

作为个人,我们的目标函数应该是什么?在我看来,那就是构建属于我们自己的、特立独行的“个人知识体系”。我们的知识体系是我们认知世界的“眼睛”,正如色盲者无法正确分辨这个世界的颜色,而一个知识体系有缺陷的人不可能触摸到这个世界的本质。进入AGI时代,个人知识体系的重要性被无限放大,这是因为AI正在逐渐接管那些标准化、结构化的信息处理任务,而唯有那些真正基于深层理解、价值判断和创造性思维的能力,才属于人的不可替代的能力。而这些能力,恰恰植根于独特的个人知识体系之中。所以,不断拥抱新的经验、新的知识,更新推理思维链,打破认知边界,都是在构建一个能与世界深度对话、与自我持续共鸣的个人知识体系。
“兰叶春葳蕤,桂华秋皎洁。欣欣此生意,自尔为佳节。”马斯洛说,这才是“奔放的人生”,而不是“枯萎的人生”,因为“如果你总是想方设法掩盖自己本有的光辉,那么你的未来注定暗淡无光”。

随机梯度下降的核心魅力之一,在于它能从不确定中找到确定性——目标函数清晰,但是通向目标函数的路径不确定。也就是说,我们不要执着于精确地规划未来的每一步,因为这样反而可能陷入过度分析而迟迟无法行动。我们需要做的,就是“强行起飞,粗糙开始,空中加油”——找一个大致正确的方向(梯度),然后向前走一步(下降)。不必在乎当下的这一步是否最优,做时间的朋友,能多走几步就多走几步。因为对于梯度下降这件事,起点不重要,终点才重要。起点都是初始化的随机参数,众生平等;终点则是损失函数的能量最小值。所以,家境是否优渥不重要,是不是名牌大学毕业不重要,年龄太大也不重要,因为这些都只是起点,或者最多只能算是“中点”而非终点。梯度下降算法能保证的是:不管起点在哪里,最后得到的解都差不多,当然前提是一直按照梯度的方向走下去。所以,坚持走。

应当如何分配注意力来认识我们所在的这个世界呢?
第一,注意高质量的数据和人。在机器学习领域,有一个广为人知的第一性原理:“垃圾输入,垃圾输出。”再多的参数,再强大的算力,如果输入的数据质量低下,最终训练出来的大模型也必然表现糟糕。

第二,注意实例而非规则。孩子的大脑,也如一个刚刚初始化的大模型,有极大的参数空间等待优化。与其告诉他人生道理,不如给他精选的样例,让他通过自己的探索得到答案。

第三,注意也是遗忘。学习的本质,是对知识体系的优化。大模型像一个捡破烂的拾荒者,无差别地记忆所有接触的信息。而人超越大模型的,是其所独有的“选择性遗忘”:有意识地强化对重要知识和场景的记忆,同时主动遗忘那些低效甚至有害的信息.

“你所领悟的人生真理,皆是你曾付出代价的往事。”
05
Simon的白日梦
4天前
我1月9日晚上会在深圳·海上世界文化艺术中心参加这个活动的“AI思想力夜谈-深刻新青年”活动板块,聊一下如何在AI时代保持内核稳定和建立独特竞争力(给大家做心灵按摩🥹)~ 欢迎大家线下/线上来玩呀~!🥰 (门票在链接里边申领)

AI在星栖三丨阿里云通义智能硬件展夜场开挂!四大主题嗨玩不重样

00
Simon的白日梦
12天前
分享一个包含提示词的Z-image和gemini还有GPT-4O生成效果对比的案例库。除了没有真正的多模态对话能力之外,其实Z-image对比gemini和GPT-4O的差距并不明显,甚至有时候会好一点🥹。
{camenduru/awesome-z-image-turbo}

🧐该仓库是z-image-turbo模型的资源集合,提供图像生成与编辑工具,支持本地部署、低延迟推理及多场景创意应用,含安装指南、提示词模板和案例库。

➡️链接:
github.com

✨重点
●📊【项目定位】z-image-turbo模型资源库,聚焦图像生成/编辑,支持本地GPU部署
●🔑【许可证】Creative Commons Attribution 4.0 (CC BY 4.0),允许共享与改编
●💻【多语言支持】含英文/中文README,适配开发者与创作者双场景
●🔧【核心特性】
本地部署:兼容NVIDIA/AMD消费级GPU,无需云端依赖
速度优化:低延迟推理,支持快速迭代创作
提示词工程:提供50+场景化提示词模板(如3D建模、艺术风格转换)
多模态支持:兼容Gemini/GPT-4o等多模型协作
●📂【仓库结构】
README.md:项目概述与安装指南
Cases目录:20+行业案例(广告/艺术/3D设计等)
Prompting Tips:含图像风格控制参数(如采样器、分辨率)
Tools Introduction:集成Stable Diffusion/ControlNet等工具链
●🎨【典型案例】
创意广告生成:品牌LOGO+产品渲染
艺术风格转换:黑白肖像→油画质感
3D场景构建:Google Maps→古代宝藏地图
个性化定制:动漫角色生成、机械钥匙扣设计
●🔄【社区支持】
贡献指南:支持新案例/提示词模板PR
Star History:持续增长的社区活跃度
技术栈:Python+Web Scraping+Claude API集成
(注:所有案例均支持Claude 3.5+模型直接调用,无需额外后端服务)
01
Simon的白日梦
12天前
OpenAI 开放了一个驻留项目,每个月提供 18000 美元,为期 6 个月。虽然肯定很难,但是有人想申请一下试试看么?🥹
{OpenAI Residency 2026 驻留项目}

🧐这是OpenAI为期6个月的旧金山AI研究驻留计划,招募技术能力强、有创新潜力的研究者,提供每月18.3K薪酬,2026年1月启动申请,要求跨学科背景与独立项目经验。

➡️链接:
openai.com

✨重点
●📅【项目周期】6个月驻留,旧金山混合办公(远程+现场协作),灵活安排工作时间
●💼【角色定位】作为OpenAI正式员工参与核心AI研究,接受资深研究员一对一指导
●💰【薪酬福利】每月18.3K固定薪资,提供研究资源与技术支持,无额外补贴
●🧠【能力要求】需精通编程/数学(线性代数/概率统计),能独立设计复杂算法
●🎯【背景开放】接受数学/物理/神经科学等跨学科背景,自学ML者优先
●📝【申请流程】2026年1月启动申请,多轮技术评估(代码测试/算法设计/项目答辩)
●🌍【平等政策】无歧视雇佣,背景调查符合法律要求,优先考虑多元化候选人
●🔬【研究方向】聚焦AI突破性技术,需展示快速学习能力与原创研究潜力
●🎓【成果导向】项目结束考核通过者可转为全职,或获推荐信与研究资源支持
01
Simon的白日梦
12天前
gemini是我现在最常用的AI,而这是目前可能最好的第三方gemini桌面版🥹,能够对话置顶、把对话导出为PDF\MD、接入MCP、使用AI stuio模式、制定自动做deep research的日程、音发音音色退换、代理设定等等拓展功能。

🧐{GeminiDesk is a powerful unofficial desktop app for Google Gemini, built with Electron to provide a native, distraction-free AI interaction experience across Windows, macOS, and Linux, replacing the need for a browser tab. It offers enhanced productivity features, UI customization, translations, and platform-specific installers.}

➡️链接:
github.com

✨重点
●🚀【Core Purpose】Transforms Google Gemini from a browser tab into a dedicated desktop app for seamless, distraction-free AI interactions.
●🌐【Cross-Platform】Supports Windows, macOS, and Linux with platform-specific installers (e.g., `installer.nsh` for Windows).
●🛠️【Technical Stack】Built with Electron (Node.js, `package.json`, `preload.js`), featuring HTML/CSS/JS modules and a modular folder structure.
●📸【UI/UX Enhancements】Includes custom context menus, settings panels, and screenshot-ready interfaces (e.g., notifications, settings screens).
02
Simon的白日梦
12天前
一个能够将MCP接入网页版AI(gemini/claude/gpt/DeepSeek/Qwen等等)的工具(chrome插件),可以用本地MCP也可以接入远程mcp(难点变成了找到好用的MCP服务器,话说谁有好用的免费金融类数据MCP推荐呀,我找了几个都用不了🥹,没有MCP的话问网页版AI很多时候抓到的价格数据都不对……)

MCP SuperAssistant (MCP-SuperAssistant)

🧐 Brings MCP to ChatGPT, Perplexity, Grok, Gemini, Google AI Studio, OpenRouter, Kimi, Github Copilot, Mistral and more... as a Chrome extension.

➡️链接:
github.com

✨重点
●🚀 Purpose: Integrates Model Context Protocol (MCP) tools with AI platforms for enhanced functionality, enabling direct MCP usage within ChatGPT, Perplexity, Grok, Google Gemini, and others.
●🔧 Installation: Available via Chrome Web Store and Firefox Add-ons (visual badges for quick access).
01