即刻App
年轻人的同好社区
下载
App内打开
Simon的白日梦
87
关注
2k
被关注
3
夸夸
🧐AI/艺术/设计/建筑/生态跨领域佛系研究者
📚发量充足的建筑学在读博士
💼中国美院/伦敦大学学院客座教师
置顶
Simon的白日梦
2年前
✨大家好~ 我是Simon阿蒙,我现在的身份有:不知道啥时候能毕业的PhD / 佛系自媒体人 / 菜鸟独立开发者 / 断更艺术创作者 / 半个数字游民 / 初创公司打杂人员🐶
👉个人独立站:
shengyu.me
✨想成为理解AI,但AI无法取代之人
📑我分享过的有用资源📑:
- 🌟科普教程:
- 我上 AI 顶会啦!CVPR AI Art Gallery 作品极简创作教程 (2024.06):
mp.weixin.qq.com
- OpenAI Sora视频生成模型技术报告中英全文+总结+影响分析 (2024.02):
mp.weixin.qq.com
- 送立体动态新年红包+最好用的SD客户端+开源视频生成模型 (2024.02):
mp.weixin.qq.com
- AI时代抗焦虑指北 —— 被AI包围之后,人类“完蛋”了吗?(2023.12):
mp.weixin.qq.com
- AI生成3D问题的简化和解决,以及随之而来的新问题(2023.11):
mp.weixin.qq.com
- 如何制造大语言模型的意识幻觉?斯坦福AI小镇论文精读 (2023.09):
mp.weixin.qq.com
- ChatGPT基本原理(告诉你为啥它啥都懂)(2023.04):
mp.weixin.qq.com
- 从用手建模到用嘴建模:一文说透最新用文字生成三维模型的人工智能算法原理 (2022.10):
mp.weixin.qq.com
- 5分钟上手人工智能设计:借AI之力用文字生成图片(无软硬件+前置知识要求,2021.08):
mp.weixin.qq.com
- 🌟工具合集:
- 关于声音生成的一切(2024.01):
mp.weixin.qq.com
- 关于4D 生成的一切(2024.01):
mp.weixin.qq.com
- 关于 chatGPT 的一切(实用工具篇,2023.05):
mp.weixin.qq.com
- 关于 ControlNet 的一切(2023.04):
mp.weixin.qq.com
- 关于3D 内容人工智能 (AI) 生成的一切(2023.01):
mp.weixin.qq.com
- 关于人工智能内容生成(AIGC)的一切(2022.10):
mp.weixin.qq.com
😶🌫️
💽AIGC代表作💽:
- 🌟代码开发:
- 我攒了一扇 AI 平行时空传送门——3D gaussian 复杂大场景迁移(2024.04 已暂停):
mp.weixin.qq.com
- 我,编程菜鸟,攒了一个用文字生成三维模型的AI工具(Dreamfields-3D,已开源,2022.09):
mp.weixin.qq.com
- 🌟艺术商业案例:
- 我如何用AI为小米国际限量版手机做宣传片(2023.03):
mp.weixin.qq.com
- AI创作的正确打开方式:雪佛兰×全屏本是×Simon的白日梦 | AIGC商业落地案例复盘 (2023.02):
mp.weixin.qq.com
- 国家地理中文网:“守护海洋原住民”系列数字藏品创作(2022.05):
mp.weixin.qq.com
- 🌟 AI视频作品:
- ✨微观宇宙:一木一浮生,一空一有无, 一念一无限 (2024.08):
b23.tv
- 云端画意 —“古董”AI模型生成复古国风山水动画(2023.07):
www.bilibili.com
- 硅基生物图鉴-硅藻云戏者(2023.06):
www.bilibili.com
- 量子场-无AI生成艺术(2023.04):
www.bilibili.com
- 微观世界极限深潜(2022.10):
www.bilibili.com
- 幻时之砂(2021.12):
www.bilibili.com
- 超级文明已经组队迁往二次元元宇宙了,而你还没有拿到船票?(2021.12):
www.bilibili.com
🎖️AIGC经历🎖️:
- 做过课程或讲座的地方:英国伦敦大学学院 / 奥地利因斯布鲁克大学 / 中央美院 / 小米 / 深圳市插画协会 / 集智俱乐部 / 国际人机交互大会 / 艾厂 / 中国科普作家协会
- 合作过的厂商:小米 / 雪佛兰 / 现代 / 周大福 Tmark / 国家地理中文网
- 参展过的地方:上海设计周 / 上海喜马拉雅美术馆 / 威尼斯元宇宙艺术年展 / 北京Tong画廊 / 郑州海汇美术馆 / 北京-城市建筑双年展 / 伦敦 Zero to One Space / 奥地利-蒂罗尔建筑中心
📻我的社媒📻:
- 公众号 / 视频号 / B站 / 小红书 / 微博:Simon的白日梦
- 我的 AI 自动化创作替身 - CyberGenix:
weibo.com
- 知识星球(核心社群):AI白日梦想家 (向我提问,72小时无条件退款,领券:
t.zsxq.com
)
🥰写在最后🥰:
感谢你读到这里,其实我是一个佛系+拖延的人,能做那么多事情或许真的是因为一直以来大家给我的正反馈,所以我后续会一直在这里更新有用的资源(你可以收藏或者转发这个帖子)。如果你有问题或者希望找我合作,可以私信我也可以发到 📧simondaydream@163.com。如果我48小时后还没有回复,可以再提醒我一次。最后,希望世界和平,愿你身心自在🤗。
59
8
20
Simon的白日梦
5天前
推荐一个用Nano Banana 做的“美国登月造假”虚构报道的案例,太有意思太有代入感了,我愿意称之为艺术!🥹
{Nano Banana Review:摄影棚里的宇航员——美国登月造假调查 / 卫夕:AI生成的登月造假特稿实为Nano Banana Pro能力测评}
🧐这篇文章以虚构的阿波罗登月造假调查为叙事框架,通过"内华达戈壁布景师埃利亚斯·索恩"等亲历者的细节披露,实则是谷歌Gemini 3 Pro生成的Nano Banana Pro AI测评,揭示了视觉技术重构历史记忆的颠覆性影响,同时探讨了AI对新闻写作与摄影行业的冲击。
➡️链接:
mp.weixin.qq.com
✨重点
●📸 登月造假的技术还原:通过24个高强度氙气灯组成的"Helios"矩阵模拟月球光源,菲涅尔透镜修正阴影畸变,玄武岩与水泥粉末混合的月壤材料,以及7秒延迟的通讯信号处理,构建出完整的"摄影棚登月"假象。
●👨🔧 关键人物与破绽:
埃利亚斯·索恩:以"关闭星星"的灯光设计解释照片无星现象,暴露摄影棚技术局限;
道具失误:阿波罗11号照片中出现的可口可乐罐,导致剧组停工排查,成为"最接近真相的穿帮"。
●🔍 档案解密与技术漏洞:
"Crimson Horizon"档案曝光背景山脉纹理重复,证实为"如画背景"拼接;
谷歌图像算法检测到月壤样本实为地球玄武岩熔炼产物,荷兰国家博物馆所藏月岩被证实为石化木头。
●🤖 AI生成的视觉陷阱:所有照片由Nano Banana Pro生成,带有"柯达胶卷褪色感"和"冷战压抑氛围",完美复刻《华尔街日报》特稿风格,却隐藏着"背景山脉重复"等AI生成痕迹。
●💡 行业反思:
摄影写实功能消亡:AI可通过提示词生成"呼吸感"和"情绪张力",传统摄影的神圣性被解构;
模型权重公式:输出效果=模型²×(任务+提示词),强调工具先进性对创作的决定性作用;
人类独特价值:即便AI能重构历史,人类的"审美品味与情感体验"仍是不可替代的创作核心。
●🕰️ 历史记忆重构:物理层面的登月造假照片与体验层面的真实感形成矛盾,揭示"眼见为实"的时代已终结,历史记忆可能被AI以"逼真假象"重新定义。
●🔄 创作流程曝光:作者通过Gemini 3 Pro生成文章,仅修改100字后记,展示AI可快速复刻深度特稿风格,引发"技术伦理边界"的讨论。
3
0
1
Simon的白日梦
6天前
那啥,反正现在投论文也是被AI先审了,那何不自己找AI先审一下?斯坦福出了个免费AI审稿人自动给意见~大家可以试一下~
{Stanford Agentic Reviewer / 斯坦福AI论文评审服务}
🧐这是一个提供免费AI论文评审反馈的在线服务,支持选择目标会议/期刊(如ICLR、NeurIPS等),通过上传PDF(最大10MB,仅分析前15页)获取AI生成的详细评审建议,需提供邮箱接收通知,MIT开源协议,AI反馈仅供参考需人工验证。
➡️链接:
paperreview.ai
✨重点
●📄 核心功能:AI驱动的论文评审反馈,支持多领域(AI、CV、NLP、数据库等)学术论文
●🎯 目标会议选择:可选ICLR、NeurIPS、ICML、CVPR等30+顶级学术会议/期刊
●🔄 流程简单:上传PDF→填写邮箱→接收AI评审→查看反馈
●⚠️ 文件限制:仅支持10MB以内PDF,仅分析前15页内容
●✉️ 通知机制:评审完成后通过邮件推送结果,无需登录系统
●📚 多语言支持:支持英文/中文论文上传及反馈生成
●⚠️ AI局限性:生成的评审可能存在错误,需研究者结合自身判断
●💡 使用建议:建议先检查论文格式(如LaTeX排版)再上传,避免格式错误影响分析
3
0
1
Simon的白日梦
6天前
一篇很有所以的文章,关于我们为什么记不住小时候的事情,以及为什么2岁是神经元数量的顶峰——人类童年失忆(记不起2-4岁前的事)主要源于大脑发育优化:婴儿期海马体逐步成熟但功能有限,2岁后突触修剪导致早期记忆被“清理”,同时程序性记忆替代情景记忆,最终形成高效神经网络以支持后续认知发展。(所以大模型的参数了也不总是越多越好?🧐)
童年失忆症:大脑如何“删除”早期记忆?
▶️原文:
mp.weixin.qq.com
🧠 一句话总结:
精彩摘要:
而人类童年记忆的消失,同样源于大脑的优化。
两岁之前,学习记忆信息来者不拒,会形成十分纷乱的神经网络。
两三岁的孩子基本停不下来,这里戳一戳,那里爬一爬。杂乱的神经网络,不仅不能形成稳定的人格,信息之间也会互相争夺感官资源,造成注意力的不集中。
一个人一生最复杂的神经网络出现在2岁左右。
2 岁的幼儿拥有成年人 2 倍的突触连接,每个神经元平均有 7000 个突触连接到其他神经元。
据估计,一个 3 岁儿童的大脑大约有 10^15 突触(1千万亿个)。而一个成年人的估计各不相同,从 10^14~5 x 10^14 突触(100 ~ 500 万亿)不等。
如果以突触连接复杂度论英雄,2岁幼儿无异是英雄中的王者。
但事实是,这样杂乱的神经网络是非常低效的
是时候建立比较稳定的人格了。
来自基因里的庞大力量,驱动着大脑前所未有的变化——一场盛况空前的突触修剪开始了。
对于长期不用的记忆,大脑判定相关信息没用了,就会逐渐削弱神经连接,甚至最终删除掉。
虽然你觉得幼儿园初恋的面孔是你珍贵的记忆,但基因里的祖传密码却告诉大脑,这些垃圾记忆如果不删,这脑子以后就不好使了。
最终,你的大脑留下主要的神经网络,开始删除绝大多数的杂乱链接。
这个过程很像磁盘整理+垃圾清理+智能迭代升级。
➡️ 核心机制:
海马体发育关键期:
9-12个月后,海马体后部开始编码视觉、空间等早期记忆,但此时记忆依赖“情境绑定”,缺乏语义标签(如时间、地点),难以被成年后检索。
2025年研究证实:婴儿对熟悉事物的偏好与海马体后部血氧活动增强相关,暗示早期记忆已形成但未稳定。
突触修剪的“记忆优化”:
2岁时突触连接达峰值(约10¹⁵个),远超成人(10¹⁴-5×10¹⁴个),大脑通过修剪低效连接(如杂乱的早期情景记忆),保留高效神经环路。
修剪过程伴随“记忆重编码”:程序性记忆(如走路、说话)被保留,而陈述性记忆(如具体事件)因缺乏强化逐渐模糊。
自我意识与记忆的“解绑”:
18-24个月婴儿开始形成自我意识(如通过镜子测试),但此时语义记忆未成熟,无法为早期记忆添加“身份标签”,导致成年后无法识别。
记忆类型的“优先级”:
婴儿期侧重程序性记忆(本能行为),而非陈述性记忆(事件细节),大脑优先保留后者以支持语言和概念学习,牺牲早期情景记忆。
研究证据与争议:
2025年最新研究显示:婴儿海马体后部可快速编码视觉经验,但需重复刺激才能转化为长期记忆。
部分学者认为“记忆未编码”是主因,而另一部分指出“编码后遗忘”更关键,目前尚无定论。
反常识视角:
“记忆未消失,只是被‘加密’”:早期记忆可能以潜意识形式存在(如对母亲气味的偏好),但无法通过语言或意识检索。
“童年失忆是大脑的‘节能策略’”:通过删除冗余早期记忆,大脑将资源集中于构建高效认知网络,为青春期学习奠基。
(注:本文核心数据来自海马体发育研究、突触修剪模型及2025年婴儿记忆实验,具体细节见原文参考文献)
2
0
0
Simon的白日梦
6天前
分享一个群友train的壁画修复专用开源模型
{中国古代壁画修复_V3 / Mural_Restoration_v3}
🧐这是一个基于Qwen-Image-Edit@v2509的LoRA模型,可在魔搭社区下载,支持智能缺损补全、色彩还原、线条重建等功能,用于中国古代壁画的修复与保护。
➡️链接:
www.modelscope.cn
✨重点
●🛠️ 核心功能:支持智能缺损补全(识别壁画剥落/褪色区域生成时代风格修复内容)、色彩还原(基于风化程度分析还原原始色彩体系)、线条重建(艺术化续接模糊/断裂线条)
●🧩 技术基础:基于Qwen-Image-Edit@v2509模型开发,采用safetensors格式,属于LoRA适配器模型
●📥 下载方式:提供SDK(Python代码)和Git两种下载途径,支持文本生成图片任务(text-to-image-synthesis)
●📜 开源协议:采用Apache License 2.0,支持非商业及商业使用(需遵守协议条款)
●🔄 版本管理:包含多个版本(如20.safetensors、25.safetensors等),可通过ModelScope平台获取不同版本模型文件
●🎨 应用场景:适用于文化遗产AI数字保护领域,可对古代壁画进行数字化修复与保护
9
0
0
Simon的白日梦
6天前
今日份觉知🥰
1
2
0
Simon的白日梦
9天前
阿里通义开源了一个又快又好的图像生成模型,1秒出图!6B尺寸!比它小的质量没它好,比它质量好的速度没它快;支持中英文输入,支持中英文字体叠加。而且我看了下出的图,AI味挺淡的,个人觉得比Flux 2好,估计仅nano banana pro一模之下了🥹
▶️在线试玩:
huggingface.co
➡️代码链接:
huggingface.co
▶️comfyui case:
comfyanonymous.github.io
{Z-Image-Turbo / Z-Image-Turbo(通义MAI在Hugging Face上的空间)}
🧐Z-Image-Turbo是通义MAI在Hugging Face平台上创建的图像处理空间,提供图像生成、编辑、增强等AI工具,支持通过网页界面或API进行图像处理任务。
✨重点
●🔧[🔧] 核心功能:图像生成、编辑、识别、增强等AI图像处理任务,适配Hugging Face生态系统。
●🚀[🚀] 使用流程:访问平台→注册登录→浏览功能→上传图像→配置参数→运行任务→下载结果,支持API调用与示例代码。
●📊[📊] 技术参数:输入格式含JPEG/PNG/BMP等,输出质量可配置,依赖TensorFlow/PyTorch等库,当前处于运行状态。
●🔄[🔄] 其他资源:提供社区支持、更新日志,支持多模态处理,需参考平台文档获取详细参数与依赖说明。
●🔗[🔗] 访问方式:通过Hugging Face链接直接使用,无需额外安装,支持本地部署或云端调用。
28
0
19
Simon的白日梦
9天前
我今天才开始看国外的播客,原来他们尺度那么大的么?马斯克在直播里边“质疑/指控”山姆·奥特曼谋杀OpenAI内部举报人 Suchir Balaji 😂
www.youtube.com
4
2
1
Simon的白日梦
11天前
打击内耗终极心法
不预演: 还没发生的问题,一律视为不存在。
不评判: 哪怕先“做个烂的”,也比“完美的构思”强一万倍。
不证明: 人生是用来采集数据的,不是用来考试的。
不动脑: 只用脊椎和肌肉记忆去行动,思考是阻力,动作才是燃料。
——行动一旦开始,焦虑立刻停止。
送给和我一样的高敏感人群🥹,from gemini 3 pro。
8
0
0
Simon的白日梦
12天前
受
@歸藏
的启发,我用Gemini 3+ nano banana做了唐长安模拟器!🥹已加入功能:
1. 在唐长安地图上任意地点生成“实景图”(可选时间和天气🌤️🌧️)
2.上传自己的照片生成唐长安“实景打卡图”🤳。
3.有一定概率偶遇著名历史人物🍶。
▶️试玩链接及代码(需要配置自己的google cloud API key):
ai.studio
欢迎大家贡献更多有趣的idea哈~!🌟
39
3
7
Simon的白日梦
13天前
"zh_title": "Eigen-Banana-Qwen-Image-Edit 图像编辑模型"
}
🧐 这是一个针对Qwen-Image-Edit模型优化的LoRA低秩适应检查点,通过40万文本-图像对训练实现快速高质量图像编辑,支持中英双语prompt,适用于风格迁移、物体修改等场景,以10分钟级推理速度和多语义编辑能力为核心亮点。
➡️链接:
huggingface.co
✨重点
●🔄 模型定位:基于Qwen-Image-Edit的LoRA微调模型,参数量轻量化(FP16格式),推理步骤减少但视觉质量不减
●📊 训练数据:Pico-Banana-400K数据集覆盖35种编辑操作,包含8大语义类别(如物体级修改、场景构图、风格迁移等)
●🌐 多语言支持:同时兼容英文和中文prompt(如"将图片转换为卡通风格")
●⚡ 核心特性:
快速推理:蒸馏知识优化,单张图像生成仅需少量步骤
语义编辑:支持物体替换(35%占比)、风格迁移(10%占比)等复杂操作
场景适配:可处理人像(18%)、文本符号(8%)等精细编辑需求
●📦 部署方式:通过Hugging Face Pipeline加载,支持从源码安装,无需复杂环境配置
●🔑 技术创新:
EigenTrain训练框架实现高效LoRA微调
语义分类覆盖多维度编辑(如空间布局、缩放视角等)
零代码推理:非技术用户通过prompt即可完成图像编辑
●📌 应用场景:
电商产品图快速换背景
社交媒体内容风格化改造
设计原型快速迭代验证
●📜 许可证:Apache 2.0开源协议,训练数据采用CC BY-NC-ND 4.0非商业授权
1
0
1