即刻App
年轻人的同好社区
下载
App内打开
笨笨_iqeA
518
关注
5
被关注
0
夸夸
笨笨_iqeA
5月前
Yibie: 周末出去耍完看到了一个牛逼的项目—— https://github.com/BloopAI/vibe-kanban 据称,它可以与 Claude Code、Gemini CLI 结合,将这些 AI Agent 当成员工,通过看板的方式,来为它们创建任务,全自动化处理多任务。 我还没使用,不知道效果如何,但我觉得这个方向非常有价值,这个工具也很有价值。 觉得未来几天可以探索一下。
0
0
0
笨笨_iqeA
5月前
不务正业小胡同学: claude code真的太好用了,最近嘎嘎用,cursor额度都要过期了🥹 命令行形式相当于有了整个pc的访问权限 整理了几个claude code的开源项目: 1️⃣ Claude-Code-Development-Kit AI自动写文档、拆分需求,搭配context7 mcp使用 🔗 https://github.com/peterkrueck/Claude-Code-Development-K Claude-Code-Development-Kit it 2️⃣ SuperClaude 多角色切换(架构师、测试、前端、后端等) 🔗 https://github.com/NomenAK/SuperClaude 3️⃣ 可视化 🔗 https://github.com/Maciek-roboblog/Claude-Code-Usage-Monitor 🔗 https://github.com/getAsterisk/claudia 🔗 https://github.com/davila7/claude-code-templates 另外,隔壁Gemini cli在开源的推动下合并了超多提PR,等我的claude code过期再试试,之前测试感觉很容易过载😅
0
0
0
笨笨_iqeA
6月前
大河.: 昨天被Claude code圈粉 一早晨用Gemini cli把Gemini cli的实现逻辑撸一遍,解锁奇高的撸源码方式 主要工具:deepWiki 与 Gemini cli交替,一个负责快速看可视版架构,一个直接互动问答 不说废话 有图有真相 图一:理解Gemini cli 核心逻辑 图二:做出好的AI coding效果关键调试代码 图三及以后:一个实例,如何从需求命令到调用函数到大模型处理再返回,给了一个完整链条 看完这几张基本对AI coding祛魅了
0
0
0
笨笨_iqeA
6月前
听完这100个词,应该会看懂英文演讲
您的浏览器不支持 audio 标签。
(1)巴菲特佛罗里达演讲100个单词拆解1
《学投资·背单词》
0
0
0
笨笨_iqeA
8月前
种椰子长Baliciaga: 复盘下近期用ai做中高端商业项目的经历吧⬇️ 😂首先,最近的两个项目都失败了,甲方都是大品牌,预算较多(以aigc报价标准来看)战线长且频繁确认。和甲方们的沟通方式都是完全做好一个步骤就审核一个步骤,这样相对不会浪费双方时间,但缺少深入探讨和解决问题的空间。 ✌️两个活都是被要求使用ai做多个场景的设计,并让场景和产品或人物完美结合🖼️ 1️⃣一个项目做产品宣传照,要求完全逼真写实摄影风格,祛除ai味的同时还对景观,构图,光线都有具体要求。 2️⃣另一个项目是服务于短片,风格和创意有一定发挥空间,但场景里的核心元素有非常具体的要求,客户希望有炸裂视觉效果的同时也能精准表现一些必要的元素(如:墙上有一幅画,画里有具体的某人,画在燃烧🔥如同《道林格雷的画像),另外,还要做出特定效果的视频片段🎬给后期团队合成。 真正的难点有两个,因为要匹配特定角度的人或产品,所以对构图和透视要求很苛刻;一些特定的景物必须用ai完美搞定,景物在现实生活中还不存在🥵至于画面风格和视频动态,虽然很重要,但因为之前做过很大强度的相关训练所以难度不大。 🎛️我使用的主力AI工具有mj,flux/sd(comfyui),recraft,gpt 4o,即梦和lib也有用到但参与度很低。 💢遇到的问题和挣扎过程: 我的思路是先用prompt和参考图搞定构图,之后用lora和各种风格种子搞定美术风格,再通过参数调整控制精度和风格耦合度,最后上comfyui和ps做合成和精修。几块工作分明,这样相对可控便于调整。 问题还是出在可控性上⚠️mj可以搞定视觉风格,但出图可控性极差;flux体系下比较好的风格都相对泛滥入不了甲方法眼且细节瑕疵也很多,因此只能去炼丹了----炼丹解决两个问题,精确 and 审美✌️ 由于基于flux/sd训练专属的lora时间来不及,所以转而“冒险”去用mj的profile和moodboard功能。这两个功能和flux/sd训练lora的底层逻辑是很像的,都是需要精挑细选训练集(参考图)但是mj为使用者省去了打标和调参数这两个很耗精力的步骤,另外我看到过老外用这个路径实现过很高水准的商业作品👍因此觉得值得一试~ 然后我花了海量的时间准备和搜集素材⏳并花同样多的时间去筛选素材和调试训练成果...这个过程异常艰辛,在大部分画面中,我需要控制的要素至少有4️⃣种:透视,光影色调,物体造型,质感和材质。而mj调试这些要素的参数又有好几个维度:模型版本,基础风格(profile),特定风格和参考程度(moodboard)等等等等🫨在连续工作好几个小时后,搞出几张自己还算满意的图……但最终还是放弃了这条路线❌因为一旦甲方提出一些修改要求,无论是深入到具体参数和训练集细节里做调整,还是整个流程重跑一遍,后果都是都是灾难性的...除非我能笃定一版就能征服甲方爸爸,但这是不可能的😂尤其是项目1️⃣处于作品发布能有更好效果而不是只做个“行活”,我决定适当冒险,用了一个不太常见的风格。 目前aigc就是这样,缺乏成熟可靠的工作方法,这个时候只能发挥主观能动性大胆尝试更多路径。于是我打开了传说中的gpt 4o,把几张mj做的风格ok细节欠佳的图喂给它,通过精确的指令让其修改和调整画面。gpt的可操控性确实强大👍可以说是言出法随,但硬伤在于审美过于单一,所有原图的风格都遭到了一定程度上的破坏。最终gpt还是搞定了两组场景,用时仅花费半小时。 ⏳留给我的时间不多了...recraft是最后的救命稻草,recraft最近出了新的功能,可以最多上传五个参考图,支持自由调整各个参考图的权重,不仅能控制光影色调和材质,还可以定制构图偏好,可谓“一键训练小模型”。另外recraft还有不输于大部分comfyui工作流的一键换背景功能,我可以先摆放好人物和产品,之后配合训练的“小模型”让recraft直接生成透视正确又兼具风格的场景。事实证明,这个尝试大体成功了,不过recraft自制“小模型”局限太大了太大了,我一口气弄了十多个style,有的侧重景物、有的侧重构图、有的侧重光影,用来满足特定和具体需求,前后耗时又是大几个小时.... 最终,我凭借mj加gpt和recraft,还有comfyui微调细节的方式及时交了第一轮作业....甲方给予了修改反馈,一家因为风格不匹配要大改,一家需要精度和细节再upup,于是都果断又遗憾的选择了终止合作🔥战斗过也燃尽了,感谢甲方,我们都对“美”有苛刻要求,但继续改下去对双方都会造成很大负担和困扰。 问题出在素材和模型储备不足,还有当前工作方法的客观缺陷。ai工作流若要产出媲美顶尖摄影或cg工业的作品,我认为还是有一定胜算,但要投入巨量的人力和时间成本。 一些思考🤔 视觉类aigc的精髓在训练,当然prompt也很重要,但视觉和语言之前的差距,像一座大山。想要作品足够美足够准确,就去认真针对具体场景和需求训练lora/profile/style等等等吧,prompt只是一个启动器,用来运用和调度诸多大小模型的能力。 目前aigc工具之间的割裂程度,好像一座大山。每遇到一个特定需求就要摸索一套特定的工作方法,去排布这些工具的使用顺序和比率,这个过程非常锻炼人,但长期看也很没意义😂aigc什么时候可以具备工业级的内容产出能力,这是个太大话题...但我觉得仅仅是未来一小段时间内,无论是企业还是个人,积极探索和积累ai工作流价值很巨大。 诸多ai工具里,midjourney暂时离商业落地最远,但v7发布后的一系列功能迭代,让我对它还是持有乐观态度,哪怕它还是解决不了可控和精度问题,也完全可以在创意/审美积累和风格探索上发挥巨大作用,作为创作最底层。 flux体系现在离商业应用最近,如果项目1️⃣给我更宽裕的时间,我会用flux来工作,不过有趣的是,用flux基本就要用lora,而很多牛比lora的训练集又是由Midjourney提供,所以我还是在用Midjourney➕flux😂 gpt潜力看上去很大,或许代表了未来的趋势,即模型即应用,相比下来comfyui可能只是过渡时期的产物。 最后的最后,我更加坚定的认为,用好ai,功夫不在ai上。考虑到我自己的工作偏好,计划接下来投入大部分时间在手绘和传统cg技术上,因为它们可以让我更加完善,而ai不能。
0
0
0
笨笨_iqeA
8月前
路辉: 成功售卖的 Prompt 模板「Gouache Paintings For Ladies」,可以定制发型、衣着等直接出图。
0
0
0
笨笨_iqeA
8月前
朱鹤: 我现在招的产品经理要求必须会用cursor和dify,必须会rag和fine tuning 。chatgpt发布两年了且在找工作了还没学过这些的,至少对创新的好奇心是不够的。
0
0
0
笨笨_iqeA
8月前
聆风Raymond: 豆包的超能创意1.0agent是真能看懂诗歌啊,这句诗直接把意境给整出来了🤣(图1) 而且还能通过一句话提示词,就将《木兰辞》全诗的画面给画出来🥹强到没边了…(图2) 图2看不清,可以进链接看:https://www.doubao.com/thread/wa5b4d7f9ba2dd713)
1
0
0
笨笨_iqeA
8月前
孙建伟: 豆包图像生成创意Agent 在图像生成上, 几句话就生成批量风格一致的几十条图像分镜,且质量极高。 之前的提示词和工作流,很多都会立刻失效了。 当前灰度中,自己还没法用。 介绍: https://bytedance.larkoffice.com/docx/OWpHdkNoYoBjHVxntQPcZa5Qndb
0
0
0
笨笨_iqeA
8月前
OrangeAI: 终于有公司在解决 MCP 配置难的问题了。 纳米AI出了个 MCP 万能工具箱,把100多个MCP 都配置好了,直接就能调用。 甚至把常用的18个的key都内置了,连去各个网站找key都省了... 不管高德地图还是MiniMax生图、生音、生视频,想要什么就直接调用 目前还是限制免费随便调用,也就说是纳米官方的key在支付账单,后续应该会收费,不然谁兜得住。
0
0
0