即刻App年轻人的同好社区
下载
App内打开
杨兄
666关注622被关注9夸夸
工程帅
在做电子烟
Attention is All I Got
杨兄
22天前

然后好奇屋: 万字分享我的《Devices》AI视频全流程复盘,免费开源我的ComfyUI工作流 包括创作灵感、工作流解析、AI可控与不可控的经验思考。 全文:https://f7rdq2pzot.feishu.cn/docx/HjZXduuNgolptzxiAhDcgeJdnYg 我一直在思考“AI原生内容”是怎样的? 如何平衡可控性与不可控性? 如何做出AI“原生”视频? 如何结合传统视频工作流与AI工作流? 🎶创作灵感:发挥AI优势,做AI原生内容 制作这个世界原本就存在的动画/视频,观众会不自觉的将它与原有事物进行比较。 将AI无限生成的特性发挥到极致,不要让AI做稳定可控的多帧连续渲染,让它多变风格,发挥想象力和算力优势。 在看到OpenInterpreter的宣传开场,有被炫目的色彩震惊,也是我的灵感来源之一。 变化的是风格,不变的是视觉焦点的主体。 🎊工作流详解:转绘是AI可控的最佳实践 Blender动画制作 + ComfyUI转绘 + 蒙太奇剪辑 就是工作流核心。 1. 利用Blender动画的可控性,输出深度图和线框图,为转绘提供可控要素。 2. ComfyUI使用模型控制风格、提示词控制语义 3. 基于文字的蒙太奇剪辑配合音乐传递流动色彩 🪄利用AI的可控与不可控 1. 动画思路:关掉AnimateDiff平滑吧! 放弃动画平滑控制,AnimateDiff适合比较高帧率的平滑动画,可控反而阻碍了AI的发挥;保持线条不变控制,最核心的控制模块在于深度图和线框图的利用。线框图我会调到0.8+,深度图视情况<=0.35。 2. 动画思路:试试Prompt Travel? 变化的是色彩 - 设置时间戳,每个时间戳的提示词不一样。 - 时间戳变幻之间会有线性插值,实现自然平滑的过渡。 不变的是规律与节奏 它其实没有那么多种的风格,是在固定的频率、固定的顺序和有限的风格中循环切换。 - 在单个设备的两秒中,我保持了每隔3帧的变化色彩节奏。 - 不同的设备,色彩变幻规律是一样的,按照相同提示词描绘的色彩变化的。 3. 单帧思路:怎么又潮又好看? - 线条不能多不能少:使用了Flat2D的base model和anime_minimalist 的lora尝试了大量的风格和提示词的测试。经常会出现错乱情况,详情见原文 - 引入人物的严重错乱:尽可能使用与人不太相关的物体。然后在负向提示词中拼命加手、人、头等词语 - 背景出现主体无关的设备:加高深度图ControlNet的权重 - IpAdapter控制线条风格:weight适当0.4,noise0.4放行给prompt控制 🪴把工作流串联起来 要是纯粹AI生图去做,肯定做不出来,你怎么保证它可以按照你想要的方向去旋转? 还有如果只是用传统的方式,做这个短片肯定非常耗时,因为很多背景只是{placeholder_for_colors},不需要精细处理。 只是用AI+Blender做一个类似迪士尼的动画,效果也一定没有原来工业界的动画好看,仅仅是AnimateDiff的闪烁就会让人昏眩摸不着头脑。 AI的不可控,就让它发挥不可控的价值,以前的工作流也一定不要丢掉。 而两者结合做出来的,可能才是AI原生视频。 创作不易!终于肝完了!望转发收藏点赞! 视频链接:https://m.okjike.com/originalPosts/6605652da922aa28d0300178?s=ewoidSI6ICI2NDk0MzEwNDA1MDU0NDcyNjRkNmI3MDEiCn0= 飞书链接:https://f7rdq2pzot.feishu.cn/docx/HjZXduuNgolptzxiAhDcgeJdnYg 工作流:https://openart.ai/workflows/pXkm6GZX8G19I22Odeo4 公众号链接:https://mp.weixin.qq.com/s/tkcvmtybmj2xHkIaeIQypw

00
杨兄
27天前
Coze BOT 的使用体验和 ChatGPT 没法比

有没有人觉得:

Coze 构建的 GPT-4-based bot,多模态能力显著差于 ChatGPT 网页端以及 Claude Sonnet。

表现在
- 无法准确理解图像信息
- 无法正确获取图像中的文字内容
- 绘图水平远不如 ChatGPT

Coze BOT 总感觉像个散装低配的 ChatGPT

另外,鉴于 Claude 3 这么好用,我已经把 GPT plus 停掉了,每月怒省 100 多。
00
杨兄
28天前
分享一个自建自用的 GPTs,帮你读英文内容,同时学学新单词

1⃣场景:
- 想要阅读英文资讯、短文来提升阅读能力
- 和老外聊天看不懂缩写、俚语
- 看不懂外网社交平台的抽象互动(X / Reddit / FB)
- 看不懂英文梗图(Bro thinks he's......)

2⃣用法:
直接把大段文字,或者截图丢给它

3⃣效果:
- 英文解释
- 中文解释
- 生词表

chat.openai.com
10
杨兄
1月前
今天,我选择了独自去上网。

掏出居民身份证,我故作随意地递给前台网管。

“黄金会员九段!”,刷卡的一瞬间,电脑屏幕金光乍现,我的会员信息赫然显现。

S 市每一家网咖都分会员阶级,依次为白银、黄金、铂金、以及普通人难以接触到的钻石层次。看见会员等级的瞬间,网管的脸色有了些许变化:“还剩 20 元”,双手捧起,递还身份证。

“好的,谢谢。”冷静接下身份证,我知道,在我这个年纪,黄金会员足以用凤毛麟角来形容,更何况是半步铂金的九段。

没有一刻迟疑,我要迅速赶往战场。目标是找个安静、通风的包间。网吧布局是环形的,我不紧不慢,绕场3圈,包间全满。直到我第四次从网管眼前经过,她沉不住气了,率先发问:“先森在找位置吗?”

我轻咳一声:“到网吧,自然是需要位置了,每个人终其一生,不就是找寻自己立足于社会的位置吗?说回上网的位置,我有三不坐,这第一☝️,不靠窗的我不坐;第二✌,不是包间我不坐;至于这第三🤟嘛……”

网管面露难色,随即带我找到大厅里一个靠窗的位置,看来并不把我黄金会员九段放在眼里。

我推开窗户,果然通风,窗外微风阵阵拂面,随之而来还有楼下小吃街沁人心脾的油烟,我淡然一笑,赶紧把窗锁死。

摩拳擦掌,我戳开电脑,点击启动著名MOBA游戏传奇同盟。

“League of Legends”

游戏图案浮现,我长舒一口气,美好的下午开始了。
92
杨兄
2月前
今天,去女朋友家做顿饭,问她有哪些调料,答:“都有,我前两天还用了。”

走到厨房看,我释怀一笑:确实都有,确实也过期一年多了。好一番沧海桑田的景象:辣椒油成了辣椒面,生抽成了老抽,老抽成了蚝油,蚝油被城建局依法收缴用于修建柏油马路。

吓人!我决定全给她丢了,买新的。我手托着下巴,灵光一闪,打开贫夺夺,熟练的跳过摇一摇广告,关闭 5 个现金红包弹窗和 7 个幸运转盘抽奖,丝滑下单买了一套 12 瓶小瓶装调味品,都是味极鲜、太太乐之类的大品牌,每个又恰好不超过 100 ml。

这样正好的份量,不用担心在用完之前过期,不用面对成人世界一道复杂繁琐的问题:这玩意过期了吗?这样就不用——在放入每一款调料前,费劲从瓶瓶罐罐的多面体上,寻找可能出现在瓶口、瓶身、瓶底那一排代表生产时间的数字,再运用复杂的数学计算,加上保质期(通常是 x 个月的形式),再和今天的日期作比较。

多么伟大的发明!我按耐不住心中激动,在内心尖叫着,呼喊着:碎片化,原子化!深挖用户真实需求!

我紧紧握住女朋友的手:“这段时间,都用这些调料做的菜吗?”

她点点头,频频微笑:“不知道,反正都是你上次买的。”

下楼把那些古老的调味品们丢入“其他垃圾”,我不禁眺向远方,肩上的担子越发沉重了。
110
杨兄
2月前
2 29 四年一次,世界杯也是四年一次,为什么不在今天举办世界杯?
70
杨兄
2月前
周处除三害

+ 整体很精彩,不只是礼堂片段
+ 陈桂林和陈灰怎么拍得这么暧昧
+ 一堆面部大特写,阮经天确实帅
+ 打戏过瘾
- 感情线相当生硬
- 女主意料之中工具人
- 周处原来不是周处长
30
杨兄
2月前
快,加我一哈
20
杨兄
2月前
字体混淆

今天浏览「全国组织机构统一社会信用代码数据服务中心」(ss.cods.org.cn)时,发现复制的企业名变成了乱码,拷问 GPT 后找到了原因——采用了字体混淆的方法来避免爬虫和复制。

一句话解释:文字是乱码,但是通过自定义的字体映射成了正常的文字,相当于写了一本与暗号一一对应的解码书。

具体方法:
1. 自定义字体创建:设计一个包含替换字形的自定义字体(例:"sfont")。
2. 字体映射:在自定义字体中,原始字符映射到不同的符号,使得文本在视觉上被“混淆”。
CSS调用:利用CSS .secretfont { font-family: "sfont",'Noto Sans SC'!important; font-size: 20px; } 应用这种字体,造成文本在屏幕上与复制时的差异。
3. 表现与复制差异:屏幕显示为正常文本(如“华为技术有限公司”),但复制粘贴时则变为混淆后的字符(如“㖄㐠㢯㧚㧎限㓯㗌”)。

注意:此技术虽能防抓取,可能影响SEO及网站可访问性。
41