即刻App年轻人的同好社区
下载
App内打开
noteBeliever
52关注117被关注1夸夸
noteBeliever
10天前
Pixverse V3.5 NB
水墨动画都能搞起!
00:05
00
noteBeliever
13天前
我在小红书上用即梦 AI 创作的
关羽穿越,牛马打工人
单篇收藏点赞过万了
在这里分享一点心得

给出一个 prompt示例先:
```
(
(风格: 水墨风格, 融合现代街头元素, 写意笔触, 颜色对比强烈),
(光影色彩: 整体为冷色调, 主要色彩为黑色、红色和灰色, 城市灯光略带暖色),
(主体: (人物: 穿越到现代的关羽, (穿着: 灰绿色长袍, 红色腰带), (胡须: 黑色长须), (脚穿: 红色 Nike Jordan运动鞋), (动作: 手持一杯咖啡, 在城市街道上行走)), (文字: 位于画面上方, 写着“咖啡苦,心里堵,忍着去挣两千五”)),
(背景: (环境: 现代城市街道), (背景细节: 高楼大厦, 汽车, 霓虹灯, 人行道)),
(视角: 稍微侧面的视角, 动态展示人物行走状态),
(构图: (主体: 人物位于画面中央偏左, 占据主要部分), (文字: 位于画面上方, 突出主题), (空间关系: 人物与城市背景形成对比)),
(画质: 高质量, 清晰, 笔触流畅, 水墨晕染效果)
)
```

我的体会是:
- prompt 先做模块区分, 比如:风格, 主体, 背景, 构图... 这些模块基本就能决定画面的最终输出, 模块化的好处是让自己的创作更有条理性,让输出更可控
- 用(A:B)的表达形式来细化. A 是主体, B A 的属性, 也就是定语. 把它们放置在小括号里面, 我实验下来有助于模型对你语义的理解, 并且 B 作为定语可以不断扩展下去, 可以是平行同级的描述, 也可以嵌套子级对象. (A:B)就是一个结构化的数据描述
- 做到了以上两点, 并不能保证出图立即出彩, 但是可以做到对画面的可控和迭代修改.
- 这是模块化和结构化 prompt 带来的好处: 让自己更清晰, 让修改更便捷.

最后, 模型决定了一切.
prompt 只决定了你调整的效率, 带来更多可控性.
完全一样的 prompt, 不能保证完全一样的效果,
我甚至迷信地认为: 和时段有很大关系, 不拥挤的时候出图质量高很多.
我用的是即梦,
我推荐它(根本没有广告费好吧)
- 每天有免费点数, 新手就能玩
- 出图的艺术感在线
- 最新的 2.1 模型, 图文并出, 太方便了
42
noteBeliever
20天前
牛马打工人
用即梦做的,实在是太简单了
参考 pmp

(风格: 中国传统水墨画风格, 写意, 留白)
(标题: "事情多多 ,还要背锅")
(主体: 关羽, (服饰: 长袍, 现代Air Jordan运动鞋, 头上顶着一个冒着黑气的锅), (表情: 苦恼, 眉头紧锁) 在(办公室:现代, 一片狼藉, 文件散落, 电脑屏幕显示错误代码))
(视角: 正面视角)
(场景: 办公桌上堆满了文件, 关羽周围环绕着一些飞舞的破碎报表)
(构图: (主体: 居中,被文件和锅包围), 强调关羽“事情多多,还要背锅”的困境, 幽默夸张的表达压力山大)
(光线: (自然光: 昏暗), 突出一种压抑感)
(画质: 超高细节, 8K, 水墨晕染, 加强墨色晕染的对比效果,突出人物的无力感)))

其实 pmp 也不是手写的,用 gemini 生成
35
noteBeliever
22天前
human in loop 是应用 AI 的第一原则
人与 AI 在闭环中互动,互相增强
不要让 AI 把你变傻
而是更加专注
比如下面的阅读场景:
- 我们读摘要,是因为它简短容易集中注意力
- AI 高亮关键词,让注意力航线有了航标
- 将注意力集中在词与词之间的逻辑关系,
去预测,然后对比 AI 的连线
让注意力有了判断结果

这样的阅读才是 AI 辅助的价值
00
noteBeliever
27天前
分享一个老老实实读书的工作流

特点:
边读边写, 语音复述,
理解(文字)-记忆(图形)-输出(语音),
保存deeplink,逐级回跳原文原草稿

相关应用:
- liquidText (ipad 应用)
- apple notes (ios 18 有了直接录音功能)
- 捷径(方便自定义一些快捷操作)

liquidText 阅读书籍
- 阅读, 注意力集中在哪里, 就将它摘录在白板中
- 在白板中进行空间逻辑整理
- 手写手绘, 将心得附加上去

读完整本书之后口述回顾
- 将书籍内容压缩整理成一屏
- apple notes 设置成侧拉
- 截图, 连同回跳链接保存到 apple notes
- notes 中录音, 对着截图进行回顾讲解
- 使用自建捷径将录音转写成文字, 直接保存在录音下

后续存档
- 保存在 apple notes 方便同步, 查找也方便
- 可以将 apple notes 直接导出到文件, 截图录音都会单独存储
- 或者使用自建捷径将截图录音转存到静态资源服务器,然后存文本到obsidian,roam之类

AI 辅助来读书, 速度快了, 乐趣少了.
边读边摘录, 边摘录边梳理脉络, 边梳理边手写绘图, 边绘图边喃喃自语
其中的收获真不是 AI 简单总结或是问答可比
12
noteBeliever
1月前
AI读新闻,AI写评论,AI做评论海报
你只要去分享就行了

刚刚用半小时做了一个coze工作流,极简原型

根据输入的新闻内容,生成标题,评论,一个字点睛以及作图prompt
得益于字节最新的中文字生成技术
可以直接进行图文混排生成

尝试下来效果可控
可以发发小红书,小绿书可以了

新闻是:12月8日下午,知名艺术家蔡国强《红帆》艺术白天无人机烟花表演途中,大量无人机掉落地上或坠入海中。 目击者称,没有造成人员受伤。目前事故原因暂不明,网友直呼太遗憾。蔡国强表示,请大家帮忙收拾一下,无人机不要带回家。 据泉州发布,12月8日下午4时35分开始,当代著名艺术家蔡国强《红帆》艺术白天无人机烟花表演活动在泉州台商投资区秀涂村举行。以“泉州历史”“传统文化”“女性”三个关键词为主题。 贾樟柯、赵丽颖、林更新、欧阳娜娜、窦靖童等人来到现场观看表演。
00
noteBeliever
1月前
我探索出用显性的CoT方式来写prompt,意图清晰,结果可控,并且在各种模型中都能适用。
核心是用SVO模型,主体S--动作V-->客体O来链式表达逻辑步骤。

举个例子,下面是用来解读禅宗公案的pmp,帮助学习禅宗思想,不需要claude,国产模型的豆包,kimi,通义,deepseek中都表现非常出色。

用这个prompt写一个现代版碧岩录不在话下。

以下面思维链路(Chain of Thinking)来解读一则禅宗公案:
公案文字 --理解--> 意象情景 --选择观察视角--> 重构定格 --(recall, 默念: 不住文字, 双遣双非, 昭昭灵灵, 作用是性...)--> 解读* --退一步反思--> 上述解读是否违背禅宗本意 ...yes--> 退回到解读* ...no--> 补全语境上下文意图 --答在问处-->一首诗颂来评唱公案
公案如下:
```
雪峰示众云:“南山有一条鳖(biē)鼻蛇,汝等诸人,切须好看。”长庆云:“今日堂中,大有人丧身失命。”僧举似玄沙,玄沙云:“须是棱兄始得。虽然如此,我即不恁么。”僧云:“和尚作么生?”玄沙云:“用南山作什么?”云门以拄杖撺(cuān,匆忙地)向雪峰面前,作怕势
```
00
noteBeliever
1月前
即梦2.1灰度到了
支持中文文字生成
做图文海报超级合适
是否能平替canva?
实际测试下来,文字输出还不稳
经常有西夏文出现
但风格可控,潜力巨大

参考pmp:
为下面的金句配图,并作图文排版,做成一个海报:
图片的风格为:moonlab_studio风格, 粗线条描边, 极简, 用简单的笔触涂鸦
图片上的文字为:
"一个人行走的范围,就是他的世界。——北岛"
00
noteBeliever
2月前
这个工作流好详尽,同时感叹一下,做视频真是个体力活😤

吕立青_JimmyLv.eth: 🎬 分享一下我的视频制作流程,有些工具黑五在打折,记得用我的引荐链接,大家可以考虑一下 👇 三赢,哈哈哈 1. 录制工具 Screen Studio https://screen.studio/@rqAJg 目前我是在 Screen Studio 里面直接录制的,因为它一方面很容易去增加一些鼠标点击效果、放大的动态效果。虽然说后期我可以在剪辑软件(剪映)里面去手动添加关键帧,但确实太过于繁琐了。 另外一方面,它的文件同步机制我还挺喜欢的,我会在 MacBook 上 录制,然后自动同步到 Mac Studio 上进行剪辑和导出(License 仅支持一台电脑导出,但录制是免费的) 1.1 首先把录制的过程讲完 我只需要按下快捷键⌘+⇧+4,就可以选择整个屏幕录制或者某个区域的录制。 与此同时,它可以连接外部的摄像头和麦克风,所以我会用 iPhone 手机后置摄像头作为人像的摄像头。但更重要的是它可以直接录制系统内的声音,这对于产品演示来说非常有用。 1.2 录制后的微调 由于 Screen Studio 的放大缩小是根据鼠标点击操作自动缩放的,所以我会直接把连续操作的片段调整一下。 否则会出现一个问题,就是鼠标动来动去,放大效果也是左换右换,非常影响观众的观感。 当这个细节被处理完后,我会直接保存 Screen Studio 的 .screenstudio project,这个 project 可以通过 iCloud 同步到我的 Mac Studio 上,随后我可以在 Mac Studio 上导出一份。因为导出速度比较慢,所以需要 Mac Studio 这样性能更强大的机器进行导出。 导出之后,我会直接导出到一个 #299 类似命名的文件夹,代表着我做过的第几个视频。 2. 剪辑工具 Recut https://getrecut.com/JimmyLv Recut 是一款自动化去除空白无声片段的工具,虽然剪映也有类似功能,但 Recut 胜在可以调整阈值参数。 配置可以在自动化识别的基础上稍微调整一下,它首先会有个自动识别功能,能够识别出基本上没有声音的地方,但是还有一些细节,比如口水声或者键盘鼠标的点击声。我会调整一下阈值,让它把这些声音去掉或保留。 这涉及到我用到的麦克风,声刻的枪式麦克风(这个品牌被收购了,不推荐),推荐枪式麦克风是因为能杜绝很多噪声。特别小的环境声它就不会录进去,对于唯一被录进去的鼠标点击声或者键盘声,我可以通过 Recut 的阈值控制彻底去除。 但有时候要选择刻意保留打字的声音,这样的视频节奏会更好,所以我录制时会用另一个茶轴的机械键盘,敲出来的声音波形刚好是人声的一半,剪辑时根据波形来判断,从而节省查找的时间。 2.1 导出粗剪工程到剪映 Recut 特别好的地方是它可以导出成一个 XML 文件。Recut 这个文件既保留了原始文件,也保留了剪辑后的时间线。比如原始文件有 30 多分钟,剪完后有 13 分钟,它依然会保留原始文件和剪辑后的 13 分钟的时间线。 一般来说不需要做额外处理,但如果有一些空白无声片段需要恢复,我可以从这个复合片段里面再恢复出来,但这种情况非常少。 3. 剪映 CapCut 主力剪辑 而我在剪映里面会做两件事情:首先,是把所有的碎片片段合并成一个复合片段,这个复合片段基本上没有什么空白无声的。然后我会把整个复合片段变速至 1.1 倍,加速我说话的速度。 3.1 智能剪口播 非常关键的一点是,我会点击剪映的智能剪口播功能,它会把整个视频的语音转文字稿显示出来,并且有三个非常关键的识别: 1. 识别前面所说的空白无声片段,因为有时候 Recut 会有一些细微的停顿,它没有被识别出来。那么一边看文字一边再去识别这个空隙,更容易判断这个间隙需不需要剪掉。剪映可以通过文本的语义判断来确定这个间隙是否需要被剪掉。 2. 除了空白片段被彻底精简后,剪映还会识别一些语气词,通常来说是口癖,比如“嗯、啊、哦、然后、”等。这个类似摄影的前期和后期,在前期录制的时候就应该减少这种语气词,就像演讲表达一样,过多的“然后”、“you know”只是暴露了你的思维不够连贯。 在长期录制锻炼之下,我已经尽可能减少了这些词,一方面就是为了减轻后期的工作量,另一方面也确实让我多思考,想清楚了再表达。 3. 第三点是重复片段,比如我在录制时,如果说错了一句话,我会立马重复说一遍,剪映能识别出这样的重复。剪映一般会自动把前面一段删掉,因为一般来说后面一段是好的,整个效果会达到一个非常连贯的表达。 完成文本层面的剪辑后,剩下的是我个人的美颜处理,美颜稍调一下参数即可(毕竟长得帅,啊不是!)。然后可能还需要把片段放到前后,调整整体的叙事结构,或加入一些需要补录的视频片段,或者纯粹加一些静态图片。那么一个完整的视频基本上就完成了。 4. 字幕校对与文稿改写 BibiGPT https://bibigpt.co/shop 4.1 自动识别字幕 剪映自带字幕识别但精确度很差,而且没有个人词库,我已经积累了非常多我自己的常见识别错误。我会先通过剪映导出一个 MP3 文件,然后经由 BibiGPT 进行自动化字幕转录,使用更好的语音识别模型,加上我自己的优化与微调,效果秒杀剪映。 4.2 二轮字幕修正 处理导出 .srt 文件或 .md 文件后,我会使用一个 Bash 脚本进行关键字替换,包括一些常见的 Whisper 识别错误,比如我的名字或者 BibiGPT 这样的关键词。这些关键词被替换后,我会持续改进这个关键词列表,但总有漏网之鱼,所以我会借助大语言模型重新修正这些错误。 通过 Cursor 直接打开 .md 文件,其实我在 Bash 脚本里面会先进行 SED 的关键词替换,替换后用 Cursor 打开文件夹里的已修改文件,进行二次修正,LLM 会根据上下文 判断和修正一些表达。 4.3 字幕打轴与校对 在这一轮处理后,我会直接复制文本到剪映的智能识别字幕中,因为它有文稿匹配功能,我可以把修正好的文案直接与音频对齐,这叫打轴,之后BibiGPT 会直接支持这个功能并输出 .srt 文件。 打轴后,每个视频片段和语音文本都已经对应上了,剩下的工作就是添加转场、效果、章节等。当然重听一遍,把错误的字幕或不必要的内容移除掉,可以使用 j/k 快捷键进行倍数播放,快速预览整体的效果。 5. 视频导出与分发 至此,最终视频的完整版基本完成了。更重要的是要尽早导出,如果是商单尽早跟客户确认视频是否符合预期,是否有错误需要修正。 不过还是要以终为始吧。提前确认好大纲和脚本,不然大的修改会使所有流程重新走一遍,工作量成指数级上升。所以做好前期工作,后面的工作就可以通过自动化或 AI 来改善。 5.1 视频封面制作 Canva 一个好的封面和标题其实决定了流量的70%以上,如果追求流量的话,再怎么强调也不为过。就像咪蒙给文章起标题,会通过 A/B test 的方式在群里让大家投票,理性和感性的判断都不准确。 图省事儿,我是在 Canva 可画里面使用了一个模板,很简单,但也没办法没时间去折腾封面啦,这方面我做得不够好,如果要改进的话,后期可能会专门拍一张人脸,这会让标识度大大增加。 5.2 分发至视频平台 在剪映里面有一个好处是,导出后可以选择自动上传到抖音和西瓜两个平台,我的内容其实在这里一般也没什么流量,不过也就顺手的事情,就当存档了,剪映在发布时还会自动帮你添加标签,还是有点儿意思的。 另外,分发到YouTube、B站、小红书和其他社交媒体时,其实是需要拟定不同的标题和描述的,也就是要内容“亲平台”,不同平台有不同的调性,迎合也罢,AI 会比较擅长这件事情。 5.3 视频改写文案或文章 前文提到我会使用BibiGPT来处理mp3音频文件字幕,与此同时,它还会根据视频字幕进行总结和提取章节,从而这部分可以用来帮我生成视频的标题和描述区,甚至评论区。通过自定义总结的方式,使用不同的 prompt 就可以达成目的,之后我会把整个工作流做得更顺畅一点。 欢迎大家试用 BibiGPT 加速你的视频学习与创作工作流,近期也在黑色星期五,5折优惠码 BLACKFRIDAY 🔗 https://bibigpt.co/shop

00