即刻App年轻人的同好社区
下载
App内打开
SiliconLuo
1k关注3k被关注24夸夸
正在成为新时代的人,尝试构建某种新科学🧪
置顶
SiliconLuo
3月前
正在努力做新时代的人

旧版本自我介绍:m.okjike.com

新版本自我介绍:待定
00
SiliconLuo
04:56
这个是我们最近做的一个尝试,目标导向「影视飓风」这样的长视频结构,是否可以能端到端的全部用AI来完成

这是一个很好的demo,其实还有很多地方要改进;昨天白天发出来后,看到视频已经自己有了接近30个转发,于是朋友圈再来宣传一下

我们实现了,并且发现了:一套非常有结构美感的「言之有物」的长视频「内容工程管线」,这其中我们至少解决几个这样的问题:

1)分镜是最小单位:如何保证每个分镜可以有单独的上下文去生成,让分镜从整个长内容下,解构/解耦合出来,一个分镜一个分镜生成,模型才可以发挥其全部威力;即使视频模型进化的越来越厉害,长视频依然需要以分镜为最小单位去构建(如同人类社会那样)

2)分镜的连续性如何保证:如果只是单纯的从脚本到具体每个分镜,分镜很容易不连续,即每个分镜看单独看很有逻辑,但是连到一起后,则会显得逻辑并不连贯;这里我们有了一个新的概念,叫做「边界上下文约束」,所有分镜共享同一套基础上下文,同时每个分镜也有自己独立的特定上下文,从而保证了连续性(这里还有很多上下文工程的细节)

3)分镜的画面质感如何保持一致性,同时保证工程化上的确定性;这里我们又引入了「分镜模板」的概念;这个概念是我们此前从AI图文矩阵的工作流中获得概念推广得来的,因为要保证内容效果,内容形式其实是最难迭代的,但是人类看长视频本质看的还是形式背后的信息量和信息节奏;因此我们跑同了一系列稳定的模板,后续所有的核心都是文字/JSON本身的生产,这样整个工作就很好控制了,画面的质感也可以把控审美

后续我们会考虑把整套长视频的上下文工程原理开源出来(这还需要很多时间去梳理),相比于这个工作流本身,更另我们感到激动的是,背后的上下文工程的一些很有趣的范式,我们希望系统的提出对应的概念。(且这些概念不单纯可以用到内容上)

在这之前,其实还有很多细节要去做优化的。这个视频的质感和效果其实离「影视飓风」还有很大的一些距离,但是做了这一轮之后,我们也很清晰的知道改进点在哪里,这个感觉就很快乐(比如引入人像A轨的分镜模板,比如做脚本本身做工作流改良)

这篇内容我们自己打分在70分,单纯从内容上来说还有很多需要去优化的;但是从工程化的视角来说,我们找到了无限优化迭代到100分的轨道和框架

为什么我们要做这样的尝试:
1)希望探索AI的内容能力边界,我今年希望可以做一个内容品牌,来探索生产力的边界和背后的上下文工程范式

2)我们从23年就开始做AI图文矩阵,这个过程中遇到了很多的质疑,核心质疑点在内容质量和背后的可持续性,很多人以前对AI矩阵内容的理解是垃圾内容堆量;但是我们有不一样的理解,我们相信工业化的优质内容生产管线才是矩阵的未来,这个是我们的一个实验和探索

👆Build In Public,差不多是这些,感谢大家观看

最后还要credit to我们的博涵老师~ 这个工作Idea锚定点 最初来自我,工程架构化+关键范式 来自我和他的共创,实际的0-1落地和操作全部来自博涵好!

如果有长视频批量生产需求的欢迎联系交流
03:46
24
SiliconLuo
17天前
大模型时代的品牌逻辑:

用claude code的时候,配GLM模型,虽然量大便宜,但是我总是没有安全感,认为cc的一些功能是不是会因为模型不适配而漏掉

今天开始测试不同的skill,发现没有触发;加上今天朋友圈有人炫耀了触发了cc的新功能

这种不信任感更加加强了,因为大模型太复杂,哪怕有榜单,在具体场景的产品任务上,你也不知道是不是可以信任的,没有人可以告诉你,除非你完成体验过,但是你不希望错过

很理解为什么模型厂商要下场做工具了,这很像供应链要做自有品牌的逻辑,最后对复杂技术的信任全部沉淀到了品牌上?
21
SiliconLuo
17天前
一个团队构建问题:

减去Agent的能力,人类还剩下什么

思考清楚了这个问题,可能会对于AI Native的团队形态,有更清楚的答案

还在思考中,有一些猜想

1)社会的「人类贵族」上下文,AI完全掌控生产力后也会被替代
2)长时间线注意力(未来会被Agent吞掉)
3)新概念的涌现 & 可塑学习(晚上人脑做梦修剪突触,online finetune - 未来也会被Agent吞掉)
4)基于社会网络中的声誉/货币的强化学习属性(未来RL范式兴起后,Agent也会吞掉)
5)某种自我反思审查(其实Agent的自我Review也可以实现,但是目前还没有看到很好的框架,能像人类那样可以每做一步都审查下自己,在做类似于方案设计的时候,人类通过审查从而写出精辟的文字,LLM会写一堆废话)

当下人类还是剩余很多优势的,但是有点害怕的是,随着时间推移感觉这些优势最后Agent也可以掌握
00
SiliconLuo
25天前
2025年积累,2026年顿悟

新Meta能力:快速识别一段关系里对方是如何对待我的

关系本身的均衡度决定了关系里长出来的东西是否健康
00
SiliconLuo
29天前
2026年的目标:

让价值和货币对向流动起来,真正的学会构建基于价值/货币的协作系统,面向价值而不是面向供给

构建更好的社会契约
00
SiliconLuo
29天前
昨天和Jarvis老师聊天,终于搞懂了如何从估值视角看懂Palantir这样定制层咨询+抽象层产品的业务模型本质

我以前最大的困惑是,FDE+中台产品的模型,和传统外包定制业务,或者高级点类似于四大咨询这种合伙人/人力智力资本密集的业务,区别在哪里

初步从局部来看,中台产品更多是降低了重复开发的成本,以及提供了一种稳定锚定结果的复购机制,这个变化看起来更多是加法

但是之前就又听过这样一个描述:FDE带来咨询的高毛利,而中台SaaS产品带来高PE倍数,两者给估值带来的一个乘法效应

到底如何结合理解这2种视角?

Jarvis老师点出来说:本质是通过中台产品,提高了对FDE这类咨询师的议价权,同时更是一个收束器,可以把FDE的贡献最后都沉淀到一个水盆里并且持续捕获/复用在前端业务的价值

这样来看的确就完全不一样了
13
SiliconLuo
29天前
AI时代机会很像消费品(头)+互联网(尾)的组合

为什么像消费品:
1. 边际成为无法降低为0,存在毛利结构
2. 没有网络效应/双边效应,品牌资产是核心
3. 同一场景下会有很多产品,核心是为什么用户要用你

互联网的遗留特征
1. 内容营销,产品使用过程中会不断产生新的业务场景下的内容,内容又可以被投放到前端
2. 供给是弹性很高的,不会有库存压力
3. 少数业务场景下依然存在网络效应(协作等)
20
SiliconLuo
1月前
突然意识到,x上的氛围,其实和生财有术的知识星球的氛围有那么一些像。。。👽
40