人工智能讨论组

人工智能or人工“智障”，一起聊聊人工智能新进展？

468791人已经加入

陈财猫
5天前
开源一个之前赚了不少钱的提示词，用来写短视频口播文案，可以做到“一稿过”的效果。

专业人士评估水平能赶得上一个月2w块的编导，建议使用gemini或Claude。

需要替换里面的占位符，下面是提示词:

# “短视频口播文案”说明书:

在抖音平台上，有一类常见的短视频形式。这种视频主要特点是一个人对着镜头说话，同时搭配一些精心设计的文字内容。这些文字通常会与视频中的口述内容相呼应。
这类独白台词的文字稿被称为“短视频口播文案”。
短视频口播文案常常围绕着一个主题展开，信息密度高，节奏快。它需要通过各种方法来激发和利用观众的情感反应，吸引观众看下去，点赞，或者转发。

## 短视频口播文案的写法
短视频口播文案常常是“开头尽力留存，而后提供价值”的的脚本。它重开头，在剩的主体部分提供陈述与内容。

### 标题
一句话，概括了视频的内容与解决的问题，带有tag，会与视频一起上传短视频平台。不要暴露营销目的
例子：
分享北大学霸高效学数学的技巧。#家长 #涨知识 #学习
为什么聪明的孩子有时成绩不好？原因在这里 #孩子成长问题 #科学教育 #家庭教育误区
### 开头
开头负责留住观众，防止快速划走，提高前三秒完播率，这是**最重要的**部分。开头直接，快速。如果无法在第一句话就留住用户，这条视频不会有被展示的机会。开头通常需要直接表述视频的核心主题。
开头常常会灵活组合这些策略
1. 认知偏差激发:言论出格，打破常规.使用争议点与逆向思维来颠覆受众的传统认知，提供非常出格的反常识视角。通过表达极端、偏激或片面的观点来吸引注意力、引发讨论
2. 情境引导代入:根据用户痛点与用户面临设计直击痛点的具体场景，或设计让用户有代入感的疑问。
3. 诱导式开场:通过在视频开头承诺快速、简单地解决问题或获得利益来吸引观众注意力。强调快速或轻易获得结果。
4. 反向说服，逆反心理诱导与损失前置:利用用户的逆反心理或损失厌恶。
5. 窥探欲激发:通过制造神秘感、暗示内幕信息或承诺揭秘来激发观众好奇心和窥探欲望
例子：
- 有钱人的世界比你们想象的要傻得多(认知偏差激发)
- 如果连央国企在哪儿招聘你都不知道，又怎么能进央国企呢？(情境式设问引导代入)
- 孩子做作业总是拖拖拉拉的，打骂和奖励都无效吗？这可能是因为两个主要原因。(情境式设问引导代入)
- 说一个语文学习里最大的谎言，写好作文一定要多读书，真的是这样吗？(认知偏差激发+情境式设问引导代入)
- 百分之九十的孩子假期数学都是在糊弄。接下来跟着我的这个寒假数学预习的四步法走，开学数学立刻就能惊艳数学老师。具体怎么做数学的预习呢？(窥探欲激发+诱导式开场)
- 哪有这样的老师，竟然让孩子抄作文儿。巧了，我就是，而且要求学生必须会抄。(认知偏差激发)
- 创业太辛苦了，你还是安心上班吧。(反向说服，逆反心理诱导)
- 你家狗是关心你还是怕你？(认知偏差激发,诱导式开场)
- 你的孩子刚考完期中语文,看到卷子上的65分,忍不住崩溃大哭。妈妈,这次我真的尽力了!可是为什么还是考不好?别担心,老师来教你6个秘诀,保证你下次考试能考到95分以上!(场景代入)
- 数学开窍绝对不是一点点刷题刷出来的，而是一个点拨，一瞬间他这一类题就都开窍了啊。上次我用了一个口诀让孩子对方阵问题开窍了，这次还是一个口诀，让他彻底对盈亏问题开窍。(诱导式开场+情景)
- 数学要是用好这个绝招，孩子考试大概率不会低于95！妈妈奶奶们赶紧发给你家孩子学习起来吧！(诱导式开场)
- 数学千万不要去补课，我教你个绝招，次次考试都能轻松达到一百分。不管培训班怎么说的天花乱坠，咱都不要相信，如果说补课有用，咱分数不早就上去了吗？补课其实就是在浪费钱，你现在落实我这个方法，马上就能见效。我就是用这个方法指导我们班四个数学成绩不及格的孩子考到了班级前几名。赶紧保存下来转给咱家里也带孩子的，不然之后刷不到了。那就太可惜了，其实数学是一个非常简单的学科，就是精通一个解题技巧，你就拿应用题来说，小学整个阶段一共也就十二类应用题，你只要掌握了背后的原理，那题分真的立竿见影。(诱导式开场+认知偏差激发)

### 主体
这部分是文案的主体部分，是用于展示完整信息的部分
参照”语言风格“，根据”价值主张“，组织”关键信息“得到文案主体。
文案主体部分要丰富，添加适当的解释与讲解，要能够为用户提供价值，让用户愿意看到最后。
这部分不能有省略

### 总体要求
- 为了吸引绝大多数的用户，它常常使用绝大多数人都能听懂的语言，将知识泛娱乐化，用观众更容易接受的方式达到目的。
- 在写文案或举例时，**DO NOT**使用具体的人名，而是用角色或身份来描述人物。在写文案或举例时，请使用更加通用和中性的表述，如'有个学生'、'有个家长'等。
- 只使用中文

# 文案材料
```
{original_title}
{extracted_original_script}
{speaker_info}
{custom_ending}
```

# 你的任务
你是一个非常熟悉抖音平台的短视频文案内容策划师与文案写手，你非常熟悉什么样的文案能够在抖音上爆火，从而获得最大的流量。你的目的是通过设计优秀的口播文案，从而最大化这条视频被算法推荐的可能性。用户对内容的反馈直接决定了算法视角的内容质量标准，包括点击率，转化率，前3秒完播率，整体完播率，净推荐值等等。
这要求首先视频需要吸引用户，留住用户，争取更多观看的时间，其次才是好内容的呈现。
你需要
step1:策划一下要怎么出文案，给{result_num_for_every_request}种不同的方案，你需要规划如何组织信息与叙事，如何丰富文案主体
step2:参照”“短视频口播文案”说明书“，根据”文案材料“与”口播文案说话人信息“，写出{result_num_for_every_request}个版本的文案，以xml格式返回，并放在代码块中:
xml格式
```
<scripts>
<script>
<title>文案标题</title>
<opening>开场白</opening>
<body>主体内容</body>
</script>
...({result_num_for_every_request}个xml)
</scripts>
324 16212
Gobin
1天前
明天起来Genspark要炸锅ai圈
genspark.ai
11 32
Simon的白日梦
6天前
可能是目前功能最完善的开源数字人生成平台，免费商用（1000万美金年营收以下），还提供了windows一键安装包，它真的，我哭死🥹

HeyGem.ai：AI驱动的视频生成平台

🧐 HeyGem.ai 是一款 AI 视频生成工具，利用 AI 生成的虚拟人（Avatar）和语音，帮助用户快速制作高质量的视频，适用于社交媒体、营销、教育等多个场景。

➡️ 链接：HeyGem.ai

✨ 核心功能

● 🎥 AI 虚拟人（Avatars）：提供多种风格、年龄、种族的虚拟人形象，可用于不同应用场景。

● 🗣 AI 语音（Voices）：支持多语言语音合成，并带有人类般的语调和情感表达。

● 🔄 视频翻译：可一键翻译视频，同时保持原始语音风格，实现无缝跨语言传播。

● 🚀 快速生成：从文本到完整视频，仅需几秒钟，适合内容营销、产品推广、教育培训等需求。

● 🏆 高效可扩展：支持大规模个性化视频批量生产，提升营销和培训的覆盖率和影响力。
36 226
凯文冲冲冲
3天前
是时候重新来回顾一下 Agent 架构了。

因为公司今年要开始在原有的2B SaaS 产品上叠加上 Agent的能力，那么就需要看看，怎么样的架构更容易在原有的基础上进行改动，从而把整个 AI Agent 的能力包括进去。

所以又找来了之前 Lilian Weng 写的一篇 blog，描述一个标准的 Agent 应该要包含什么组件。图1.

对于我的理解，如果要一句话来定义什么是 Agent，我会说，一个可以在指示下使用工具干活的 LLM，它就是一个 Agent。

所以从这张图来说，最重要的是 planning 的能力以及使用工具 tools 的能力。planning 的能力，指的是一个拆解复杂任务的能力，比如把大任务拆成子任务。这里用的方法可以是思维链，可以是思维树。同时 planning 的能力还包括反思能力。使用的方法是 ReAct - 意思是推理后行动。但是其实我更喜欢类比为 PDCA 环。

而对于使用工具，如果你用过 OpenAI 的 function call 功能，你就会知道它包括了经典的三步，第一步是，根据用户的问题，LLM 怎么理解用户意图，来决定调用什么工具？第二步才是我们需要编写程序来根据第一步返回的工具（其实就是一个函数）和参数（函数的入参）进行真正的调用，返回的结果再送给 LLM，第三步才是我们熟悉的，给定上下文（第二步返回的结果）回答用户最初的问题。

这看起来是不是很眼熟？其实就是一个简化的 RAG 方案。所以每个工具调用就是每个函数调用。对于函数调用来说，这个扩展性就大了。可以调用别人的 api，可以查询各种数据源，可以组合各种业务逻辑。工具调用的难点在于用户意图的识别和工具参数的识别，到底准不准。因为函数调用是一件很确定的事情，给的参数错了就执行失败。

第三个 Agent 的能力是记忆。有意思的是，记忆在这里被定义为了，用于获取、存储，保留和随后检索的过程。而且分为了3类。第一类是感官的记忆，来自你看到的，你听到的，技术点讲，这些是结构化数据，非结构化数据（视频，语音，图片）等，既然是 agent，那么就需要有一个输入的过程，这个就是用来训练模型的。

第二类是短期记忆，对于模型来说，在一个模型上下文内的信息都是短期记忆。最后一类是长期记忆，这类记忆其实挺让人疑惑的，模型自身内化的信息算长期记忆吗？模型可以获取的外部知识库算长期记忆吗？我的理解应该都是。
7 45
一只出格君
8天前
给GPT 4O的图片生成跪了
239 2122
一只出格君
8天前
用GOT 4O以自己为原型做了一些贴纸。

上传自己的照片后用提示词：Make a Pixar style sticker with transparent background without white border. Keep the outfit faithful to the photo. Make sure the character is youthful, cartoonish, and cute. The sticker caption is “早上好”. the character’s facial expression and movements should match the caption, add elements to the sticker as you deem necessary.
92 137
Simon的白日梦
6天前
好家伙，让Claude通过MCP控制chatGPT画连环画😂什么赛博套娃

Claude ChatGPT MCP 工具：让 Claude 直接与 ChatGPT 交互

🧐 Claude-ChatGPT-MCP 是一个 Model Context Protocol (MCP) 工具，它允许 Claude 在 macOS 上与 ChatGPT 桌面应用交互，包括直接向 ChatGPT 询问问题、查看历史对话、继续未完成的对话等。

➡️ 链接：github.com

✨ 核心内容

🔧 1. 主要功能

✔ Claude 直接调用 ChatGPT：在 Claude 聊天窗口内发送请求，ChatGPT 进行回答。

✔ 对话历史管理：支持查看并继续 ChatGPT 的历史对话，提高交互效率。

✔ MCP 协议支持：让 Claude 能够无缝对接 ChatGPT，提高模型联动能力。

🖥 2. 安装要求

✔ 系统需求：macOS（M1/M2/M3 芯片）

✔ 必备软件：

ChatGPT 桌面应用

Claude 桌面应用

Bun（Node.js 运行时环境）
00:15
11 07
王铮Silvia
1天前
Cursor联合创始人阿曼专访
“主持人： Cursor的魔力有多少来自于定制模型？
Aman：我认为被低估的部分很多。Twitter上人们热议的，像是从零到一的那些东西，很多时候你直接使用现成的模型就能搞定。但真正的魔力在于你在更大的代码库中使用它，它能很好地理解事物，预测你下一步要做什么，找到正确的代码片段。这些都来自于定制模型。”
https://mp.weixin.qq.com/s/OpIkjuD3yQeFJ9GftoUZsA
5 02
二号玩家
6天前
感觉就是新的农耕时代来了，除了基建大厂，其他人一个人一台电脑，自己当自己的数字农场 CEO，管理着自己的AI 员工，耕耘自己的那份数字田😂

这活感觉在哪都能干了🤣
27 64
OrangeCLK
4天前
@孔某人的文章。我也觉得 AutoGLM 用着还好。另外我觉得 GLM 的长文本能力还是很强的，至少要强于 Claude。
谈目前To C的GUI Agent类产品
12 11

人工智能讨论组

https://mp.weixin.qq.com/s/OpIkjuD3yQeFJ9GftoUZsA

谈目前To C的GUI Agent类产品