即刻App年轻人的同好社区
下载
App内打开
陈言_Linkc
136关注1k被关注0夸夸
🔮 致力于创新团队工作流程 AI化
💡 跨周期产品设计师
🎲 社区、媒体科技、生态治理专精
🏄 效率工具爱好者,玩票自媒体
陈言_Linkc
3天前
最近我在帮助朋友的团队优化他们的大模型工作流。这个团队的主要应用场景是在社交媒体上生成评论。早期,他们的内容库是针对不同行业场景手动编写的评论,质量低且同质化严重。后来,他们改为抓取真实数据,并使用NLP技术对数据进行分类和轻微改写,使评论看起来更自然,但依然难以实现精细化的定制。随着大语言模型的出现,这个问题得到了有效的解决。因此,我们现在看到的许多社交媒体评论并不是真实用户所写,某种程度上可以称之为灰产。当然,平台也在进行类似的内容生成,前不久我还面试了一家头部生活服务公司的产品经理,专门负责这一块的工作。

生成成本的挑战

目前,团队已经成功建立并运行了整个工作流,但随着生成量超过每日百万条,他们需要系统性地降低生成成本,特别是token的支出。我们主要在两个方向上进行尝试。

方向一:选择性价比模型替代部分主力模型

第一个方向是使用“性价比模型”替代部分高成本的“主力模型”,同时利用思维链的方式弥补生成质量的不足。具体来说,可以先让主力模型根据需求生成一系列关键词,再将这些关键词交给性价比模型来生成完整的评论。这样,高性能模型负责规划方向,性价比模型负责具体生成任务。这种方式显著降低了成本,但生成内容的质量有所下降。不过,即便如此,生成内容的质量依然远高于普通用户的语言表达水平,足以满足需求。

在这一方案中,关键在于取舍:如果主要目标是理解需求并把控评论方向,那么可以接受生成内容的语言质量有所降低,从而实现成本的显著降低。

方向二:优化工作流和提示词结构,适配提示词缓存功能

第二个方向是优化工作流和提示词结构,针对支持提示词缓存的服务进一步降低输入成本。提示词的优化和工作流的调整相对来说较为简单,但需要在新模型的选择上投入更多的努力。这包括在实际需求中进行内容生成,并持续进行标注和评估,以适应模型的升级和业务场景的变化。

对于个人开发者来说,这是一个好生意吗?

这个生意看起来似乎适合小团队甚至个人团队,但现实并非如此。虽然AI生成评论的成本并不高,但获取利润的关键并不在于生成技术本身。这种灰色产业链,如果不是由平台自己主导,往往面临巨大的平台博弈成本。比如,创建大量符合平台法规和要求的实名账号,确保账号健康状态,避免账号被降权甚至封禁。这些繁琐而耗时的工作决定了业务最重要的资产——健康账号的质量和规模。因此,负责账号管理和运营的团队规模通常是内容维护团队的三到四倍。

此外,市面上大多数评论维护需求来自小型代理公司的员工和媒体,他们的需求主要是为了数据的合规性和可接受性,而非追求高质量的评论内容。高质量评论的需求主要集中在大型广告代理公司和头部媒体,而个人和小团队面临的首要挑战是如何获得这些客户的渠道和商务能力。

结语

最近我也在尝试开辟新的分享渠道,把自己和团队在AI商业落地方面的经验和信息做一个总结。如果你对AI如何赋能个人成长和副业感兴趣,可以去小红书关注我,账号名还是陈言Linkc-Chen。

(尝试用ChatGPT Canvas写作中)
10
陈言_Linkc
4月前
用claude做了个卷轴射击游戏,几句大白话就实现了,还能直接预览。我闺女大呼:“不学scratch了!”

全民编程时代到来,一句话做一个游戏 - 小红书

00
陈言_Linkc
5月前
果壳X厦门科技馆 两个团队经过一年的打磨,《走!去火星》今天正式开馆!
这是我们第一次独立策展并成功落地的大型主题展。在本次展览的策划和设计过程中,我们大量使用AI技术,从故事背景、科学设定、艺术装置,到用户模拟、动线设计等等均有AI参与,也是我们验证团队AI落地能力的一块试剑石。欢迎大家前往参观。
00
陈言_Linkc
5月前
昨天看完Google I/O 后第一感觉就是Google一下子变成臃肿、缓慢缺乏新意的“大公司”。虽然早就有这个感觉,但从来没有这个直观过。也许Google还是那个Google,但时代变了。

说回发布会,虽然这次发布的产品很多,Google在AI软硬件上也有不少积累,但最让人兴奋的还是Project Astra。现场demo还是比较粗糙,反馈速度和交互细节有点别扭,但和前一天的GPT-4o结合起来看,纯语音、多模态、连续对话确实是一个值得投入的方向。

目前的人机交互大多为对话框,可以向前追溯至聊天室甚至更早的命令行时代。但纯粹的语音互动,并且给AI赋予更多的输入方式,更符合人与人之间的交流习惯。从产业上讲,AI将不再受制于硬件的输入限制,耳机、眼镜,甚至一个随身摄像头都有可能搭载一个完全功能的智能体。
03:49
00
陈言_Linkc
5月前
这个视频是五一假期和闺女一起策划的,选择了8个国内外大模型,让他们分别对图片进行识别,并完成相应的任务。说实话这些任务都不简单,有的需要大模型能够识别并分析图中的元素,有的需要掌握背景知识,有的则需要具备相当的分析能力。

从评估的结论看,GPT-4、Gemini Pro 1.5 表现出色,国内的通义千问也很厉害。

Gemini 1.5 Pro:6
GPT-4:4.5
通义千问:4
智谱清言:3.5
文心一言:2.5
Claude 3:2.5
讯飞星火:2
海螺AI:1.5

其实在日常使用中,尤其是生活场景,拍照提问要比输入文字语音常用得多,这也是我们做这个评测初衷。评测方法肯定是很不严谨的,大家带着娱乐的心态看待就好。

xhslink.com
00
陈言_Linkc
6月前
今天开始写一些团队和自己应用AI的案例。第1期,哈哈。

我是Memo(图1)的早期用户,这是一个利用本地算力进行语音识别的工具,识别出的语音可以生成字幕、以及转录为其他语言。其实剪映也在前不久上线了这个功能(图2),但出于安全考虑,操作者必须验证语音,与原视频的语音一致才可以使用(图 3)。

我们最近有一个项目正好用上,不过是自己搭建的转录流程。这个客户是一家面向全球的机械公司,疫情期间拍了很多小视频介绍自己的产品,效果不错。他们希望面向海外市场重新拍摄这些视频,放到TikTok上传播。但视频拍摄成本挺高,把外国演员和设备档期凑到一起也不容易,所以想看看能不能通过AI手段实现。正好,语音转录+deepfake搞定,客户满意也节省人力。
00
陈言_Linkc
7月前
HeyGen这个数字人在真实性和场景广泛读上又更进一层。不仅仅是能动了,而且把数字人的应用场景从固定信息传达扩展开了。
xhslink.com
20
陈言_Linkc
8月前
介绍一下孩子使用AI的经历,我觉得我这辈子被AI替代不可能了,我已经被年轻人替代,AI没这个机会,但一零后还是要提前接触一下。

愁死!刚戒了游戏,孩子开始沉迷AI

00
陈言_Linkc
8月前
世界需要Sora,也需要完成特定任务的AI工具。我的需求很简单,就是让照片动起来,几秒钟就够了。现在用的是LeiaPix,输出 720P免费。

比Sora更快更真实,AI把我的照片变活了

00
陈言_Linkc
8月前
这次春节去新加坡玩,很多看不懂的标牌都交给ChatGPT了,AI识图和理解功能真强大啊。有些场景我自己还真是会懵圈。

沮丧,十年外语白学了,出国旅行也要靠GPT

00