即刻App年轻人的同好社区
下载
App内打开
Harry_硅基觉醒
43关注1被关注0夸夸
投资人|AGI信徒
播客 硅基觉醒 主理人
get hands dirty first
Harry_硅基觉醒
6月前
AI产品的形态为什么逃不开对话框,用户自由度的不同又将创造多大的创新空间,可以听听这期小宇宙播客

2025年了,AI应用什么时候能爆发|对话捏Ta创始人胡修涵与Edison创始人肖翔峰

硅基觉醒FM

00
Harry_硅基觉醒
11月前
这次AI浪潮是否会成为国内to B领域的转折点?2025年了,To B的AI应用到底发展如何?AI是否会颠覆SaaS领域,是否还能照抄SaaS行业的估值与发展逻辑?欢迎收听本期播客

2025年了,To B的AI商业化走到了哪一步

硅基觉醒FM

00
Harry_硅基觉醒
11月前
o3正式版的发布,开始显示出OpenAI在通用Agent领域的野心

ChatGPT变身Agent:解读o3的进化与OpenAI的Agent野心

硅基觉醒FM

00
Harry_硅基觉醒
12月前
当下做agent绕不过去的话题就是强化学习,那agent的强化学习怎么做,壁垒有多高,还有初创团队机会吗,欢迎来听这期节目,干货满满

走向强化学习:Agent还是应用公司的机会吗?对话Pokee.ai创始人朱哲清

硅基觉醒FM

00
Harry_硅基觉醒
1年前
没人关心原生多模态吗?
我发现大部分人只使用GPT-4o在生成各种吉卜力风格头像,但讨论背后的原生多模态技术的反而寥寥无几!

一些核心观点:
1、对于纯业余小白用户来说,gpt-4o相对stable diffusion这类是碾压的,因为小白用户再也不用学prompt咒语了,门槛大幅降低

2、原生大模型训练成本高,数据量庞大,不是普通创业公司能参与的游戏,而字节、快手的优势更大

3、原生多模态模型生成图片,可能是扩散类模型成本的10倍

4、原生多模态暂时还未颠覆视频领域,做视频生成的企业还有机会,扩散路线也在进化,鹿死谁手尚未可知

5、原生多模态模型不能提升智力上限,但能增进模型对世界的认知。
00
Harry_硅基觉醒
1年前
我们测试了gpt-4o的图片输出能力,并认为这可能是未来AI OS时代的GUI的雏形,短期内我们认为基于原生多模态大模型,AI搜索产品的问答将从文本逐渐向图文转换,更易读更生动;长期,我们认为AI具备实时生成交互界面的能力,以后的应用界面会走向千人千面。欢迎订阅我们的播客

生图领域大变天?SD还有价值吗?原生多模态与下一代交互

硅基觉醒FM

01
Harry_硅基觉醒
5年前
来到即刻的第一天。
00