即刻App年轻人的同好社区
下载
App内打开
韩一暐
26关注87被关注0夸夸
追求新技术的老透明
初阶web3/中级极客/资深背锅侠/终极探索者
职业领域: product4devAPI(infra and AI)
韩一暐
10:47
不卷不行,卷的飞起。
00
韩一暐
3天前
可穿戴人类
00
韩一暐
3天前
世界基础规律是获取正反馈的效率。
00
韩一暐
7天前
我们可以从gpt4o的发布里面学到什么?
营销还是Sam精。
4o这个阶段的事情大量的工程优化,无论是算法层面还是工程层面,主要看性能数据的变化。先说结论,总体上这是一个效能更精进的版本,更好的成本表现,特定场景中(演示场景中)更好的效果预期,但是注意,这不是GPT5,这是一个SP1的加强版。

进步最明显的是ASR,对比whisper来说是大幅提升了,对于最强的Emm,现阶段主观评价能用,基本到cer 5%还要看场景覆盖,ASR小场景真的是难赚钱的深坑,在Translation上的性能和Google打拼。Vision understanding的部分,在4t的基础上进一步迭代,符合预期。

整个交互过程中,最精彩的语气发音输出,TTS的性能或者任何报告,没有在官方文档中找到。原本的设计中,完成这些需要whisper+TTS+GPT4v,模型的工程将这些做成GPT4o,所以TTS API中看不到的语气标记,在GPT4o中可能通过某些方式完成。

ASR和TTS在需求定义和工程上有很多细节,GPT4o可以在整个交互过程的响应230ms很厉害,比如流式的ASR模型单字模型输出200ms以内(三年前的工程数据)。好奇GPT4o 做了哪些事情(压缩也可以优化这个时间)。

token的压缩则达到更低成本的目标(图6,只截了一部分)。处理速度恒定的情况下,更高效率的将文本转化为token,以前一个窗口卖1个馒头,现在一个窗口卖10个馒头,可能后厨已经Blackwell了。

更加期待gpt4o的白皮书,不同模态的moe还是scaling law加强,或者是一个新的架构来支撑未来的GPT5.

产品层面,放出的视频场景,已经表现出了非常强对更多用户数量的需求,MAC的PC端,移动设备端,微软和google还没站稳的地方放进去,免费获取用户数和用户场景的策略,在C端总是屡试不爽,只需要一个很好的故事。

所以更加显得openAI的故事讲的很棒,一群人坐在那里,给你对话,给你场景,直接上产品,没有数据,有一个巨大的电影故事场景,并且之前你的认为是那样的,现在他是这样的巨大矛盾,这是一个天然的科幻电影。如果换成一些国内公司来讲,我们遥遥领先就是不跟你讲有啥用,卖房子的这年头都知道要毛坯房也要精装样板房,买的是未来生活的想象。用不用的上是另外一回事。

对终端用户的影响:
1 GPT4o API直接进新产品获取新能力,一波热点直接上。
2 各种无手环境,你都有个伴听在身上了,比如车上陪聊,谷爱凌滑雪打电话给她妈,加上腿就是BB8
3 Gemini 该干啥干啥,这一波难受肯定了。
4 Her滤镜直接上。
5 GPT4o在web上给用户的体感可能不明显,加上全套交互是有趣的工具。

openai在即将赚钱的前夜前进了一大步。
00
韩一暐
10天前
八段锦心得:差不多有7-8个月的时间不间断,每天十分钟。额外还有帕梅拉有氧什么的。没有小红书上玄幻的对比照,一些细节越来越清晰了。
1 季节性咽炎降低了发作频率。
2 对身体的感受越来越清楚,所谓的muscle thinking,因为配合了其他的运动,对核心的感受越来越明确。
3 ,到第七段,马步蹲的认真身体一定会发热,如果学会了配合气沉丹田(核心收紧),前几式也可以有很好的热身作用。
4 这个运动对很久没有运动,心肺很久没锻炼的人来说,是非常友好的。呼吸节奏跟不上,可以闭气,多呼两下也没关系,除了有些动作对膝盖和脚踝是有那么一点点压力的,几乎可以认为安全度已经报表了。
5 动作的舒展,加上,持续的练习,动起来就会有好的收获。

一些自己的理解,也可能是胡说八道,还有一些没get道,
理三焦,三焦-呼吸系统,消化系统,排泄系统,管道相连,拉伸。
五劳七伤向后瞧,对放松眼睛是个友好的动作,刺激交感神经。
两手攀足固肾腰,这个动作主要利用核心力量,算是简易站立拉伸全身,以及核心舒展的方式。
攒拳怒目增气力,结论是增加握力,眼睛更有神了,感觉这个跟练空击的道理是类似的。
背后七颠,脚踝或者说整个下肢是运动的基础,这个动作可以增加脚踝力量,在脚踝康复和篮球练习脚踝的有类似的原理。

差不多吧。先记一笔。study in public.
00
韩一暐
11天前
PDD的魔鬼设计:
1 一双球鞋,定价A,热心观众告诉你买贵了,多看几次就发券了。该说不说,这种情况存在。
2 刚买完美津浓的护踝,推荐引擎还是推荐。两周后直接来个万人大促销直接推荐给你,1.8一对,同样款式,同样内容,1块8还包邮。。。考虑到护踝对我来说是耗材,不买简直对不起平台。
3 7号PU篮球荔枝纹,白牌的45块,所以继续搜6号球,两个月做活动现在38块。

为什么以前的平台有保价计划,为什么PDD大名大方的推给你同样东西更便宜?这个行为跟品类有什么关系。所以为什么这么设计?

那么为B站up主提供对接的PDD各种活动,为什么不是淘宝为什么不是闲鱼为什么不是京东,为什么是PDD?
有点妙呀---也可能是我粉丝不够不能看到更多的商业活动信息。每天都是十万个为什么。
00
韩一暐
12天前
马后炮的,百度璩静事件说两句,她的叙事表达无关对错,总是要搞清楚你服务的对象是谁。
作为公关领域的专业人士,这种表达对于服务对象的影响,也是一个资深的媒体人能够判断情况。现在事态看起来有些失控,不知是预计之中还是意料之外。

内部的流程表现,如果审核是工业时代风格的老板,那么璩完全价值观正确,如果审核是当下的打工人,你猜他们能不能敢不敢提出反馈意见?即使反馈意见了,万能解法先投出去试试,不知道谁来背这个学费的锅。

孙董事件的轰动没能教会百度的公关,应该如何讲或者该不该讲领导和员工的故事,用户中领导多还是员工多?大众媒体走向分众媒体的时候,爹味不分男女更容易被发现,每个人都有了表达代表自己利益的声音。

新华社采访记者,华为的公关和政府关系背景,意外来的似乎可窥一斑。

如果利益不对等,为什么要求我站在你的立场考虑问题?这个问题在搞清楚用户是谁之后,是下一个需要思考的问题。
30
韩一暐
15天前
出租车对话:中年司机,在上海开出租车两年,家在安徽,五一回家休息,今天第一天上班。
每天开车12小时左右,一个月给出租车公司交7900的份子钱,公司负责车的保养和后续处理,对于司机没有其他的支持。订单主要来自滴滴,或者其他的打车平台。运营成本,每天的餐费50-80,电车每公里0.1元多,一天12小时差不多是300-400公里。

司机的一个月30天成本是,餐费1500-2400,一个月的充电费用(很便宜),上海的三公里起步价16元,之后每公里按三块算(阶梯计算太烦了),份子钱7900,房租?社保自己缴纳。 询问后得知,上海使用的纯电荣威大概是12万。

这个故事里的重点是出租车公司,真出租车公司,金融公司。

不记得以前油车的出租车份子钱多少了。出租车的生意和司机的收入在一定程度上反应当地的收入和消费能力情况。

是不是其他城市的情况会更好些。

所以Robotaxi在我朝有点危险?
00
韩一暐
22天前
绿野仙踪。一堆照片还是要分享,ins再次更起来。
00
韩一暐
22天前
试用Outfit Anyone,
1 对服装的版型有比较好的理解,比如正肩、宽领、很短短袖、收腰的T恤,有比较正确的表达。
2 对于模特的人脸仍然有缺陷,抽卡容易乱脸。之前可以换模特,现在不能换模特(手动狗头)。
3 人物有性别概念?男性模特有时不能穿裙子。
4 某些材质表达的细节欠缺,可以检测到真丝衬衫的垂坠感,以及非收腰的设计,但是细节缺失。
5 裤子的效果Emmm。
6 东亚人模特审美白幼瘦,集体微商风格导向。
7 菠萝的演示,令人惊喜。
8 歪门邪道也是可以用的。

至于这个设计对营销有多少影响,可能还要看具体的数据。
服装业小老板说”拯救了我的平铺图,必须让他有用“,突然背着电脑上班去了。
00