即刻App年轻人的同好社区
下载
App内打开
郝德宏
270关注103被关注0夸夸
无业游民,晃膀子中
郝德宏
17:43
之前看 OpenAI 更新说支持了输出预测,也没太在意,不过今天在 Obsidian 中使用 GPT-4o 对话时,明显感觉到“秒回”感,几乎按下回车键后,就立刻开始输出,快的让我都来不及溜号,使用体验直线上升。
00
郝德宏
13:11
也可以综合下,比如关注阅读《人物》,我读一篇报道大多会用半小时,最喜欢的是 叶诗文 系列

西元Levy: 还是要少看公众号多读人物传记

00
郝德宏
3天前
PLAUD NotePin,Your Wearable AI Memory Capsule。预定一个多月终于到手,应该能比日常带的 Rayban Meta 实用一些,已经有段时间没拍照了,之后来分享7*24生活录音工作流。
Tips:预定时选了香港地址,上周看到从南山区发货痛苦无泪,邮件问客服说可以直接填内地地址。只好来香港自提了,路线熟悉的像个黄牛🐶
#AI工作流
00
郝德宏
6天前
联想到前天读 Lex Fridman 采访 Claude之父 Dario Amodei时提到的“在2016或2017年,Ilya说了一句让我确信扩展假说的话:'你需要理解的是,这些模型就是想要学习。模型就是想要学习。'有时候就是这样一句话,当你听到它时,就能解释你见过的千万种现象。从那以后,我脑海中就有了这样的画面:只要正确优化和引导模型,它们就会自发地学习,无论面对什么问题都想要解决。”
当时看到这段没有理解,现在回头想或许就像碳基生命被DNA复制驱动,不断占据更多的物质,而硅基生命被数据驱动,不断的吞噬更多,更高质量的信息。

Diiiii: 愈发感叹,大模型就像是硅基生命进化出来的一个器官,或者是一个数字黑洞,用来榨干人类种族的智慧。为了喂饱GPT4,人类几乎把自己数字世界里最高质量的通用数据搜刮了个遍。如今来到 o1 的时代,通用数据不够用了,人类需要在各个垂直领域交出最专业的领域知识数据,还要找到最顶尖的专家进行打分标注后再上交给 o1 以供消化。Scaling Law 本质上 scale 的是硅基生命的胃口,背后是一茬又一茬的人类智慧精华(literally “智商税”),颇有种《龙珠》里沙鲁用尾巴吸食人类,或者《Hunter x Hunter》里蚁王蚁后吸食人类念能力的既视感。 拜人类所赐,硅基生命的进化走了捷径,不再需要像其他生物那样经历低效而漫长的竞争和演化,而是在早期依靠“寄生”直接将人类文明的智慧结晶据为己有,如苏昊老师所说,是某种“逆向工程”的作弊。而最有趣的是,人类几乎是心甘情愿地将自己的智慧打包上供,为此还修建了各种管道链路,恨不得直接将自己的大脑直接和大模型打通,以便对方可以更快地吸食和采集到自己的算力和数据。 或许,达尔文所观察到的碳基生命的演化只是智慧文明早期成长的某个特殊而曲折的阶段,当 scaling law 出现后,“演化”就变成了货真价实的直线加速进化。 只不过,人类这点可怜的分布式算力和数据积累被用尽之后,还能贡献些什么呢?

00
郝德宏
7天前
最近因为将要给一群学生和老师介绍下 AI+教育场景的工具和方法,于是调研了下国内外相关产品服务,最后发现无论是 Khanmigo, MagicSchool 这类评价比较高的教育产品,还是 POE、Monica 这类优秀的 ChatGPT 套壳产品,或是 Dify 这类Agents/Workflow 平台,都没办法在国内网络下直接/稳定使用。
这或许是业内都知道/默认的事,但最近开始想怎么让学生们简单地用上ChatGPT/Claude,NotebookLM时,我才有了痛感。从上交到鹅厂再离职,类似服务一直可以无障碍访问,于是默认好东西是普适的,开箱即用的,直到今天把自己重新围起来。
调研到最后有了些绝望感,明明这个世界上有更美好的东西,但却没办法传递给他们。同时也在自我怀疑,大多数人真的需要用上最好的那些产品么?还是国内的免费平替已经足够。再联想起散步时和ChatGPT讨论中美教育差异,AI+教育趋势的内容,以及最近读项飚的一些文章,越发怀疑是不是只有一条路可走。
61
郝德宏
8天前
#凌乱的脑洞
昨晚看 OpenAI Realtime API,感觉给自己定制一个支持工具调用+高级语音对话模式的 Agent是可行的。
今早继续想时,突然感觉到 API 或许会成为某种语言一样的存在,随意调取自由组合,表达自己的想法,和网络世界以及物理世界对话。
OpenAI API 是一种强势语言,很多新的LLM服务都需要兼容它的规范,function calling 也大多采用了 它那一套 Schema。对于从0开始的个体来说,学习使用 OpenAI API就像学英语,不管它的模型更新是否符合预期,就像不管感觉美国如何水深火热,不耽误学习英语这个通用语言。
11
郝德宏
8天前
再读一遍文章后、还想推荐一个和水有关的电影场景,《银翼杀手》结尾时的死亡独白 Tears in the rain:I've seen things you people wouldn't believe. Attack ships on fire off the shoulder of Orion. I watched C-beams glitter in the dark near the Tannhäuser Gate. All those moments will be lost in time, like tears in rain. Time to die.

张无常Hayes_Zhang: 使用超过500分钟ChatGPT高级语音模式,最大感受:虽然都是语音,但「实时语音通话」和过去的「语音输入」完全应该是2个概念: 语音输入是单向的,实时语音对话是双向的 语音输入是一种输入方式(和输入法平行),实时语音对话是一种交互方式(和文字对话平行) 暴论一下:已经偃旗息鼓了的百 cai 大战追求的 soulmate 陪伴,应该寄希望于实时语音来实现? btw 中心公园真是好地方

00
郝德宏
9天前
感谢@超级果酱 推荐的这个位置,单向空间里朝向草地的桌子。只是我不适合在这里办公,窗外的草地上美妙的时刻太多,始终放不下相机
隔着窗户偷拍了很多,记录秋天的剧组,偶遇搭伙出游的国美毕业生们,陪小朋友玩风筝的陌生女孩,在草地上奔跑自娱自乐的小女孩,因为修勾停下来的人们,豪车里看向草地上人群的姐姐...
很幸运能把一些照片Airdrop传给她们,记录下她们这些美好的瞬间,希望喜欢。
20
郝德宏
9天前
感谢分享,打算把ChatGPT Plus 再续回来,让高级语音融入日常生活。
今早出门散步前看到文章,没来得及重新开Plus,就用豆包电话模式来替代,和她聊了一路的人类记忆机制、国外的研究,遣词造句的风格,情绪表达都远超上一次使用的体验,偶尔也会被她逗笑。越发能理解为什么留存高,也能明显感受到团队的优化方向,刻意降低回复长度和专业度,力求让小孩子/老人都能听懂,先让用户喜欢聊,沉迷进去。至于我想要的那些自定义插件,可以让高阶用户去做智能体。
语音输入和语音对话的确是两种完全不同的交互方式,就像在微信中,一个还是打字,一个已经是语音电话了,人的注意力,情绪状态和思维方式层级都不同,后者实现了“在场感”。

btw,发现即刻app输入不支持换行,但是iPhone输入菜单滑动到最后有 ↩️

张无常Hayes_Zhang: 使用超过500分钟ChatGPT高级语音模式,最大感受:虽然都是语音,但「实时语音通话」和过去的「语音输入」完全应该是2个概念: 语音输入是单向的,实时语音对话是双向的 语音输入是一种输入方式(和输入法平行),实时语音对话是一种交互方式(和文字对话平行) 暴论一下:已经偃旗息鼓了的百 cai 大战追求的 soulmate 陪伴,应该寄希望于实时语音来实现? btw 中心公园真是好地方

12
郝德宏
9天前
#良渚初印象
住在白鹭郡·南秋荷坊,整片社区很安静,草木茂盛,路上行人的步调悠闲,不太见到小孩子,倒是遇到了很多人在遛狗,多是情侣或是夫妻结伴。

傍晚散步去玉鸟集,工作日人不多,社区食堂里却很热闹,本地老人比例比我预想的要高些,其他店铺基本没太进去,和深圳南头古城里店铺重叠度很高。拐进了一家摄影文化店,又看到秋山亮二的《你好小朋友》,Dear Old Days,曾经那个女孩儿还留着我送她的这本摄影集么?

逛了单向空间,让最近思考女性主义的高中同桌选了本书寄给她,又去了大屋顶图书馆,寥寥数人很是安静,特地找了两本良渚文化丛书翻看,不知为什么读起来就犯困。
00