即刻App年轻人的同好社区
下载
App内打开
叶安杰Alger
346关注951被关注7夸夸
生命力
叶安杰Alger
12:44
Hi!我打算把现在共居的207平三层别墅续租。离奥森200m,离五道口4.5公里

同时改造一下一楼45平的大客厅
平时一起工作、放松,周末办办大家喜欢的活动。在北京能有一个客厅真的太好了!

还有2个房间(一个3700适合单人,一个6200适合两人,价格可再谈),寻找几个同频、有生命力的AI时代创造者一起住。

刚好在看房的朋友可以私聊我!
00
叶安杰Alger
2月前
源泉
00
叶安杰Alger
2月前

Chong.: 原文: 数字游民Jarod @jarodise 这可能是今年最重要的AI新闻,但中文互联网还没什么人聊。 昨天,一家成立不到三年的多伦多芯片公司扔下了一颗核弹。他们不是做大模型的,不是做应用的,而是做了一件听起来很复古的事:把AI模型直接刻在芯片里。 这家公司叫 Taalas。他们做的芯片 HC1,运行 Llama 3.1 8B的速度是 17000 tokens/秒。作为对比,目前业界最快的 GPU 也就 2000 左右。十倍差距。 但这还不是最疯狂的。最疯狂的是,这块芯片只能跑这一个模型。不能换,不能改,不能升级。你买回家,它就永远只会做这一件事:以光速运行 Llama 3.1 8B。 Taalas 的赌注很简单:在这个所有人都追求灵活性的时代,他们选择了绝对的不灵活,换取绝对的效率。 要说清楚这件事为什么重要,得先理解过去几十年芯片发展的主线。从 CPU 到 GPU,再到各种 AI 加速器,所有人都在做同一件事:造一个通用的计算平台,然后用软件在上面跑各种模型。 这条路走到今天,遇到了一个硬边界。模型越来越大,内存带宽成了瓶颈。你把几百亿参数从显存搬到计算单元,这个过程消耗的能量和时间,已经比计算本身还要多了。 Taalas 的思路是:既然你每次都算同样的东西,为什么还要搬来搬去?直接把权重存在晶体管里不行吗? 他们真的这么做了。HC1 芯片里没有显存,没有 HBM,没有复杂的缓存层级。模型的每一个权重都对应着芯片上的特定晶体管,矩阵乘法通过电路的物理连接直接完成。你输入一个 token,电流流过这些预先设计好的路径,输出就是下一个 token 的预测。 这就像录音带和现场演奏的区别。传统芯片是每次都要重新演奏,Taalas 是把演奏录在磁带里,播放就行了。 这种设计带来了几个惊人的结果。 第一是速度。17000 tokens/秒意味着什么?你几乎感受不到延迟。不是"很快",是"瞬间"。有测试者说,按回车的瞬间,答案就已经完整出现在屏幕上,甚至看起来像是预先准备好的。 第二是功耗。传统 GPU 运行 AI 推理需要液冷,一个机柜动辄几十千瓦。Taalas 的芯片只要空气冷却,十张卡加起来才 2.5 千瓦。他们号称能效是 GPU 的十倍。 第三是成本。制造这样的芯片,他们说是传统方案的十分之一到二十分之一。 但代价也是真实的。这块芯片出厂那一刻,它的命运就已经注定。Llama 3.1 8B,就是这个芯片这辈子唯一能做的事。如果明年 Meta 发布了 Llama 4,这块芯片就变成了电子垃圾。如果你发现这个模型有偏见,或者在你的应用场景里效果不好,你不能微调它,不能换别的模型,只能再买一块新芯片。 Taalas 的解决方案是:把定制芯片的周期从一年压缩到两个月。他们和台积电合作,只改变两层金属掩膜,就能为不同的模型生产新芯片。他们声称训练一个模型要花十亿美元,而定制一块这样的芯片只要花一千万。 说到这个团队的背景,确实豪华得有点过分。CEO Ljubisa Bajic 是 Tenstorrent 的创始人,之前在 AMD 和 NVIDIA 都做过架构师。COO Lejla Bajic 是他的妻子,同样是 AMD 和 Tenstorrent 的资深工程师。CTO Drago Ignjatovic 是前 AMD 的 ASIC 设计总监。这三个人加起来,可能设计了过去十年里你用过的一些最重要的芯片。 2022 年,当 Jim Keller 加入 Tenstorrent 并接管公司后,Ljubisa 选择了离开。六个月后,他创立了 Taalas。显然,他和 Keller 对 AI 芯片的未来有不同的看法。Keller 想做一个通用的、可编程的、软件友好的平台,而 Ljubisa 走向了另一个极端:彻底的专用化。 他们刚刚完成了 1.69 亿美元的融资,总融资额 2.19 亿。投资人里有个名字值得注意:Pierre Lamond。这位老爷子是 Fairchild Semiconductor 的元老,红杉资本的前合伙人,被公认为半导体行业的奠基人之一。这样的大佬背书,说明这件事至少在技术逻辑上是成立的。 现在的问题是:市场会买单吗? Taalas 需要找到那些愿意为了效率和成本,牺牲灵活性的场景。比如语音助手,需要毫秒级响应,而且模型不需要经常换。比如数据标注,需要处理海量文本,用的是固定模型。比如一些垂直领域的专用模型,训练好了就不动了。 但也有人不看好。芯片制造是有污染的,如果每两年就要换一批芯片,这比 GPU 的更新换代更频繁,环保问题怎么算?还有人质疑,AI 模型进化这么快,两个月流片时间还是太长,等你做出来,模型可能已经过时了。 更根本的问题是:当 OpenAI、Google、Anthropic 都在拼命证明他们的新模型比旧模型好得多的时候,谁会愿意把自己锁死在一个固定的模型上? Taalas 的反驳是:模型迭代的周期正在变长,人们开始依恋特定的版本。OpenAI 把用户从 GPT-4.5 迁移到 GPT-5 的时候,很多人抱怨新版本太谄媚了。也许未来我们会像对待手机型号一样对待 AI 模型:iPhone 15 出来后,还是有人用 iPhone 14,因为它们各有各的好。 我不知道 Taalas 会不会成功。这可能是一家改变行业的公司,也可能是一个技术史上有趣的注脚。 感兴趣的朋友可以去他们的demo站点体验一下什么是光速级别的inference: https://chatjimmy.ai

00
叶安杰Alger
11月前
我觉得这个播客我虽然只听了20分钟多一点,但是就是非常不一样,一个是嘉宾,就是鲁豫和李翊云的嘉宾。嗯,就你看到这名字,你都会有不一样的感受,有种感动。

然后就是他们的对谈,首先鲁豫的话,我是觉得他和所有的,就是任何一个主持人、访谈者都都不一样,他的视角,他切入的角度,他。做过的准备,包括他和李翊云有共同的时代记忆,都是那个年代的人,都是在北京海淀那边,然后有很多问题都非常巧妙,能够引发出特别多共鸣,然后李翊云又是就在创作写作这块儿,特别talent的一个人

就有很多那种,Details, 你就不管是关于关于生活的,关于那个时代的,还是关于创作,你都会有一种莫名的感动,然后。他们的对谈也啊,反正我就特别喜欢那种feeling。

我感觉播客这个内播客这个载体,它其实很多时候,就是那个feeling就大于它的那个内容大于context,因为如果你真要去学一些什么东西。或者什么之类的话,你你得去看书或者说看教程这种啊,那当然还有一种就是比如说在前沿科技这一块去对谈那种专业的人,或者第一手的。Insight, 但如果是这种,比如说跟创作,跟非这种前沿科技相关的,我觉得更多的就是一种感受,一种氛围。

S7E3 鲁豫对话李翊云 | 有些艰难无法走出,我始终与其共处

岩中花述

51
叶安杰Alger
11月前

zhijie: 跟大家正式介绍一下 Read Easy,这是一款可以「让阅读英语变简单」的产品。 如果你有下面的感受和想法: 1. 不想错过英语互联网提供的优质内容,不想将自己的信息源局限在中文互联网; 2. 想要原汁原味地阅读英语内容,但是看一句话就要查一个单词,严重阻碍阅读的流畅性,甚至是读不进去; 3. 希望通过阅读自己感兴趣的英语文章来提升英语水平,不想要枯燥的学英语,不想要过度依赖于翻译软件; 那么你可以试试 Read Easy 🔗 https://www.read-easy.io/ ---------- Read Easy 围绕阅读英语这件事,结合了 AI,做了很多实用的功能。 目前的产品形态是一个浏览器插件。 在你不需要的时候,Read Easy 只会默默躺着,没有任何牛皮癣,不会干扰你。 而当你想要好好阅读一篇英语文章的时候,只需轻轻一点,就会进入 Read Easy 提供的阅读模式。 在阅读模式下,Read Easy 提供了多种阅读方式,以适应不同的场景。 按阅读的难度进行排序: 原文 > 标记 > 混合 > 双语。 其中,「标记」是 Read Easy 最核心的功能,它在保留原始英语文本的情况下,借助 AI 对文本添加 标记,比如: 自动翻译难词/生词/重点词,自动标记人名/地点/品牌,自动断句/拆分长难句,对段落进行总结,有了这些标记之后,你会发现阅读英语没有那么难了。 一个具体的例子可以见我之前发的即刻,这条即刻是里的图片,便是一篇文章生成标记后的效果: https://m.okjike.com/originalPosts/67f53496062d2d80a4f51ed3?s=ewoidSI6ICI1YTE4ZmM1YTlkYjAzZDAwMTZlZjZlNjQiCn0= 尽管阅读对部分人而言是一种享受,但是对很多人而言,并不轻松,尤其是阅读深度的长文,即便是阅读中文也是如此。 Read Easy 的「标记」更多地是降低了语言的门槛,想把一篇文章看完看懂,还是得付出一些努力,它不像多邻国那样轻松,但好在我认为它可以带给你收获的会比多邻国更多。 这几天,我在用 Read Easy 阅读Wait But Why的长文,作者的文章十分有趣,但真的很长,不过在Read Easy 帮助下,我居然把他写的超长的 人工智能专题 以及 费米悖论 看完了。阅读要花点精力,不过物超所值。 除了「标记」功能之外,其它的几种方式(原文/混合/双语) 已经存在于市面上的一些产品里了,在 Read Easy 里是作为核心功能的补充。这里就不多介绍了。大家可以自己探索。 ---------- 是不是还少了啥? Q :如果我读不进去呢? A :那你还可以把文本转成语音,边听边读。 Q :如果我有个地方不理解呢? A :那你可以直接选取不理解的文本,然后问 AI 任何问题。 Q :如果我有个单词不懂,你没有标记出来呢? A :哦,这是我自己很喜欢的一个功能,叫做「即划即译」,只需选取不懂的单词,无需任何额外的点击,翻译结果就会自动出来,而且还是结合语境的。比 Mac 自带的查词功能好用多了! — 好了,已经说太多了,之后再来分享这个产品的背景以及遇到的坑吧, 感兴趣的朋友直接去体验: 🔗 https://www.read-easy.io/ 如果有问题和建议,也可以加下面的微信群。

00
叶安杰Alger
11月前
Why do we fall?
​So that we can learn to pick ourselves up.

Vol.47 对谈稻草人旅行创始人:我们为什么旅行?

稻此一游

00