即刻App年轻人的同好社区
下载
App内打开
王建硕
1k关注12k被关注33夸夸
对世界保持刚出壳的小鸡般好奇的ENFP
公众号:王建硕
twitter:jianshuo
网站:wangjianshuo.com
王建硕
14天前
00
王建硕
15天前
又是广州机场,又是那个转机口
10
王建硕
16天前
这是刘韧老师总结的:任何文字,当你知道写给谁,尤其是一个具体的人,就不会虚伪,就会活起来。

他举了一个例子。任何的小学生,只要让他们写作文的时候,在文章的最开始写上「妈妈:」两个字,然后再写文章,最后再把「妈妈」两个字删掉,文章就立刻增色不少。因为,当和自己的妈妈说话的时候,任何故弄玄虚的词句都说不出口,不真实的东西,创腔作势的东西,会自然减少。

当假设朋友就在面前,写出来的字自然就会有变化。对着自己知根知底的朋友,你好意思用那些大词儿吗?你好意思「装」吗?

人很有趣,脑子里有「文字应该是什么样子」的错觉。这个东西就如 ChatGPT 去模仿的那个样子,干巴巴的,中规中矩的文字。毕竟我们看到的书面的东西都是那样的。

我们把文字世界的平庸,当作我们临摹的对象。

反而,当我们和具体的人说话的时候,不费力气的,我们就能让文字活起来。书面文字本来就是复杂的,难懂的;口头的文字本身就是灵动的,简单的。就如同和一个朋友说话一样写东西,这就跟魔法一样,一转念就能改变我们的写作风格,写起来反而更轻松。

这也解释了困惑我很久的一个现象。我从来写东西,都只会在 WordPress 或者微信公众号的编辑界面里面写。如果用 Word,或者 Notion,我就写不出来。按道理,只是一个编辑器的不同而已,为什么有这么大的差别。

这个谜在我脑子里面盘旋十几年了。直到刘韧老师的点拨,我才恍然大悟。

哦!原来当我打开了微信公众号后台的编辑器的那一刻,我告诉自己的潜意识,我的文字要写给谁。当潜意识有了这个信息,我才能源源不断的写出来东西。而对着 Word,我就完全没有了这种场景感,就忽然卡在那里了。
818
王建硕
20天前
为啥大语言模型都跟羊驼干上了?

LLM 发音太困难,两个LL 又跟绕口令一样挑战舌头,结果大家就想往上面加点原音,好发音。

有人加了a,就是LLaMA。而llama 在西班牙语里面就是羊驼🦙,发音在西班牙发成 Yama,在南美发成 Jama。

Stanford 在Llama 基础上微调出来的模型就跟着叫 Alpaca,这个西班牙语里面也是羊驼🦙。

不过Alpaca 就是左图里面的那只,我们所熟知的萌萌的小可爱,摸起来跟猫一样,性格似乎也和猫一样。让人有带一只回家养的冲动。

Llama 是完全一眼就能分出来的另外一个品种,右图那样的,基本上像驴子,个头高大,让人敬而远之。

我猜测如果名字再不够用,以后的大模型还有 vicuna guanaco 可以用,这些也是羊驼的种类。
95
王建硕
23天前
让人着迷的门牌号系统:如何从地址解码出位置

我对所有的编码系统都很着迷,比如高速公路、国家电话区号,中国电话区号等等。门牌号是另外一个非常有趣的领域。为了让大家更容易的从门牌号中一眼可以看出来大体的位置,各国的工程师可以说是费尽了努力。我这里把我知道的一些列举一下。

美国很多城市的门牌编号都非常整齐,大多以网格方法编号。比如这一个:

17024 NE 120th St, Redmond, WA 98052, USA

一看就知道是 Redmond 东北区 120 街上,17024 直接可以翻译为 170.24,表示 170 街和 171 街之间的一个地址,大约在两条街总距离的 24% 的位置(170.24 @ 144)。整个西雅图往西几十公里,都是按照顺序的编号。

同样的例子,这种方法在纽约也是一样的。

20 W 34th St., New York, NY 10001, USA

这个帝国大厦的地址,现翻译成 0.20,是 34 街上,第五大道和第六大道之间的,靠近第五大道 20/100 的位置。纽约以第五大道为中心,向西每 100 个号码一个大道,并且标为 W,向东也是一样,标为 E。

再比如:

230 E 44th St, New York, NY 10017, USA

就是 44 街上,第三大道 第二大道 之间,稍微靠近第二大道的位置 (2.30 @ 44)。

再看一个地址:

Cra. 5 #8-36, Bogotá, Colombia

就是第五道(Carrera)的 第八街(Calle)和 第九街 之间的地址 (8.36 @ 5)。哥伦比亚的波哥大是我见过的仅次于纽约的清晰的道路体系。

新加坡倒是另辟蹊径

350 Orchard Rd, Singapore 238868, UAE

除了原来的标准的门牌号加路名以外,新加坡还有一个六位的邮政编码,比如 238868。中国这么大的国家,邮政编码却空荡荡的,比如徐家汇的 200030,新加坡的六位显得很拥挤。新加坡的每一幢建筑物,每一个小区都有自己的邮政编码。出租车司机用这个号码直接就可以知道你要去哪里。同样的,曼哈顿也有类似的设计,比如帝国大厦就有单独的邮政编码。

2502486073, Dubai

迪拜似乎也想用新加坡的办法,给每个建筑物上面也帖了地址,叫做Makani 代码,用这 10 位数字就可以唯一的标识一个地方。大家把这十个数字在 Google 地图里面一输入,就知道这是哪里了。

但是使用起来实在太不方便。人脑的记忆上限就是 7 位数字。这个方案中的地址,就是相对于阿联酋一个中心点的南北和东西的距离(单位是米),比如上面那个地方,就是中心点以北25公里,以东86公里左右的一个地方。而那个神秘的点,是借用了军事网格系统(MGRS), 2502486073 的全称是:40RCN2502486073。40RCN 就是 (24° 24' 02.09" N 55° 01' 39.90" E) 这个点(至于为什么是这个点说来可就话长了。。。)

3 Chome-6-1 Ginza, Chuo City, Tokyo 104-8130, Japan

日本大多数的街道是没有名字的,不是用网格方式寻址,而是用某个地区里面的某丁目,下面的某个片区下面的某幢楼来给定地址的。比如上面的就是银座3丁目 6-1。中国也有用几街坊某某院几号楼的方式标明地址。

东四十条,北京

北京有一个地方叫东四十条,大家容易念成 东「四十」条,其实,人家是「东四」「十条」,从北到南有「头条」「二条」一直到「十四条」14 个胡同,「东四十条」其中的一个胡同而已。

如果看京都的地图,也沿用了这样的安排,从北到南的大路,从「一条」一直命名到「九条」。这种用名字 + 某条的方式,比郑州的「经一路」「纬三路」的命名似乎雅致很多。

还有什么有趣的地址寻址方案呢?
23
王建硕
25天前
早上起来监工了
20
王建硕
27天前
不知道有没有人和我一样,对于各种编号系统都很着迷。这次和朋友们一起来天台山宿营两天,从上海过来,开车很简单的先从 G60 沪昆高速转 G1522 常台高速,就到了。而 G1522 这四个数字里面包含着很多的有趣的含义。就跟一门新的语言一样,有人认真的编码进去了一些信息,而愿意耐心的解码这个信息的人却不多。首先,G1522 说明这是国家高速公路网主干道 G15 的一条支线。而 G15 沈海高速,连通沈阳到海口,是中国最东边的一条南北的高速,平行往西,G25 长深,G35 济广,G45 大广,G55 二广,G65 包茂,G75 兰海,G85 银昆等等以奇数 5 结尾的,都是南北主干线。而横向的,G10 绥满,G20 青银,G30 连霍,G40 沪陕,G50 沪渝,G60 沪昆,G70 福银,G80 广昆都是东西主干线。这些和 7 条一位数的从北京出发的放射线,G1 京哈,G2 京沪,G3 京台, G4 京港澳,G5 京昆, G6 京藏,G7 京新组成了全国的骨干高速公路网络。而和主干线相连的支线,根据拓扑结构不同,用四位数字表示。第三位最有趣,0,1,2,按照形状,代表着不同的支线类型。0 表示一个圈,说明这条高速是在 G15 这样的主线上的绕城环线,比如上海绕城的郊环线,就是 G1503。沿着 G15,从沈阳开始,到海口结束,每到一个城市画一个大圈儿,就编一个号:G1501 沈阳G1502 青岛G1503 上海‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍G1504 宁波‍G1505 福州G1506 厦门G1507 深圳‍G1508 广州通过这个顺序的编号,倒是把 G15 这条纵线上面的大城市容易的排了前后。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍1 表示一个枝杈,就是分支线,它们从主干线叉出去,不再回来。比如 G1512 这样的‍‍‍‍‍‍2 是一个偶数,表示并行线,就是从主干线分叉出去,和主干线平行的走一段,然后再汇集回主干线的支线。比如我们这次走的 G1522 常台高速,就是在常熟离开 G15 分叉,和 G15 并行走到台州又重新并入 G15。 同样的 G1521 常嘉高速,还有 G1523 的甬莞,都可以作为 G15 的替代线。(甬莞高速这种长达 1400 公里,从宁波到东莞的这么长的高速,也只当做了 G15 的支线,似乎地位有点低)对比之下,美国是用第一位数的奇偶来标记中国 1 2 的含义的。比如湾区的 I-280,I-880 就是 I-80 的平行线,而 I-380,I-580 就是 I-80 的枝杈线。‍‍‍‍‍‍‍‍‍‍‍‍我之所以走 G1522 感觉特别舒服,还有一个原因。以前 G1521,G1522, G1523 三条高速分别被编号为 G15W2, G15W,G15W3。我一直觉得很丑,很不协调。现在统一用数字而不再用不可扩展的 W,W2,W3 这样的编码,我认为好了很多。
5595
王建硕
29天前
我是一名小画师
41
王建硕
29天前
居然还有荣幸可以在交大新上院100号做分享。那可是交大对我来说最神秘的一个阶梯教室呀。
10