即刻App
年轻人的同好社区
下载
App内打开
雪山千古照
300
关注
7
被关注
0
夸夸
雪山千古照
3月前
腾讯的混元7B翻译模型感觉不比大模型效果来的差,至少翻译的是人话
0
0
0
雪山千古照
3月前
美团大善人啊,每天免费送十万token,模型表现不差啊
1
0
0
雪山千古照
8月前
一个很有趣的观点:晚清的洋务运动、新政、变法在我们看来是以失败告终,但如果环顾四周,晚清的改革已经可以称得上是成功的案例
这一方面是源于自诩为天朝大国的国民心态,另一方面还是在隔壁日本成功案例的映衬下,凸显出晚清的失败
但晚清就跟中游学生一样,比上不足比下有余,比不上日本,却能超越绝大部分相同经历的国家
0
0
0
雪山千古照
9月前
意外发现一个有趣的事实,外企待遇好也(可能)就是最近几年的事
原来在《劳动合同法》制定过程中,外企成为了一股重要的反对力量
根据澎湃新闻的报道(
www.thepaper.cn
):
「劳动合同法草案遭遇了来自一些外商的强烈阻力。据悉,代表欧美企业的美国商会和欧盟商会分别递交了对于草案的建议书,欧盟商会的意见和建议11条,而美国商会的建议书多达42页,几乎涉及劳动合同法草案所有章节。」
所以其实外企保护劳动者权益还是主要因为他们经济转型了吧,从低端制造业转型成服务业或者是高端制造业,才不在意那些用工成本
0
0
0
雪山千古照
10月前
Office 的潛在客户都被发掘得七七八八了,加上在线文档的冲击,对于一般用户而言,花钱买 Office 已经不在是一个必须的选项(WPS 和 LibreOffice 对于 Office 的兼容已经属于能用级别,对于政企用户,飞书等在线文档更加好用)
继续保持全付费反而阻碍新用户的试用,把用户推去使用 WPS(WPS 已经可以替代大部分的 Office 功能),因此放开免费的版本,对于微软来说,能吸引多一点免费用户是一点,吸引来了才可以培养用户的付费习惯
PriceTag应用推荐: 📰 WPS 化?Office 将加入可免费使用的广告模式 来自 Beebom 的消息:微软正在测试适用于 Windows 的新版 Microsoft Office,该版本在没有有效订阅与许可的情况下也能使用 Word、Excel、PowerPoint 这三款套件的基础笔记功能,但微软在应用中内置了广告,每隔几个小时就会自动静音播放 15 秒。 除此以外,免费版 Office 还将限制用户的存储位置,用户仅能将文档存储在 OneDrive 中而无法在本地直接保存。上述所有限制以及完整编辑功能均可在购买订阅或许可证后解除,同时 Office 也将不再继续播放广告。
0
0
0
雪山千古照
10月前
知危编辑社今天有关生育的主题值得一看
1
1
1
雪山千古照
11月前
说个题外话,LLM 的流行会不会促使更多平台支持 markdown 渲染,
因为现在大部分的社媒(不算内容平台,如公众号、知乎之类的)都不支持 markdown,用户转发 LLM 的回答体验很差,那些 「#」、「*」还不如直接复制纯文本(但是纯文本的阅读效率又很低)
我见过相对好的分享体验就是 Kimi 等生成图片分享,但客观来说如果大量用户转发,这些图片文件占用的带宽绝对比支持 markdown 的多,会不会成为经济诱因吸引更多平台支持 markdown 渲染
兔撕鸡大老爷: O3-mini 像素级复制了DeepSeek模型核心架构的92%,所以它经常给美国人展示中文思考,再给出英文答案。 据说内部邮件泄露,OpenAI工程师曾警告管理层“模型存在文化认知絮乱风险”,但高层为了狙击各种对手强行上线。 外国人怎么看呢… 大部分人认为openai窃取了deepseek的技术 还有人觉得中文比英文更短,字意复杂,所以是一种很好的推理语言。 这种说法是否正确呢…? 训练时谁更省字节? 答案是:短文本英文更省,长文本中文更省。 以下是deepseek的回复: 在比较中文推理与英文推理的字节节省时,需综合考虑字符数、信息密度及编码方式。以下是具体分析: ### 一、**字符数与信息密度** 1. **词汇层面** - **单个概念**:中文通常以更少的字符表达相同概念。例如,“人工智能” vs. “Artificial Intelligence”(4字 vs. 21字母+空格)。UTF-8编码下,中文占12字节,英文占21字节。 - **功能词简化**:中文省略冠词(the/a)、复数标记等。例如,“狗跑” vs. “The dog runs”(2字 vs. 10字母),中文占6字节,英文占10字节。 2. **句子结构** - **语法简化**:中文无时态变化(如“去”涵盖过去/现在),英文需附加词尾(如“went”)。例如,“我昨天去了公园”(7字,21字节) vs. “I went to the park yesterday”(22字母+空格,22字节)。 ### 二、**编码方式的影响** - **UTF-8**: - 中文常用字占3字节,英文占1字节。 - **例**:“若A则B”(3字 + 符号)占9字节,英文“If A then B”(10字母)占10字节。此时中文更省。 - **UTF-16**: - 中英文均占2字节/字符,中文因字符数少更省。例如,“因果关系”(4字,8字节) vs. “Causal relationship”(16字母+空格,16字节)。 ### 三、**复杂推理场景** - **逻辑连接词**:中文“若…则” vs. 英文“If…then”,字符数相近,但中文无需空格。 - **专业术语**:中文术语常更简洁。例如,“贝叶斯定理” vs. “Bayesian theorem”(5字 vs. 15字母),中文占15字节,英文占15字节(UTF-8)。 ### 四、**实际用例对比** - **示例段落**: - **中文**:“假设所有A是B,且某个C是A,则C是B。”(20字,UTF-8为60字节) - **英文**:“If all A are B, and some C is A, then C is B.”(37字符,UTF-8为37字节) - **结果**:英文更省字节,但信息密度较低。若段落加长,中文字符数优势可能抵消字节劣势。 ### 五、**结论** - **短文本**:英文可能更省字节(如简单逻辑语句)。 - **长文本**:中文因高信息密度和省略语法冗余,整体字符数更少,可能更省字节(尤其在UTF-16下)。 - **综合**:**中文推理在表达复杂逻辑时,通常能以更少字符传递相同信息,但实际字节节省需结合编码方式和文本长度判断**。在UTF-8下,短文本英文占优,长文本中文潜力更大;UTF-16下中文普遍更优。
0
0
0
雪山千古照
11月前
这篇文章真的值得圈外人看,很多平台就两极分化,一派是Deepseek是神,OpenAI被吊打,另外一方面,就是DS是蒸馏、剽窃OpenAI
DeepSeek 被误读的 5 个真相,AI 大佬亲自揭秘
0
0
0
雪山千古照
11月前
千问的文生视频模型太多人用了
0
0
0
雪山千古照
12月前
今年上半年还是听了不少播客,但是下半年为了提升英文水平,就转去 spotify 去听英文播客了,明年争取把播放列表的节目听完
2024小宇宙年终总结
0
0
0