即刻App年轻人的同好社区
下载
App内打开
ViviGoodenough
263关注604被关注1夸夸
玫瑰少年在我心底
终身学习者|infp|95后
心理学|投资|个人管理
Live|Love|Learn|Earn
👸/🍠/❔/🧣同名
ViviGoodenough
10天前

杨昌: 不知道为什么,很多DeepSeek-R1相关的教程,都没太提到幻觉问题。 但其实 r1 的幻觉相当严重,“DeepSeek-R1的幻觉率不仅是 DeepSeek-V3的近4倍,也远超行业平均水平” 所以,最近半个多月使用R1的过程中,个人有两件事是必做的: 1、能联网尽量联网 早期我是在官网上联网,后来是在 perplexity 上用“Reasoning with R1”模式。 当然,联网后也不能全信。 为了进一步验证,我经常不得不把结果丢进genspark 的“事实核查”智能体里。 据说OpenAI的Deep Research错误率有显著降低,最近 ChatGPT 付费版也可以用Deep Research 了,我打算恢复一下订阅。 2、提示词的最后一句,尽可能放上“说人话” 这个可能跟幻觉关系没那么大,但我确实不喜欢R1 生造的那些“黑话”。 我也试过“用大白话”之类的表述,但效果都没有“说人话”好使。因为他们又导向了更低幼的比喻,反倒丢失原文的细节和专业性。 还有个旁证,腾讯的知识库产品IMA (ima.copilot),最近也接入DeepSeek-R1 了。在他们官方公众号文章的示例里,提示词最后就是“说人话”。 ——— 对了,在不能联网的情况下,如果要处理比较长的文本,我一般都是用Gemini-2.0。 从体感上来看,Gemini-2.0 的准确度是最高的。 今天搜了一下,在Vectara的幻觉测试排行榜上,Gemini-2.0-Flash-001和Google Gemini-2.0-Pro-Exp 的准确率,确实高于其他AI。

00
ViviGoodenough
24天前
在硅基文明指数级进化的时代,保持碳基生命的蓬勃与诗意~

向前看——拥抱工具、保持好奇、主动进化;
向后看——回归身体、珍视情感、守护脆弱性。
00
ViviGoodenough
28天前
DeepSeek,真有意思!
00
ViviGoodenough
2月前
Pity,甲尾比乙头概率高,好运并非常在~

希望今年能靠 sell put 多赚点💰。
00
ViviGoodenough
2月前
新年快乐🥳,趁着年初简单回顾一下 2024 的要事~

2024,最关键的事件是生了小baby。

因为孩子的到来,生活开始被各种琐碎具体的事务填满,也多了长辈等其他家庭成员同住带娃,留给自己的时间少了许多。但熬过最初几个月的艰辛与磨合后,一切慢慢走向正轨,感受着孩子的可爱与治愈,见证着她一天天健康成长,是一种弥足珍贵的平静的幸福。现在越发觉得能和家人平安健康顺遂度过一生就是很幸运的事,其余的都是锦上添花🌸,人生小满胜万全~

第二件有重要影响的事是,工作上突然有个机会,可以去一个新的环境新的岗位锻炼两年,工作内容相对而言我会更感兴趣,但工作强度会增加,可能经常加班熬夜,我还是选择去试试。明天就要到岗报到啦,希望我一切顺利💪。

第三件事是投资上这几个月终于开始学习以及上手实践期权,感觉打开了新世界的大门,发现期权这种多维度的工具很有意思,又多了一样工具(亏钱手艺)~

新的一年,愿平安健康,万事胜意🎇。
40
ViviGoodenough
3月前
“「存在的应接不暇”也是一样:你需要有意愿去抵抗那种追求越来越多体验的冲动,因为那样只会让你感觉还有更多的体验需要追求。

一旦你真正明白自己必定会错过世上几乎每一个体验,你就不会觉得仍有许多东西无法体验的事实是个问题了。相反,你会全身心投入,享受那些确实有时间享受的点滴并且你会在每一个片刻更自由地选择做最重要的事。」
00
ViviGoodenough
4月前
喜欢 ins 上这个博主
看他们的视频经常会提醒我
日常就是奇迹、自然之美与当下的力量

Have a good now ☀️
00
ViviGoodenough
4月前
每天下班回家见到宝宝
每晚睡在宝宝旁边
都感觉好幸福
是一种平淡的温暖的满溢的幸福
陪伴见证一个生命成长 真好呀❤️
00