即刻App年轻人的同好社区
下载
App内打开
Yishan
602关注677被关注2夸夸
✨ 有点产品经验·UE & HCI 研究
💡 关注 AI 应用与技术可用性实践
📖 持续阅读,持续思考 🙆🏻‍♂️
🎙️ yishan.li
置顶
Yishan
9天前
OpenAI 12 Days
- Day 4: Canvas, unlock ChatGPT abilities beyond chat.
- Day 3: Sora, but "account creation is temporarily unavailable."
- Day 2: Reinforcement Fine-Tuning, may easily introduce more *experts in budget.
- Day 1: o1 model for a Plus user, and $200/mo ChatGPT Pro w/ o1 pro mode
13
Yishan
1天前
早前付费用过两个月 Relingo,但现在换成了年付 Trancy。同样是记单词的场景,我觉得前者给我的认知负担要更多一些,或许是产品设计、使用引导和默认值方面的问题。
22
Yishan
1天前
刚注意到到 Chrome 控制台可以调用 AI 能力了:
- 控制台数据分析,更好地了解控制台错误和警告。
- AI 辅助,通过上下文说明和建议改进开发工作流程。

和其他 Chrome AI 能力一样,有区域限制
00
Yishan
2天前
🤔
00
Yishan
2天前
Playground 看到了 AI 产品里少见的 Day Pass,从 $8 的定价看这个档位更像是给用户创建了一个不如选择 $15 月包的心理倾斜暗示。
00
Yishan
2天前
原贴无了,但 RSS 还留着关于它的记忆
00
Yishan
2天前
很喜欢 Luma AI 的抽卡效率和转场处理。

“A panda's interaction with a broken mirror unfolds in a noir-inspired setting, utilizing stark contrasts and moody atmospheres to evoke mystery.”
00:04
00
Yishan
3天前
你的下一部手机应该是 Pixel 10 Pro
20
Yishan
3天前
还没有看明白,但已经准备好了开 Gemini Advanced 的钱 💰

Szhans: ⛰️ Gemini 2.0 重磅袭来, Google 抢跑AI Agents 时代的第一站 2024年12月,在AI历史上注定是难忘的:无论 Open AI带来的风暴多么剧烈, Google 逆风前行,重磅推出Gemini 2.0,揭开了AI Agents时代的新篇章。[1] Google CEO Pichai 兴奋宣布Gemini 2.0的到来, 相比今年4月推出的1.5 Pro版本, 2.0 实现了飞跃式的进步。 [2] ✨ 主要更新速览: 1. Gemini 2.0 Flash: 超强的多模态能力,极速性能、免费访问 2. Deep Research:强大的研究型Agent(Gemini Advanced 计划提供,现已开放) 3. Project Mariner:新一代的浏览器智能代理技术 4. 搜索升级:集成 Gemini 2.0高级推理能力 🔗即刻访问 https://gemini.google.com/ 🤺 Gemini 2.0 Flash的突破 在关键基准测试中, 2.0 Flash 超过了 1.5 Pro, 速度更是后者的两倍;除综合基准、代码能力、数学以及高级推理之外, 值得注意其音视频理解能力的大幅提升。 (详见评论区的图示) 2.0 Flash 还支持多模态输出,包括多语言原生音频输出,并能在本地调用Google 搜索、代码执行等。 短短几个小时内, X上众多开发者已经发现其在多模态上卓越表现:实时视频理解和音频输出,令人惊叹。[3] 🔍 Deep Research :你的超级研究助手 想象你是一名AI 教育者或者创业者,正准备一个AI 技术的演讲,需要深入对比Gemini、ChatGPT和Claude 的差异,以及Sora和其他AI 视频模型的特点。 这些细分领域,至少要数个小时研究时间,还要进行交叉对比。 此时便是发挥 Deep Research 大显身手的时刻:输入问题后,它会创建多步骤研究计划,供修改或批准。一旦批准,它就会自主深入分析网络信息。 Gemini 就会像你一样浏览网页浏览、挖掘信息,并根据所学知识展开新的搜索。 持续重复这一过程,几分钟后,,会自动生成一份综合报告,并导出到Google Doc中。 [4] Hans 亲测之后, 感受到不小的震撼: 虽然AI Agents 框架和工具已经开始普遍化了, 但是如此触手可及的访问方式还是首次体验。 (效果图见评论区) 这是一个非同寻常的新特性,我将会持续深度评测和分享。 🤖 Project Mariner:重新定义浏览器体验 在Google I/O 大会演示以及随附的Gemini 2.0视频中,我们看到了Astra项目的强大,它作为手机上的超级智能助手令人刮目相看。 而 Project Marinaer 将以浏览器为高地,将我们带入 AI Agent的新天地。 Project Mariner 使用 Gemini 2.0 构建的早期原型, 以浏览器为起点,探索人机交互的未来;它能够理解和推理浏览器屏幕上的信息,包括像素以及文本、代码、图像和表单等,然后通过一个实验性的 Chrome 浏览器插件使用这些信息来为你完成任务。 根据Google 官方的WebVoyager 基准测试,Mariner 作为代理在端到端真实世界的性能评估取得了83.5%的好成绩,展现了单个代理的卓越能力。 [5] ⛰️ 后记: 在诸多的重磅发布之外,Hans意识到这是Google开始抢跑的第一步。 如果说过去一个多月前的Claude Compute Use还是犹抱琵琶半遮面,那么近期微软Agent定制平台到Devin、Replit、Crew AI等新工具的涌现,AI Agent技术的面纱已然揭开。 正如比尔·盖茨早先预言的那样, 「我们才刚刚开始认识AI的潜力。无论它今天有什么限制,都会在不知不觉中悄然消失。」 [6] Gemini 2.0 的发布,标志着Agentic Era序幕正式拉开。 📶 注释和参考: [1] 当AI 开始使用人类的工具,这意味着什么 https://m.okjike.com/originalPosts/67184290a59d13d6d1ad27d8 [2] Gemini 1.5 Pro 正式推出 https://m.okjike.com/originalPosts/6617271712ed2fda68effbb7 [3] 用Gemin 2.0 建构原生音频输出 https://www.youtube.com/watch?v=qE673AY-WEI [4] Deep Research 能干什么 https://blog.google/products/gemini/google-gemini-deep-research/ [5] Project Mariner的WebVoyager测试 https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#project-mariner [6] 比尔·盖茨:人工智能时代已经开始 https://m.okjike.com/originalPosts/641bd28db2d0030428e2a36a

00
Yishan
4天前
Sora 用上了 🥳

"高对比度的黑白拍摄,低调的灯光和阴影贯穿整个场景。视角转移到玻璃碎片中的熊猫镜子,强烈的背光穿透裂缝,在整个场景中投射出复杂的阴影和百叶窗效果。"

多次抽卡加 Blend,玩了一会儿只剩 375 credits 🤣
00:04
30