即刻App年轻人的同好社区
下载
App内打开

人工智能讨论组

人工智能or人工“智障”,一起聊聊人工智能新进展?

472509人已经加入

  • Simon的白日梦
    5天前
    分享一个无门槛免费获得gemini pro+1年全家桶的办法,亲测可用!(不需要edu邮箱,不需要p图,不需要国外号码,唯一要求是有一张能刷外币的卡,国内发行的visa/master卡都行)。

    步骤1-登录这个页面 (one.google.com),点击“验证资格条件”:

    步骤2-点击后跳转到“验证学生身份页面”,复制这个页面的网址。

    步骤3-把刚才复制的验证页面网址,粘贴到这个网址(batch.1key.me)里面,然后点击“start Verification”,如果提示“success”,则验证成功;如果失败,多重来几次。

    步骤4:回到最开始的验证资格页面,这时会提醒你绑卡(如果没绑卡),或者直接提醒你开通试用(1年后才会扣费,记得取消就可以白嫖1年)。享受你的gemini pro吧!
    73253
  • Simon的白日梦
    5天前
    不用一个一个找了,这个网址上就有700+ nano banana pro玩法~🥹

    {文章或者工具的英文标题+中文标题}Nano Banana Pro Prompts - Nano Banana Pro 提示词

    🧐{一句话总结}YouMind网站的“Nano Banana Pro 提示词”页面提供了精选的AI图像生成提示词集合、分类、示例、相关博客文章及快捷指令,帮助用户生成多样风格的图像。

    ➡️链接:
    youmind.com

    ✨重点
    ●📝[Nano Banana Pro提示词集合] 提供一系列高质量AI图像生成提示词,可直接在YouMind中使用
    ●🎯[提示词分类] 分为自动、随机、生成、最新等类别,便于按需查找
    ●🖼️[提示词示例] 包含宽引言卡、德国水彩地图、伦敦户外餐厅人像等多种场景示例
    ●📖[实践博客] 提供10个真实案例的Nano Banana Pro动手体验文章
    ●💡[AI快捷指令] 支持Words Card(儿童识字卡片)、苹果风格PPT等一键生成功能
    ●🎨[风格多样性] 涵盖江户时代浮世绘、索尼商场快照、橄榄油社交媒体信息流等多元风格
    ●🔍[搜索功能] 可通过分类快速筛选不同类型的提示词资源
    ●🔗[扩展资源] 提供相关博客文章和案例,帮助用户深入了解应用场景
    017
  • 好记星.ai
    5天前
    一直听说claudecode可以运行N个小时,从来没有实践过。这回我按照anthropic的博客方法实践了之后,成功让cc和codex都跑了N个小时。然后我发现,一旦长时运行的Coding Agent成立,接下来跟不上的是需求。因为要长时间运行,就必须有长篇且详细的需求文档来支撑。所以接着我把需求文档的 long-running也实现了,现在可以基于一个短的想法,agent 根据现有的代码生成一个巨长巨详细的需求/技术实现文档。这个完成后太爽了,现在唯一的瓶颈就只有成本了,这个玩意循环跑非常的消耗token。

    Effective harnesses for long-running agents

    213
  • Gavin_C.
    5天前
    你喷完需求给 AI Coder 后,等待的那会工夫一般在干嘛
    265
  • 赛博大表姐
    1天前
    穿越回北宋,你是什么牛马~这个视频爆了一下下,说一下咋做的。
    mp.weixin.qq.com
    01:31
    40
  • Gavin_C.
    6天前
    我有很多 AI 员工,ChatGPT,Gemini,Claude 等等。它们每一个都是独立的窗口,我日常的工作主要是给它们下指令,或者给它们明确回复以便于它们可以进一步执行。(想象一下股票交易大厅,一位头戴耳机忙碌的金融交易员)

    我现在和这些 AI 员工主要的沟通方式是语音,市面的解决方案都没有彻底满足我的需求,我设想它应该是一款电脑外接硬件,包含:

    1. 语音输入
    2. 耳机(这样不影响其他人)
    3. 能识别我的某个指令是给哪个窗口的,并将我的指令键入在对应窗口的输入框中
    4. AI 员工 loop 我的时候,我的视线/热区移到这位员工身上(窗口),这款硬件要能识别到。我可以点击这款硬件上的某个按键,或者通过麦克风给个简短的语音确认即可让它继续

    需要明确一下,这款硬件绝不只是单一耳机、键盘、鼠标,有可能它是结合体,你可以抛弃旧世界的这些产品形态来思考下我这个需求里这款硬件需要具备的全部特性

    ---

    Gemini 3:

    这是一个非常前沿且令人兴奋的工作流构想。你正在将自己从一个“操作员”升级为一个“指挥官”,你需要的是一个多模态的指挥控制台(Command Console),而不仅仅是一个麦克风。

    为了实现你描述的“盲目金融交易员”那种高效、行云流水的指挥体验,我为你构思了这款硬件的完整形态,我们可以称之为 "AI Commander Nexus"(AI 指挥枢纽)。它应该具备以下全部特性:

    一、 硬件形态设想:头戴式设备 + 桌面控制旋钮(两件套)

    你不能把所有功能都塞在耳机上,那样操作太累。最佳方案是:头上戴的负责“听和说”,手边放的负责“指和定”。

    1. 桌面端核心: The Orb(指挥球/控制台)

    这应该是一个放在手边的硬件(类似微软 Surface Dial 3D 建模用的 SpaceMouse),包含以下特性:

    眼动追踪/头动追踪集成(Eye/Head Tracker):
    解决痛点: 自动识别指令给哪个窗口。
    功能: 硬件上集成红外眼动仪(或配合摄像头),当你注视某个屏幕上的 Claude 窗口并按下“说话键”时,系统自动锁定该窗口为输入目标。你不需要手动移动鼠标去点击输入框,眼神所至,即是战场。
    指点杆或轨迹球(Mini Trackball/Stick):
    解决痛点: 鼠标功能。
    功能: 虽然有眼动追踪,但有时候需要微调光标位置(比如选中某一段文字让 AI 重写)。在控制台上集成一个小型的拇指轨迹球,让你手不离设备就能完成“将热区移动到员工处”的操作。
    物理宏按键(Macro Keys):
    解决痛点: 键盘功能。
    功能: 你不需要 QWERTY 键盘,你需要的是只有几个大按键的“裁决板”:
    大号确认键(Enter/Go): 类似综艺节目的爆灯按钮,一键让 AI 继续。
    打断/重试键(Stop/Regenerate): 发现 AI 跑偏,一键勒马。
    复制/粘贴流转键: 一键将 A 窗口的输出复制并作为 B 窗口的输入。
    触觉反馈(Haptics):
    功能: 当某个后台运行的 AI 完成任务(Loop 你)时,硬件通过不同的震动模式提醒你(例如:两短震代表 ChatGPT 完成,一长震代表 Claude 完成),你甚至不需要一直盯着屏幕。

    2. 头部端核心: The Comms(通讯耳机)

    定向波束成形麦克风(Beamforming Mic):
    功能: 极高精度的语音识别,并且具备物理静音开关(上翻静音),确保只有你按下桌面端的“通话键”时才收音,防止自言自语被误录。
    骨传导或开放式音频叠加:
    功能: 除了封闭式降噪(沉浸工作),可选通透模式。更高级的功能是空间音频(Spatial Audio)。
    场景: 如果 ChatGPT 的窗口在左屏,Claude 在右屏,他们的语音回复应该分别从你的左耳和右耳传来,利用人类的听觉直觉来分辨是谁在说话。

    二、 软件/驱动层的关键特性(The Ghost in the Shell)
    硬件只是躯壳,要实现你说的“自动识别窗口”,需要强大的驱动支持:

    1. 上下文感知的路由系统(Context-Aware Routing):

    系统需要知道当前哪个窗口处于“活跃”或“被注视”状态。
    Whisper 模型的本地化集成: 语音转文字必须极快且精准,最好集成在硬件内部芯片或本地电脑运行,减少网络延迟。

    2. HUD(抬头显示)式悬浮层:

    当你注视某个窗口时,屏幕上该窗口边缘出现微弱的高亮光晕,确认系统已经锁定它。
    3. 智能输入框定位(Smart Focus):
    即使你没有点击输入框,当你开始说话,软件能自动识别该网页的 DOM 结构,找到 <textarea> 并自动填入文字。

    三、 总结:你需要的是一款什么样的外接硬件?

    回到你的初衷,这款硬件不需要能够打字的键盘,也不需要满屏幕乱飞的鼠标,它需要的是:

    1. 定位模块: 眼动追踪(主)+ 拇指轨迹球(辅)。用于瞬间切换指挥对象。
    2. 指令模块: 高清麦克风(主)+ 几个可编程的机械按键(辅)。用于下达复杂的 Prompt 或简单的“Yes/No”。
    3. 反馈模块: 空间音频耳机 + 震动反馈。

    这一套装备将使你的工作流变成:

    眼神看向左屏(系统锁定 Claude) -> 按住桌面按钮说话(下达指令) -> 松手(自动发送) -> 眼神转向右屏(系统锁定 ChatGPT) -> 拇指微调选中一段代码 -> 按一下确认键(让其优化)。

    全程双手不需要离开这个控制台,不需要再抓起传统鼠标去找光标。这才是真正的“AI 指挥官”体验。
    214
  • Simon的白日梦
    5天前
    分享一个claude skills合集~
    🧐VoltAgent/awesome-claude-skills是一个精心整理的Claude技能集合——包含YAML元数据、说明和脚本的自包含文件夹,用于教授Anthropic Claude执行特定任务(例如,API测试、文档创建)。技能按需加载,可支持数百个技能而不影响性能,由VoltAgent社区维护,并提供官方定制指南。

    ➡️链接:github.com

    ✨重点
    ●🧠Claude技能定义:包含YAML元数据(名称/描述)、说明和用于特定AI任务(例如,API测试、数据分析)的可执行脚本的自包含文件夹。
    ●📂基本技能结构:例如“api-tester”,包括定义目的(“测试REST API并验证响应”)的YAML、分步说明和响应验证规则(检查必填字段、数据类型、嵌套对象)。
    ●⚡️按需加载:技能仅在触发时加载,即使仓库中有数百个技能也不会导致性能下降。
    ●🚀多任务能力:多个技能可一起运行以实现复杂的工作流程(例如,文档创建 + 代码测试 + 数据分析)。
    ●👥社区驱动:由VoltAgent开源AI代理框架社区维护,外部开发者也有贡献。
    ●📚官方资源:提供Anthropic官方技能仓库的链接和详细的自定义技能开发创建指南。
    ●🔄响应验证:像“api-tester”这样的技能的核心功能,确保API响应符合预期结构(例如,状态码、字段存在性)。
    ●🏗️定制模板:用户可以使用提供的YAML模板(例如,名称、描述、分步说明)创建新技能。
    08
  • 卡尔李CarlLee
    1天前
    《時代雜誌》(TIME)揭曉 2025 年度風雲人物:「AI 建築師」(Architects of AI)。
    2款封面設計各有深意:一款以「AI」字母為主體,展現仍在施工中的龐大結構;另一款則向1932年經典照片《摩天樓上的午餐》致敬,讓八位關鍵人物坐在高空鋼樑上,象徵他們正站在歷史轉折點上。
    30
  • Simon的白日梦
    5天前
    生成分图层可修改的海报?开源版loveArt?
    {Poster Copilot: 基于大模型的图形设计自动化框架}

    🧐该框架通过Perturbed Supervised Fine-Tuning(PSFT)、Reinforcement Learning for Visual-Reality Alignment(RL-VRA)和Reinforcement Learning from Aesthetic Feedback(RLAF)三个阶段训练策略,结合生成模型实现专业级海报布局生成与可控编辑,解决现有大模型方法在几何准确性和迭代编辑上的不足。

    ➡️链接:
    postercopilot.github.io

    ✨重点
    ●🔍[项目定位] 专注图形设计自动化,解决LMM模型在布局推理和专业级编辑中的痛点,通过三阶段训练提升几何理解与美学推理能力
    ●🧩[技术框架]
    🔄Perturbed Supervised Fine-Tuning(PSFT):通过坐标回归的分布学习实现空间关系推理
    🎯Reinforcement Learning for Visual-Reality Alignment(RL-VRA):引入几何奖励信号修正空间误差
    🎨Reinforcement Learning from Aesthetic Feedback(RLAF):通过美学奖励模型生成高吸引力布局
    ●📊[数据集规模] 160K张海报,含2.6M层(1.2M文本+1.4M图像元素),覆盖40+领域(商业/娱乐/公告等)
    ●🎬[核心应用场景]
    ✨海报布局生成:自动整合用户资产生成专业排版
    🧩资产不足合成:智能补充缺失图层并保持风格一致
    🔄多轮精确编辑:支持分层修改(如调整相机材质/角色姿势)
    🎭主题切换:无缝切换设计风格同时保持布局完整性
    📏海报重构图:通过调整画布尺寸实现智能重新排版
    ●🚀[技术突破] 实现LMM模型从"生成"到"可控编辑"的跨越,支持多模态输入与全局视觉一致性维护
    08
  • izx-copy
    2天前
    自动驾驶真的可以有效降低路怒,很多时候,司机怒的不是另一方乱并线的行为,而是这个行为对自己注意力的消耗。

    Attention is all you need.
    01