即刻App年轻人的同好社区
下载
App内打开
悯生
69关注42被关注0夸夸
🧑‍💻AI算法资深从业者
🛠️探索AIGC深度应用
📚中医爱好者
悯生
6天前
刚接到滴滴数科的电话,开始是确认什么之前用过滴滴app,然后话锋一转,给我授信额度,就纳闷儿为什么这些企业都要发展信贷业务,名义“帮你渡难关”实质是什么心知肚明!
21
悯生
7天前
预祝答辩顺利
12
悯生
28天前
发呆
01
悯生
1月前
昨天晚上部署了一下,PaddleOCR-VL的服务,说下感受:
1. 解析效果没得说,计划后面把langparse项目添加单独一种解析方式,对于excel类型、pdf、图片解析友好,可以输出保持语义结构的json或者markdown,对于大模型推理友好

2. 部署操作,百度项目的易用性不好,因为他自己的一套体系和框架,比如推理框架只能用paddle来推理,而对于加速只能用他们分支的vllm,如果他们能够更加开放的拥抱开源,相信走的会更远

3.这个项目在H20上竟然占用了49G的显存,但他只是个0.9B的模型,那这种在生产环节上跑还是很吃算力的

#paddleocr-vl #文档解析
01
悯生
1月前
ima“任务模式”,用【ima知识库】大模型面试宝典 ima.qq.com
这个知识库做的面试方案

任务报告

01
悯生
1月前
近半年以来一直在做“企业知识库”的AI解决方案
,随着不断的深入,客户的需求也从最初的精准定位信息逐步转换到,如何让静态的知识动起来,发挥最大价值,那么就不仅仅是“信息检索”了,而应该是将历史知识和当下需求结合,动态进行推理生成。
ima发布2.0推出了“任务模式”,这是对知识库应用的进一步探索,刚试用了一下,完成度还挺高

最终报告如下:

ima.qq.com
03:03
01
悯生
2月前
昨天刚发布的Deepseek-OCR,今天经过自媒体的发酵,已经轰动与各个媒体,但在昨天之前baidu发布的Paddle-OCR也是值得关注,当然这两个是截然不同的事情
- DeepSeek-OCR,在做一场“信息压缩革命”。
它把文字当作可以“看”的东西,用图像来存储文本信息,再解码还原。
证明了:一张图能代表上千字,10× 压缩下几乎无损。
是探索“视觉取代语言”的前沿实验

- 在做一款“落地级文档解析引擎”。
NaViT + ERNIE 架构,支持 109 种语言,能识别文字、表格、公式、图表。
实测性能全球领先,比上一代快 15%,显存省 40%。
是真正能上生产线的多模态 OCR 系统。

针对deepseek,在探索视觉模态压缩文本信息是有效的、可量化的、可实用的,那这后面的关键是文本信息怎么转换成视觉模态(渲染成图片、光学表示或其他),需要持续关注。
PaddleOCR从评测看是目前比较好的兼具性能和效果的模型,能够极大RAG类应用效果。
01
悯生
2月前
Qwen3-VL在git上开放了cookbook,提供针对Qwen3-VL的场景使用说明,
覆盖从视觉定位到长文档与视频理解、再到“电脑/手机”图形界面代理操作的主流场景:
主要 Demo(按场景)
2D/3D Grounding: 在图像或三维场景中进行目标定位与引用表达理解,分别通过二维框和三维空间推断。
OCR 与文档解析: 多语言文本识别、表格/版面结构理解、长文档层级抽取与问答。ocr.ipynb 、document_parsing.ipynb 、long_document_understanding.ipynb .
视频理解: 帧间时序与事件定位、长视频检索与问答、动态场景理解。video_understanding.ipynb .
空间与几何推理: 物体位置、视角、遮挡关系等空间理解。spatial_understanding.ipynb .
图形化思维与多图推理: 将图像作为“思维材料”进行链式推理与证据组织。think_with_images.ipynb .
通识识别(Omni Recognition): 面向更广谱实体与品类的识别能力示例(人、动漫、商品、地标、生物等)。omni_recognition.ipynb .
计算机/手机代理(Agentic GUI Use): 识别界面元素、调用工具、自动完成任务,覆盖 PC 与移动端交互。computer_use.ipynb 、mobile_agent.ipynb .
多模态代码生成(MMCode): 由图像/视频生成可视化或前端代码(Draw.io/HTML/CSS/JS)。mmcode.ipynb .

Qwen3-VL/cookbooks at main · QwenLM/Qwen3-VL

00
悯生
2月前
OpenAI在devday上披露了消耗token的Top30家公司,我把这些公司规模和业务做了一下梳理。
勇敢的人先享受红利,构建自己的业务飞轮
02
悯生
2月前
sora2果然很丝滑

#Sora2
00:10
01